HiDream-O1-Dev 대 ZImage Base (스타일 비교)
요약
본 게시물은 HiDream-O1 Dev 모델과 Z-Image Base 모델을 다양한 스타일의 이미지 생성 프롬프트로 비교 분석한 결과입니다. 전반적으로 HiDream-O1이 인상적인 성능을 보여주었으나, 특정 스타일에서는 Z-Image가 여전히 우위를 점하는 등 모델별 강점이 명확하게 나타났습니다. 또한 일부 이미지에서 관찰된 아티팩트는 모델 자체의 문제일 수 있으며 향후 버전에서 개선될 것으로 예상됩니다.
핵심 포인트
- HiDream-O1과 Z-Image Base는 다양한 스타일(SF, 애니메이션, 아르누보, 코믹북 등)에서 성능을 비교할 때 각기 다른 강점을 보인다.
- 특정 스타일에서는 Z-Image가 여전히 최고의 결과물을 보여주었으며, HiDream-O1 역시 인상적인 결과를 제공했다.
- 일부 이미지에 나타난 이상한 아티팩트는 모델 자체의 문제로 추정되며, 개발사 측에서 향후 수정될 가능성이 있다.
- 비교는 15가지 이상의 다양한 스타일과 복잡한 프롬프트를 사용하여 진행되었으며, 각 모델별로 가장 보기 좋은 결과물을 선택하여 비교했다.
이 게시물에 대한 후속 내용입니다: Ernie Image vs ZImage Base
HiDream-O1이 벤치마크에서 이렇게 높은 순위에 있다는 것이 확실하지 않지만, 여전히 인상적인 모델입니다. 많은 스타일에서는 Z-Image Base보다 더 나아 보인다고 생각하지만, 다른 스타일에서는 Z-Image가 여전히 최고입니다.
또한 일부 이미지에는 이상한 아티팩트(artifacts)가 나타나는데, Kijai에 따르면 이것은 모델 자체의 문제(적어도 dev 버전에서)라고 합니다. 아마도 향후 버전에 수정될 수 있을 것입니다.
정보:
저는 3개씩 배치로 작업하고 각 모델별로 가장 보기 좋다고 느낀 것을 선택했습니다.
1152x768; HiDream O1 Dev BF16, 28 steps, cfg 5.0; Z-Image Base, 25 steps, cfg 4.0, simple, res_multistep
프롬프트 (왼쪽부터 오른쪽 순서):
-
일몰의 미래 도시 풍경을 배경으로 한 초현대적인 고층 빌딩, 비행 자동차, 네온 불빛 스카이라인이 있는 매우 상세한 3D 렌더링.
-
해돋이의 마법 학교 운동장을 배경으로 한 생동감 넘치는 애니메이션 스타일 일러스트레이션. 흐르는 듯한 교복을 입은 학생들이 빛나는 문양(glyphs)과 떠다니는 가신들을 소환하고 있습니다. 운동장은 만개한 벚꽃나무로 채워져 있으며, 꽃잎들이 공중에 흩날리고 마법 원이 발밑에서 반짝입니다. 건축물은 고대 사원과 미래형 타워가 조화를 이루고 있으며, 아침 햇살이 길고 극적인 그림자를 드리우는 가운데 모든 구석에서 우정과 라이벌 관계가 빛을 발합니다.
-
만개한 꽃들과 복잡한 유기적 패턴으로 둘러싸인 우아하고 기품 있는 여성을 그린 아르누보(Art Nouveau) 스타일 일러스트레이션. 그녀의 흐르는 드레스와 긴 머리는 주변 환경의 선과 곡선을 이루며, 양식화된 금색 테두리와 장식적인 대칭 구조로 액자처럼 구성되어 있습니다.
-
여러 시점(정면, 측면, 후면, 3/4)에서 판타지 영웅을 보여주는 상세한 캐릭터 전신도(turnaround sheet). 이 캐릭터는 복잡한 디테일의 화려한 갑옷을 입고 있으며, 전신도에는 영웅의 얼굴, 무기, 액세서리의 클로즈업 사진이 포함되어 있습니다.
-
햇살 가득한 초원에서 피크닉을 즐기는 친근한 동물 그룹의 매력적이고 기발한 일러스트레이션으로, 밝은 색상과 장난기 넘치는 표정이 특징입니다.
-
과일, 직물, 사람들의 겹쳐진 이미지가 활기차고 혼란스러운 장면을 연출하는 번화한 시장의 혼합 미디어 콜라주 스타일 구도입니다.
-
세 명의 개성 있는 슈퍼히어로 소녀들이 전투 중인 강렬한 코믹 북 패널로, 각자 고유한 능력과 화려한 의상을 갖추고 있습니다. 이 장면은 속도선과 양식화된 패널 컷으로 에너지가 넘치며, 괴물 같은 적에 대한 그들의 동기화된 공격을 보여줍니다. 역동적인 포즈, 빛나는 효과, 그리고 강렬한 클로즈업이 드라마틱한 인킹(inking)과 대담한 윤곽선으로 액션을 생생하게 만듭니다.
-
거대한 폐허, 멀리 보이는 불빛, 그리고 옆에 로봇 동반자를 두고 서 있는 포스트 아포칼립틱 풍경 속 미래 전사의 상세 컨셉 아트입니다.
-
음악 앙상블을 입체파(Cubist) 스타일로 추상 해석한 작품으로, 역동적인 자세를 취하는 음악가들과 그들의 악기를 나타내는 파편화되고 기하학적인 형태들로 구성되어 있습니다.
-
빛나는 스크린, 전선, 하이테크 가젯으로 가득 찬 어둡고 미래적인 방에서 해커가 작업하는 네온 불빛의 사이버펑크 스타일 장면입니다.
-
반짝이는 비늘과 빛나는 눈을 가진 용이 산봉우리에 앉아 있고, 아래에는 마법적이고 안개 낀 풍경이 펼쳐진 환상적이고 이세계적인 묘사입니다.
-
노트북, 커피잔, 램프 같은 단순화된 사물들이 최소한의 음영 처리와 함께 다채로운 2차원 장면으로 배열된 현대 작업 공간의 플랫 디자인 그래픽입니다.
-
뼈대 같은 나무들로 이루어진 깊은 숲 속에 숨겨진, 스테인드글라스가 섬뜩한 빛을 내고 갈라진 돌 의자에서 그림자 속 인물들이 조용히 지켜보는 오싹한 고딕 예배당입니다.
-
일출의 산 호수(mountain lake)를 초현실적으로 상세하게 담은 HDR 이미지로, 그림자와 빛 사이의 강렬한 대비, 물에 비치는 생생한 반사, 그리고 바위가 많은 전경의 풍부한 질감이 특징입니다.
-
활기 넘치는 파리 카페를 묘사한 인상주의 스타일의 그림으로, 느슨하고 표현적인 붓터치가 생동감 있는 분위기와 부드럽고 얼룩진 빛을 포착했습니다.
-
지구층 단면도(cross-section)가 표시된 화산 폭발 장면을 다룬 인포그래픽 스타일 일러스트레이션입니다. 이 다이어그램에는 지각(crust), 맨틀(mantle), 외핵(outer core), 내핵(inner core)이 포함되어 있으며, 명확하게 표시된 라벨과 색상 코딩된 섹션으로 구성되어 있습니다. 용암은 화산 분화구에서 흘러나오며, 화살표는 마그마 방(magma chamber)과 벤트(vents)를 통한 마그마의 움직임을 보여줍니다. 배경은 깨끗하고 미니멀하며, 평면 디자인 아이콘과 구조화된 시각적 계층 구조가 명확성과 과학적 정확성을 강조합니다.
-
번화한 사이버 카페를 이소메트릭(isometric)으로 그린 일러스트레이션입니다. 내부 방들이 보이고, 컴퓨터 앞에 앉은 작은 사람들과 네온 조명, 그리고 각진 위에서 내려다본 복잡한 기술 디테일이 특징입니다.
-
블록 같은 나무들, 구불구불한 강, 다각형 동물들로 이루어진 숲을 스타일화된 로우-폴리(low-poly) 3D 장면으로 표현했습니다. 모든 것이 단순화된 기하학적 스타일로 렌더링되었습니다.
-
꽃잎 위에 앉은 이슬에 덮인 나비를 매크로 사진(macro photograph) 스타일로 촬영한 이미지입니다. 질감과 빛에서 극도의 클로즈업 디테일을 보여줍니다.
-
평평하고 미색의 배경 중앙에 놓인 가늘고 가는 가지와 몇 개의 섬세한 녹색 잎을 그린 미니멀리스트 일러스트레이션입니다. 깔끔한 선과 부드러운 그림자가 자연 형태의 단순함과 고요한 아름다움을 강조합니다.
-
장엄한 왕이 화려한 나무 테이블에 앉아 만찬을 즐기는 클래식 유화(oil painting)입니다. 주변에는 구워진 멧돼지, 포도, 와인 잔, 정교한 접시 등 중세의 진미들이 놓여 있습니다. 장면은 깜빡이는 촛불에 의해 비추어지고 있으며, 풍부하게 질감이 느껴지는 직물, 금색 악센트, 그리고 왕실 만찬장의 호화로움을 불러일으키는 어둡고 분위기 있는 배경이 특징입니다.
-
얕은 심도(shallow depth of field)를 가진 DSLR급 사진으로, 황금빛 햇살이 나무 사이로 비추는 숲 속 공터에 있는 여성을 포착했습니다. 먼지와 꽃가루가 빛 속에 반짝이고 있으며, 그녀의 사색적인 표정과 부드럽게 빛나는 머리카락은 풍부한 보케(bokeh) 배경을 배경으로 강조됩니다.
-
중세 판타지 배경의 꽃밭에서 용과 싸우는 기사의 픽셀화된 16비트 픽셀 아트 이미지로, 레트로한 비디오 게임 미학에 완벽하게 어울립니다.
-
화려한 패션니스타가 명품 부티크를 박차고 나오는 생동감 넘치는 팝아트 스타일의 묘사입니다. 쇼핑백을 가득 안은 그녀는 만화체 텍스트로 “I DON’T NEED A SALE — I NEED A STATEMENT!”라고 외칩니다. 이 장면은 대담한 색상, 하프톤 패턴, 과장된 표정으로 생동감이 넘치며, 도시 배경은 색상 블록과 점진 질감으로 추상화되어 드라마틱하고 재치 있는 하이패션 풍자를 만들어냅니다.
-
천둥번개가 치는 미래 도시에서 화재를 진압하는 소방관들의 극사실적인 장면입니다. 빛나는 불씨, 비에 젖은 거리, 반사되는 헬멧, 그리고 시간과의 싸움이라는 긴장감이 느껴집니다.
-
네온사인 간판이 있는 다이너와 밖에 주차된 클래식 자동차들, 빈티지 의상을 입고 밀크셰이크와 버거를 즐기는 손님들이 담긴 레트로한 1950년대 스타일의 일러스트레이션입니다.
-
돌길, 세밀한 건축 요소, 그리고 깊이와 질감을 암시하는 부드러운 음영을 가진 오래된 유럽 거리의 자유로운 수채 연필 스케치입니다.
-
안개 낀 돌담 골목에서 펼쳐지는 극적인 스팀펑크 대결 장면입니다. 황동 팔다리를 가진 시계 장치 탐정이 기계 거미 위에 올라탄 가면을 쓴 도둑과 마주하고 있으며, 깜빡이는 가스등에 의해 조명이 비춥니다.
-
녹아내리는 시계가 나뭇가지에 걸려 있는 초현실적이고 꿈같은 표현입니다. 왜곡된 풍경과 불가능한 원근법이 특징입니다.
-
작은 자동차, 버스, 그리고 길을 건너는 사람들로 가득 찬 분주한 도시 교차로를 틸트-시프트 효과와 얕은 심도로 담아낸 미니어처 스타일의 장면으로, 위에서 촬영한 정교한 모델 디오라마를 연상케 합니다.
-
깨끗한 타이포그래피와 직관적인 버튼 배치가 있는 세련된 모바일 뱅킹 앱 인터페이스의 사실적인 UI/UX 목업입니다. 밝은 모드와 어두운 모드를 모두 보여줍니다.
-
안개 낀 다리를 건너는 사무라이의 전통 일본 우키요에(ukiyo-e) 목판화 스타일 그림으로, 흐르는 듯한 선과 차분한 색상, 그리고 배경의 후지산이 있습니다.
-
마젠타와 시안색 일몰로 길게 뻗은 네온 그리드 고속도로를 배경으로 한 레트로 미래주의적인 베이퍼웨이브/신스웨이브(vaporwave/synthwave) 장면입니다. 야자수, 빛나는 피라미드, 크롬 스포츠카가 있습니다.
-
열대 가지에 앉아 있는 앵무새의 깨끗하고 선명한 벡터 스타일 일러스트레이션으로, 양식화된 정글 잎과 생생한 꽃들에 둘러싸여 있습니다.
-
새벽 안개 속 숲에 서 있는 사슴의 꿈결 같은 수채화 장면입니다. 부드럽게 번지는 색조가 나무들을 안개와 어우러지게 하고, 캐노피 사이로 새어 나오는 황금빛이 바닥에 떨어진 야생화를 비추고 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 r/StableDiffusion의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기