본문으로 건너뛰기

© 2026 Molayo

Zenn헤드라인2026. 05. 14. 07:31

SD1.5 dreamshaper vs realcartoon3d, 50개의 프롬프트 × 10개의 seed로 비교했다

요약

본 기사는 SD1.5 계열의 두 모델(dreamshaper_8과 realcartoon3d_v18)을 50개 프롬프트와 10개 시드로 조합하여 총 1,000장의 이미지를 생성하고 비교 분석한 결과입니다. 그 결과, 평균적인 미적 점수(aesthetic score)는 realcartoon3d가 약간 높았으나, 최고 화질(max score)은 dreamshaper가 더 높은 것으로 나타났습니다. 따라서 '안정적으로 무난한 결과물'을 원한다면 realcartoon3d를, '최고의 예술적 완성도나 스타일 지정 충실도'를 원한다면 dreamshaper를 선택하는 것이 실용적인 가이드라인이 될 수 있습니다.

핵심 포인트

  • realcartoon3d는 평균 미적 점수가 높아 어떤 프롬프트에서도 안정적으로 좋은 결과물을 얻기 용이합니다. (실패가 적음)
  • dreamshaper는 최고 화질(max score)과 스타일 지정에 대한 충실도가 높아 '베스트 샷'을 노릴 때 유리합니다.
  • 캐릭터 중심의 작품은 dreamshaper가, 풍경이나 물체 중심의 작품은 realcartoon3d가 상대적으로 강점을 보입니다.
  • 두 모델 모두 복잡한 손(hand)이나 다중 캐릭터(multi-character)와 같은 형태적 난이도가 높은 소재에서는 약점을 공유합니다.
  • 시각적 다양성을 기준으로 엄선된 100장의 이미지 개수는 두 모델 간에 거의 대등하게 분포했습니다.

동기

Stable Diffusion 1.5 계열 모델은 Civitai 상에 수백 개가 있으며, 상위 랭킹에 있는 것만 해도 30~50개의 선택지가 있습니다. **"결국 무엇을 사용하면 좋은가?"**는 매달 누군가가 SNS에서 묻고 있는 영원한 토픽입니다.

답변으로 돌아오는 것은 "자신이 좋아하는 것을 써라", "자신의 화풍에 맞는 것을 시도해라"라는 내용이 많습니다. 옳은 말이지만, **"시도함 = 5개 모델 × 프롬프트를 여러 번 바꿔가며 수동으로 생성"**하는 것은 시간이 많이 걸립니다. 모델 1개당 10 prompt × 5 seed를 수행해도 50장이며, 5개 모델이라면 250장입니다. WebUI에서 수동으로 뽑는다면 반나절은 걸리는 작업입니다.

이에 본 검증에서는 상업적 이용이 가능한 SD1.5 계열 2개 모델(dreamshaper_8 / realcartoon3d_v18)에 대해, 장르가 다양한 50개 프롬프트 × 공통 10개 seed = 1,000장을 한꺼번에 생성하여 모델의 특성을 시각화했습니다.

왜 5개 모델이 아니라 2개 모델인가?

솔직히 말하면, 당초에는 5개 모델(SDXL 2개 + SD1.5 3개)로 계획했습니다.

하지만 RTX 5060(8GB VRAM)에서 SDXL을 768×768 해상도로 돌리면, CPU offload로 인한 disk swap 때문에 이미지 1장당 17~41분이 소요된다는 것을 실측을 통해 확인했습니다. 2,500장을 뽑으려면 10일 이상 GPU를 점유해야 한다는 계산이 나와 현실적이지 않았습니다.

→ 따라서 SD1.5 2개 모델로 압축하여 1,000장으로 실시했습니다(2시간 만에 완료). SDXL 비교는 GPU 환경을 업데이트한 후 별도로 검토하겠습니다.

이러한 유형의 "설계보다 작은 결과가 나온 원인과 판단 과정"은 자기 실험 과정에서 빈번하게 발생하는 일이기에, 검증 기사로서 남길 가치가 있다고 생각합니다.

검증 셋업

항목
모델 Adreamshaper_8(Lykon, 범용)
..."prompt와 seed 이외에는 모두 동일"함을 엄수. 이를 통해 "모델이 다르면 어떻게 변하는가"를 isolate(격리)할 수 있습니다.

결과 1: 평균 aesthetic 스코어는 거의 동등

LAION aesthetic predictor v2(CLIP ViT-L/14 기반, 0–10 스케일)로 1,000장을 전수 스코어링했습니다:

모델meanminmax
dreamshaper_86.994.438.98
realcartoon3d_v187.124.058.66

평균은 realcartoon3d가 약간 높습니다(+0.13). 하지만 최고 화질(max)은 dreamshaper 쪽이 더 높습니다(8.98 vs 8.66).

이것이 의미하는 바는 다음과 같습니다:

  • dreamshaper: 잘 나온 이미지(top score)의 정점이 높습니다. **"베스트 1장"**을 노리는 용도에 적합합니다.
  • realcartoon3d: 평균이 높음 = 어떤 prompt에서도 안정적으로 보기 좋습니다. "실패가 적은" 용도에 적합합니다.

"Photoshop에서 1장을 완성할 소재를 뽑고 싶다"면 dreamshaper, "썸네일용으로 50장을 한꺼번에 뽑아서 전부 무난하게 완성하고 싶다"라면 realcartoon3d라고 정리할 수 있습니다.

결과 2: 장르별 장단점

메인 그리드 이미지로 장르별로 나열했을 때의 관찰 내용:

캐릭터 계열(prompt 0-11)

  • dreamshaper: 평면 애니메이션에 가까운 완성도, 눈코입의 디테일이 안정적임
  • realcartoon3d: 입체감이 강한 3D 캐릭터, 실사에 가깝게 치우치는 경향이 있음

풍경 계열(prompt 12-21)

  • dreamshaper: 사실적 + 예술적, 호러에 가까운 분위기가 나오기 쉬움
  • realcartoon3d: 그림책 같은 입체감, 밝은 배색 위주

추상·패턴 계열(prompt 31-35)

  • dreamshaper: 구조를 유지하면서 유동적인 표현
  • realcartoon3d: 패턴화가 무너지기 쉬움(취약 분야)

스타일 지정 계열(prompt 36-43)

  • dreamshaper: 「van Gogh」, 「ukiyo-e」 등의 스타일 지정에 충실하게 반응
  • realcartoon3d: 스타일 지정이 약하며, 독자적인 방향으로 흐르기 쉬움

에지 케이스 (edge case, prompt 44-49)

  • 「complex hand close-up」, 「multi-character」 등,
    두 모델 모두 형태가 무너지기 쉬운 소재 - 이 지점에서 두 모델의 「약점」이 비슷한 정도로 드러남

→ 즉, 「스타일 지정 계열·추상 계열은 dreamshaper, 풍경 계열·물체 계열은 realcartoon3d」가 대략적인 구분법.

엄선된 100장의 모델 비교

aesthetic 상위 400장 → CLIP 특징의 k-means (k=100)를 통해 「시각적으로 다양하게」 되도록 엄선한 100장의 내역:

  • dreamshaper_8:
    48장 - realcartoon3d_v18:
    52장

거의 대등함(48:52). 시각적 다양성을 기준으로 선정하면 모델 편향이 생기지 않는다는 것은 흥미로운 결과입니다. 이는 「종합적인 능력 면에서는 동등하며, 특성이 다를 뿐이다」라는 결론을 보강합니다.

무엇을 알 수 있는가 (실용적인 판단 자료)

  • 평균적으로 아름다운 결과물을 노린다면: realcartoon3d_v18 (평균이 높고, 실패가 적음)
  • 최고의 화질을 노린다면: dreamshaper_8 (top이 높고, 스타일 지정에 충실함)
  • 캐릭터 중심의 작품이라면: dreamshaper (이목구비가 안정적)
  • 풍경·물체 중심이라면: realcartoon3d (입체감이 느껴지는 묘사)
  • 어느 것을 쓸지 고민된다면, 우선 10~20개의 prompt로 테스트한 뒤 결정할 것 (본 데이터셋이 이를 1,000장으로 대신함)

향후 진행할 검증

  • 동일한 50 prompt로
    SDXL 2종(animagineXL / juggernautXL)을 비교하는 별도 상품 (GPU 환경 업데이트 후)
  • 동일한 2개 모델로
    CFG / Sampler를 변경했을 경우에 이 우열이 역전되는지
  • 동일한 2개 모델로
    negative를 변경했을 경우 (P5 상품과 조합하여 cross-axis 분석)

데이터셋 공개

본 검증의 전체 1,000 이미지 + 엄선된 100장 + 메인 그리드 5장(장르별) + CSV 일체 + 상세한 해설 README는 Booth에서 판매하고 있습니다:

가격 800엔으로, 다음을 동봉합니다:

  • 전체 1,000 이미지 (2개 모델 × 50 prompt × 10 seed)
  • 엄선된 100장 (모델 비율 48:52로 편향 없음)
  • 장르별 메인 그리드 5장 + 하이라이트 그리드 4장
  • metadata.csv / aesthetic_scores.csv / p1_highlights.csv
  • 전체 50 프롬프트 + 재현 스크립트용 설정

직접 1,000장을 뽑아낼 시간이 없다」거나 「장르별 특성 차이를 한눈에 보고 싶다」는 분들의 며칠 분량의 자기 실험을 압축하는 용도로 적합합니다.

요약

  • SD1.5 계열 dreamshaper_8과 realcartoon3d_v18을 50 prompt × 10 seed로 망라 비교
  • 평균 aesthetic은 거의 동등(7.0),
    최고 화질은 dreamshaper, 평균적인 안정성은 realcartoon3d
  • 장르별로는
    캐릭터·스타일 지정은 dreamshaper, 풍경·물체는 realcartoon3d
  • SDXL을 포함한 확장판은 GPU 환경 업데이트 후 별도 상품으로 예정

「어느 것을 사용할지 고민 중」인 분들은 본 기사와 Booth 페이지를 통해 판단 자료를 늘려보시기 바랍니다.

MetAIra(@MetAIra)

SD 검증 데이터셋을 정기적으로 제작하고 있습니다. Sampler × CFG 거동 맵(P2) 및 Negative Prompt 검증 노트(P5)와 함께 구매하시면 4개 축(Sampler / CFG / Negative / Model)을 모두 갖출 수 있습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Zenn AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0