Some Longcat-Image-Edit 샘플: 제한적이지만 매우 유용한 모델
요약
본 기술 기사는 'Longcat-Image-Edit'이라는 이미지 편집 모델의 샘플과 평가를 담고 있습니다. 이 모델은 단순 인페인팅부터 참조 이미지를 활용한 고급 편집까지 시연하며, 특히 얼굴 참조 처리 능력에서 높은 잠재력을 보여줍니다. 다만 ControlNet 부재와 다중 참조 이미지 처리의 어려움 등 몇 가지 한계점을 가지고 있어 사용 범위가 제한적일 수 있습니다.
핵심 포인트
- Longcat-Image-Edit 모델은 단순 인페인팅 및 얼굴 참조 기반 편집에 유용합니다.
- ControlNet이 없어 완벽한 인페인팅 작업에는 어려움이 있으나, 얼굴 참조 처리 능력은 우수합니다.
- 모델의 성능과 미적 감각은 Flux 2 Klein보다 만족스러우며, 사실감 측면에서 자연스러운 편입니다.
- 기존 Longcat base가 느리다는 단점 때문에 Turbo 기반으로 수정되어 사용성이 개선되었습니다.
모든 참조 얼굴은 Flux 1 Dev 로 제작되었습니다. 첫 세 샘플은 단순 인페인팅 (inpainting) 이고, 마지막 세 샘플은 참조 이미지 + 프롬프트를 사용했습니다.
이 모델에는 ControlNet 이 없어 인페인팅 작업이 조금 어려웠지만, 이는 Flux 2 Dev 다음으로 얼굴 참조 처리에 가장 적합한 두 번째 모델로 보입니다. 다만 여러 개의 참조 이미지를 동시에 처리하는 데는 어려움을 겪으므로 타겟 오디언스가 매우 제한적일 수 있습니다. 모델의 콘텐츠가 부족하여 Klein/ZIT 의 결과를 기대해서는 안 됩니다. 개인적으로 이 모델의 전반적인 품질과 미적 감각은 Flux 2 Klein 보다 더 만족스럽고, 사실감 측면에서는 Ernie 보다 약간 더 자연스러우며 ZIT 에 더 가깝다고 생각합니다.
이것은 Longcat image edit base 가 아니라, 터보 (turbo) 에 일부 베이스를 병합하여 수정한 버전입니다. 이를 통해 50 단계 cfg 2.5 대신 30 단계 cfg 1 을 사용할 수 있게 되었습니다. 베이스 버전이 더 좋지만, 저에게는 너무 느립니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 r/StableDiffusion의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기