본문으로 건너뛰기

© 2026 Molayo

r/StableDiffusion분석2026. 05. 03. 20:17

FLUX.2 Klein Identity Feature Transfer V3 (최종판)

요약

FLUX.2 Klein Identity Feature Transfer V3는 기존 아이덴티티 트랜스퍼 노드의 사용성을 대폭 개선한 버전으로, 복잡한 내부 구조를 알 필요 없이 누구나 쉽게 사용할 수 있도록 설계되었습니다. 주요 업데이트 사항은 '커밋 시스템(commit system)' 도입으로, 전체 평균화 대신 각 생성 토큰마다 최적의 참조 매칭을 찾아 안정적으로 잠근 후 가벼운 앵커를 유지하여 아이덴티티 보존의 정확도를 높였습니다. 사용자는 프리셋 기반의 간편한 제어 방식과 더불어, 고급 사용자들을 위한 세밀한 블록 및 커밋 관련 파라미터(예: `double_schedule`, `commit_anchor`)를 제공받을 수 있습니다.

핵심 포인트

  • V3는 사용 편의성을 극대화하여 복잡한 내부 구조 이해 없이도 아이덴티티 트랜스퍼가 가능하도록 개선되었습니다.
  • 핵심 기능인 '커밋 시스템'은 생성 토큰 단위로 최적의 참조 매칭을 찾아 잠그고(commit), 이후에는 가벼운 앵커를 유지하여 아이덴티티 손실과 배경 누출을 줄입니다.
  • 사용자는 MIDUM_LOCK, HARD_LOCK, SOFT_LOCK 세 가지 프리셋 중 선택하거나, `double_schedule`, `commit_anchor` 등 다양한 고급 파라미터를 직접 제어할 수 있습니다.
  • 마스크(subject_mask)는 참조 잠재 자체를 편집하는 것이 아니라, 모델이 특정 영역의 아이덴티티에 집중하도록 돕는 보조적인 역할을 합니다.

Identity Feature Transfer(아이덴티티 피처 트랜스퍼) 이제 V3 버전이 나왔습니다.

이것은 아이덴티티 트랜스퍼 노드의 더 깔끔한 버전입니다. 목표는 FLUX.2 Klein 내부의 모든 블록과 모든 후크(hook)를 모두 이해하지 않아도 누구나 쉽게 사용할 수 있도록 하는 것이었습니다.

FLUX.2 Klein Identity Feature Transfer V3: 여기
워크플로우(Workflow): 여기

내 작업이 도움이 된다면 커피를 사주셔서 지원해 주세요.

V3는 이제 프리셋(presets)을 중심으로 구축되었습니다.

MIDUM_LOCK은 시작점입니다((발음은 틀렸는데 lol, 그걸로 바꾸지는 않겠습니다)).

HARD_LOCK은 참조 이미지가 계속 흐트러질 때 더 강력한 보존을 위해 사용합니다.

SOFT_LOCK은 참조 이미지가 너무 많이 지배할 때 사용합니다.

custom(사용자 정의)은 자신의 블록 스케줄(block schedules)과 값을 사용하고자 할 때 사용할 수 있습니다.

가장 큰 변화는 커밋 시스템(commit system)입니다.

전체 참조 이미지를 기준으로 생성을 계속 평균화하는 대신, V3는 각 생성 토큰(genration token)마다 가장 좋은 참조 매칭(reference match)을 찾도록 시도합니다. 그 매칭이 안정적으로 유지되면 이를 커밋(commit)합니다. 이후에는 영원히 강하게 당기는 대신 더 가벼운 앵커(anchor)를 유지합니다.

그렇다면 피처 뭉침(feature mush)은 줄어듭니다, 무작위 배경 누출(random background bleed)은 줄어듭니다, 그리고 더 깨끗한 아이덴티티 보존이 이루어집니다.

프리셋은 의도적으로 수동 설정을 덮어씁니다. MIDUM_LOCK, HARD_LOCK, 또는 SOFT_LOCK 중 하나를 선택하면 실험하고 싶지 않은 한 나머지 설정을 건드리지 않아도 됩니다. custom(사용자 정의)을 선택하면 수동 컨트롤이 사용됩니다.

custom을 사용할 경우의 컨트롤:

double_schedule: 더블 블록(double blocks)을 제어합니다. 아이덴티티와 구조에 중요합니다. 형식은 0-3:mid=0.25; 4:mid=0.35 와 같습니다.

single_schedule: 싱글 블록(single blocks)을 제어합니다. 후기 퓨즈드 스트림(later fused stream)을 통해 아이덴티티를 전달하는 데 도움이 됩니다. 형식은 0:mid=0.35; 1:mid=0.25; 2-10:mid=0.30 과 같습니다.

double_sim: 더블 블록 매칭(double block matching)의 엄격도를 제어합니다. 낮은 값은 더 많은 매칭과 강력한 락(lock)을 허용하고, 높은 값은 더 적은 매칭과 더 큰 자유를 허용합니다.

single_sim: 같은 아이디어지만 싱글 블록(single blocks)에 적용됩니다.

commit_margin: 토큰이 잠그기 전에 가장 좋은 참조 매칭(best reference match)이 얼마나 명확해야 하는지를 제어합니다. 낮으면 더 빠르게 잠깁니다. 높으면 더 깨끗하지만 약해집니다.

commit_confirm: 같은 매칭이 몇 번 반복되어야 잠근 것으로 간주하는지를 제어합니다. 1은 공격적이고, 2는 안전합니다.

commit_anchor: 토큰이 잠긴 후 남아있는 당김(force)의 양을 제어합니다. 높으면 안정적인 아이덴티티 압력을 유지하고, 낮으면 매칭이 안정화된 후 모델에 더 많은 자유를 줍니다.

mask_threshold: subject_mask 가 연결되었을 때만 의미가 있습니다. 높으면 마스크 영향력이 안쪽으로 줄어들고, 낮으면 에지 토큰(edge tokens)을 더 많이 유지합니다.

subject_mask 는 여전히 선택 사항입니다. 참조 이미지가 여러 개체(subject)가 있거나 아이덴티티를 특정 영역에서만 끌어오기만 원하는 경우 사용하세요.

명확히 말하자면, 마스크(mask)는 참조 잠재(latent)를 편집하지 않습니다. 모델은 여전히 전체 참조 이미지를 봅니다. 마스크는 단순히 어떤 참조(refer)

AI 자동 생성 콘텐츠

본 콘텐츠는 r/StableDiffusion의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
12

댓글

0