Working on a technique to produce style LoRAs from a single image. Post yours

저는 깊이 맵을 조건부 정보로 사용하는 새로운 이미지 훈련 접근법을 개발하고 있습니다. 제 원래 목표는 캐릭터 유사성 향상 (실제로 달성함) 이었지만, 이는 작은 데이터셋에서도 유연한 스타일 LoRA 를 생성할 수 있는 능력도 가지고 있습니다 - 단일 이미지만큼 작은 데이터셋에서요. 저는 매개변수를 개선하고 피드백을 얻고자 합니다. 따라서 스타일을 훈련시키고 싶다면 여기에 게시하세요. 제가 Klein 9b LoRA 를 만들겠습니다.

예시 생성 결과들 - 훈련한 벡터 아트 스타일에서 - 마지막 이미지는 "데이터셋"입니다.

[수정]: 일부 사람들은 기술적 세부 사항과 도구 사용 방법을 요청했습니다. 여기서는 저장소가 있습니다. 아직 실험적이므로 문제가 있으면 DM 해주세요!

https://github.com/BuffaloBuffaloBuffaloBuffalo/ai-toolkit-perceptual

또한, 저는 결국 모든 요청을 처리할 것입니다. 제가 일과 사이에 홈 리그에서 훈련하고 있기 때문에 시간이 좀 걸릴 수 있습니다.

[수정 2]: 설정에 대해 몇 가지 질문이 있었습니다. 이 단일 이미지 실행에는 다음을 사용했습니다:

LoKR with factor 8
768px training image size
High timestep bias
Linear timestep schedule
Depth Anything v2 Large at 1400px resolution for depth maps
5e-5 learning rate
0.005 depth consistency loss weight
1 diffusion loss weight
Loss splitting ON (it's currently only in per-dataset override settings - add a second dataset to make that toggle appear. I know it's stupidly hidden right now, I have a lot of UI cleanup to do!)

For the gens:

Distilled 9b
res2s sampler, beta scheduler
4 steps

Insights

Working on a technique to produce style LoRAs from a single image. Post yours

요약

핵심 포인트

댓글

나는 제휴 코드를 운영하고 있다. 가짜 코드 7개가 내 코드를 앞지르고 있으며, Google의 AI는 그것들을 믿고 있다.

설명(Description)은 로딩을 트리거해야 하며, 컨텍스트를 저장해서는 안 됩니다

Claude Code × OpenRouter 무료 모델: 비용 $0로 자율 주행하는 AI 코딩 환경을 3단계로 구축하기

AI의 자기 개선 루프는 '외부 검증'으로 결정된다: Copilot의 사전 지시(Custom Instructions)에 담아야 할 설계

나는 제휴 코드를 운영하고 있다. 가짜 코드 7개가 내 코드를 앞지르고 있으며, Google의 AI는 그것들을 믿고 있다.

설명(Description)은 로딩을 트리거해야 하며, 컨텍스트를 저장해서는 안 됩니다

Claude Code × OpenRouter 무료 모델: 비용 $0로 자율 주행하는 AI 코딩 환경을 3단계로 구축하기

AI의 자기 개선 루프는 '외부 검증'으로 결정된다: Copilot의 사전 지시(Custom Instructions)에 담아야 할 설계