IMG Dataset Refiner v4.0 Pro - LoRAs를 위한 궁극의 데이터셋 엔지니어링 스위트 (Flux, SDXL 등)
요약
IMG Dataset Refiner v4.0 Pro는 단순한 선택 도구를 넘어, AI 모델 학습을 위한 포괄적인 데스크톱 데이터 엔지니어링 스위트로 업그레이드되었습니다. 이 버전은 로컬 VLM/LLM 통합 기능을 통해 이미지 자동 캡셔닝, 컨셉 아이솔레이션 등 고급 태깅 작업을 지원하며, 사용자가 원하는 언어로 쉽게 데이터를 준비할 수 있도록 실시간 번역 및 대량 배치 편집 기능도 제공합니다. 또한, 시각적 중복 탐지, 논리적 모순 검사 등의 전처리 기능을 통해 고품질의 학습 데이터셋 구축을 돕습니다.
핵심 포인트
- 로컬 VLM/LLM 통합으로 자동 캡셔닝 및 고급 태깅(Concept Isolator) 기능 구현
- 대량 배치 편집 시스템을 도입하여 수백 개의 이미지에 걸쳐 일관된 메타데이터 관리 가능
- 실시간 번역 기능을 통해 비영어권 사용자도 쉽게 고품질의 캡션 데이터를 생성할 수 있음
- 시각적 중복 탐지(Perceptual Hashing) 및 논리적 모순 검사 등 심층적인 데이터셋 전처리 기능 제공
- 공동 출현 히트맵을 통해 태그 간의 관계를 분석하고 데이터 품질을 향상시키는 고급 분석 도구 제공
여러분 안녕하세요! 얼마 전 제 데이터셋 매니저 v3을 공유한 적이 있습니다. 그때는 자동 캡셔닝 기능이 없다고 했었죠. 음... 그건 잊으세요. **대규모 업데이트(v4.0 Pro)**를 방금 출시했으며, 모든 것을 바꿉니다! 🚀
단순 선택 도구에서 AI 모델 학습을 준비하기 위한 완전한 데스크톱형 데이터 엔지니어링 스위트로 진화했습니다.
새로 추가된 기능 및 현재 기능:
🤖 로컬 AI 어시스턴트 (VLM/LLM 통합): Ollama 또는 LM Studio에 원활하게 연결할 수 있습니다! 이제 로컬 비전 모델을 사용하여 이미지에서 처음부터 **자동 캡셔닝(Auto-Caption)**하거나, '환각된' 태그를 찾아내거나, *컨셉 아이솔레이터(Concept Isolator)*를 사용할 수 있습니다 (배경은 설명하지만 주제는 무시합니다—캐릭터 LoRA에 완벽합니다!). Flux용으로 Booru 태그를 자연어 문장으로 번역하는 것까지 가능합니다.
📚 단어 라이브러리 및 대량 배치 편집: 완전히 새로운 인터랙티브 라이브러리가 추가되었습니다. 좋아하는 컨셉을 저장하고, 확인한 다음, 선택된 수백 개의 이미지에 걸쳐 한 번의 클릭으로 추가(Add), 제거(Remove) 또는 대체(Replace)할 수 있습니다.
🌍 실시간 번역 어시스턴트: 영어가 모국어가 아닌가요? 자신의 언어로 아이디어를 입력하면, 실시간 미리보기가 deep-translator를 사용하여 즉시 번역하고 캡션에 주입합니다.
🖼️ 전처리 및 중복 탐지: 학습 전에 데이터셋을 정리하세요! 시각적 중복 스캐너(Perceptual Hashing), 스마트 얼굴 크롭(OpenCV), 투명 PNG를 흰색 배경으로 자동 변환, 원클릭 대량 크기 조정/이름 변경 기능이 포함되어 있습니다.
📈 고급 분석 (Concept Bleeding 방지): 공동 출현 히트맵(Co-occurrence Heatmaps)을 생성하여 태그가 부적절하게 연결되었는지 확인하고, 해상도 분포를 점검(Bucketing)하며, 도구가 논리적 모순(예: 같은 이미지에 '낮'과 '밤'이 함께 사용된 경우)을 자동으로 찾아내도록 하세요.
⚖️ **LoRA용
AI 자동 생성 콘텐츠
본 콘텐츠는 r/StableDiffusion의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기