누구도 예상하지 못한 일을 Apple 이 했습니다.

Apple 이 누구도 예상하지 못한 일을 했습니다.

그들은 텍스트 가이드된 AI 이미지 편집기 (text-guided AI image editors) 의 다음 세대를 훈련하기 위한 40 만 장의 이미지를 포함한 Pico-Banana-400K 데이터셋을 출시했습니다.

수년 동안 오픈소스 비전 모델들은 고립되어 있었습니다.
가장 큰 병목 현상은 데이터였습니다. 실제 이미지와 복잡한 편집 지시를 포함하는 대규모, 고품질의 공개 액세스 가능 데이터셋이 없었기 때문입니다.

Apple 은 이 병목 현상을 해결했습니다. 그리고 이를 모두에게 오픈소스로 제공했습니다.

하지만 가장 놀라운 점은 다음과 같습니다.

복잡한 편집 지시를 생성하고 이미지 편집의 품질을 검증하기 위해 Apple 은 자체 내부 AI 를 사용하지 않았습니다.

그들은 Google 의 Gemini 2.5 Pro 와 Alibaba 의 Qwen 을 사용했습니다.

최고의 울타리 정원 (walled garden) 을 구축한 회사가 오히려 가장 큰 경쟁사의 모델을 사용하여 마스터 데이터셋을 구축하고, 이를 무료로 배포했습니다.

이 데이터셋에는 단일 턴 편집 (single-turn edits), 복잡한 다단계 추론 (complex multi-step reasoning), 보상 훈련 (reward training) 을 위한 선호도 데이터 (preference data) 가 포함되어 있습니다.

이는 최고 수준의 AI 랩 (AI labs) 과 맞설 수 있는 오픈소스 모델을 훈련하기 위해 필요한 정확한 원료입니다.

Insights