Nano Banana 2 Lite
요약
Google의 새로운 이미지 생성 모델인 Nano Banana 2 Lite(NB2L)에 대한 리뷰입니다. 모델의 성능, 비용 효율성, Vertex AI를 통한 화면비 설정 가능 여부를 다루며, 부동산 매물 이미지의 AI 보정 문제와 Google의 계정 체계 및 결제 경험에 대한 비판적 시각을 담고 있습니다.
핵심 포인트
- Nano Banana 2 Lite는 NB1보다 생성 속도가 빠르지만 이미지당 비용은 다소 높음
- Vertex AI를 통해 NB2L에서도 프로그래밍 방식으로 화면비 설정 가능
- AI를 이용한 부동산 이미지 왜곡에 대한 윤리적·법적 문제 제기
- Google의 AI Studio 및 계정/결제 시스템의 사용자 경험 개선 필요성
집 인테리어 생성 첫 예시는 형언하기 어려울 정도로 싫음. 요즘 부동산 중개인들이 낡고 안 팔리는 아파트를 전부 AI 필터에 넣어 돌려서, 실제로 어떤 끔찍한 물건을 터무니없는 가격에 팔려는지 보기 전에 “이케아풍으로 꾸미면 이렇게 보일 수도 있다”는 이미지 수십 장을 먼저 넘겨야 함
이런 건 불법적인 허위 표시로 봐야 한다고 생각함. AI 사용에는 회색지대가 너무 많음
거의 사기에 가깝다고 봄. Streeteasy에서 어떤 아파트는 책상, 서랍장, 퀸 침대를 모두 ‘넣은’ 것처럼 보였는데, 이미지 모델이 현실에는 존재하지 않는 비율로 가구를 그냥 축소한 게 뻔했음
실제 침실에는 퀸 침대 하나만 겨우 들어갈 수 있었음 ;(
아파트 실제 모습 자체를 속이는 건 사회적으로든 법적으로든 받아들일 수 없어야 한다는 데 100% 동의함. 다만 내 욕실 리모델링에서 이미지 모델은 디자인 선택에 꽤 도움이 됐음
특히 어떤 부분에 타일을 붙였을 때 전체 공간이 어떻게 보일지 직접 상상하기 어려운 경우에 유용했음
내가 사는 NYC에서는 그런 보정 이미지를 올리는 게 10년도 넘게 일반적이었음
예전에는 그런 작업을 해줄 사람을 고용하는 비용이 더 비쌌을 뿐임
보정된 이미지는 늘 똑같이 밝은 벽과 회색 잡지풍 가구를 보여줌
AI가 더 싸게 만들었을 뿐, 결국 이렇게 될 수밖에 없었음
이런 식으로 보정된 이미지는 보정 사실을 알리는 작은 워터마크가 붙어 있긴 함
좋은 사진가만 있어도 효과가 엄청남. 친구가 집을 팔 때 매물 사진에서 집이 얼마나 좋아 보이는지, 또 내가 작지 않다는 걸 아는데도 얼마나 커 보이는지 보고 놀랐음 AI 필터가 나오기 전에도 있던 문제라 새롭지는 않지만, 지금은 훨씬 더 심해지고 비용도 낮아졌음
이 모델을 테스트할 수 있는 조기 접근 권한을 받았음. 업무를 통해서였고, Google이 개인적으로 나를 좋아하게 된 건 여전히 아님 lol
여기서 광고한 대로 동작하고, 좋은 텍스트 렌더링 같은 요소에서는 Nano Banana 2를 증류한 버전처럼 보임. Nano Banana 1은 이 부분이 훨씬 약함
물론 세밀한 프롬프트에서는 기본 Nano Banana 2 수준은 전혀 아님. 가장 큰 불만은 NB2에서는 프로그래밍으로 화면비를 강제할 수 있는데 NB2L에서는 안 된다는 점임
다만 이미지당 $0.034라는 가격은 예상보다 높음. 보통 가격은 생성 시간과 연관되는데, Nano Banana 1보다 절반 시간에 생성하면서도 Nano Banana 1은 이미지당 $0.039임
NB1 파이프라인을 NB2L로 바로 대체할 수 있다는 Google의 주장은 타당함
어제 Google은 Gemini 앱에서 무료 이미지 생성을 허용한다고 발표했지만(https://blog.google/innovation-and-ai/products/gemini-app/pe...), 어떤 모델을 쓰는지는 명시하지 않았음. Nano Banana 2 Lite의 주된 동기가 여기에 있다고 봄
Vertex를 통해 NB2 Lite에서도 프로그래밍으로 화면비를 설정할 수 있음 [1]. GenAI Showdown용 이미지를 만들 때 쓰는 프로그램을 업데이트해서 모델 ID를 gemini-3.1-flash-lite-image로 바꿨고, 16:9, 4:3 같은 화면비를 사용할 수 있었음
[1] - https://cloud.google.com/developers/vertex-ai
어떤 업무를 하길래 자동 이미지 생성을 대규모로 해야 하는지 궁금함
괜찮긴 한데 Google의 망가진 AI Studio 위에 있음. 거기 기능 절반은 Google One 계정이 필요해서 못 씀
나는 Workspace 계정이라 자격이 안 되고, 전환도 못 함. Google One은 자체 도메인을 지원하지 않기 때문임
그럼 멋진 이메일 주소와 Banana를 둘 다 쓰려면 계정 두 개를 운영하고 비용까지 내야 하나? 여기서 맞는 유료 Google 계정 수는 0개라는 생각이 들기 시작함
비슷한 상황이었음. Google은 모델 사용과 결제 사용자 경험을 정말 개선해야 함
내 해결책은 OpenRouter였음. 개발·테스트용 채팅에서 Google 모델로 이미지를 생성할 수 있고, 같은 프롬프트를 다른 모델들과 나란히 실행해 볼 수도 있음. 가벼운 이미지 생성에는 아주 편리함
나도 거의 같은 처지임. 개인용으로 One과 Workspace를 둘 다 내고 있는데, 이런 기능에 어느 쪽을 써야 할지 애매함
대체로 더 많은 맥락이 있는 개인 계정을 기본으로 쓰지만, 그러면 Workspace Drive 같은 자료를 가져오는 데 몇 단계가 더 필요함
그리고 Project Genie 같은 건 Workspace에서 아예 사용할 수 없는데, 꽤 이상하게 느껴짐
약간 노골적인 홍보지만, burlap은 Gemini Studio나 OpenAI의 키를 넣어서 웹 인터페이스를 건드리지 않고 이것저것 시험해 볼 수 있게 해줌. 그래서 만들었음 https://www.burlap.app/download
속도는 확실히 인상적임. 기본 NB2는 이미지당 약 30초인데, 이건 5초 미만으로 보임
아이들을 등장인물로 넣어 삽화가 있는 이야기를 만들어 주는 앱을 만들었음. 삽화 스타일은 유지하면서도 아이들의 닮은꼴을 우선하고 싶었음
여러 모델을 테스트했지만, 스타일화한 상태에서 닮은꼴을 유지하는 데 이만큼 가까운 모델은 없어 보임. 다른 모델들은 흔한 캐릭터처럼 만들어 버림
사용자가 최대한 빨리 “아하” 순간을 느끼게 하고 싶어서 앱 온보딩에 이 모델을 넣는 게 기대됨. 30초 이상 기다리는 건 이상적이지 않음
다만 실제 삽화에는 여전히 기본 NB2를 쓸 예정임. 이 Lite 버전은 다른 사람들이 말한 것처럼 뉘앙스와 일관성에서 아직 약간 문제가 있음
비슷한 걸 시도했는데, 어린이와 관련된 건 할 수 없다는 오류가 떴음. 그게 바뀐 건가?
비교 차트에 ChatGPT를 넣지 않았음. 그 자체로 많은 걸 말해줌
그건 짚을 만함. 모르는 사람을 위해 말하면, ChatGPT Image 2는 ELO가 1387로 터무니없이 높고, 2위 모델 1273보다 100점 이상 높음(https://arena.ai/leaderboard/text-to-image)
대신 지연 시간이 문제고, ChatGPT Image 2의 High 설정은 1024x1024에서 약 2분으로 느림
어느 쪽이든 이 차트에 넣었으면 차트를 쓸모없게 왜곡했을 것임
ChatGPT Image 2에 대한 글을 쓰고 싶지만, 이제 사람들은 세밀한 이미지 생성에는 관심이 없는 것 같음. 기존 테스트에서는 ChatGPT Image 2가 전부 압도하는데도 그렇다
Grok의 이미지 모델이 여기서 강조한 거의 모든 지표에서 Nano Banana를 이긴다는 게 좀 놀라움
정말 그런가? 내가 못 본 게 있나? 첫째로는 사실이 아닌 것 같고, Lite가 아닌 버전들은 전반적으로 Grok을 이기는 듯함
둘째로 이건 애초에 저비용 대량 생성 모델이지 최첨단 프런티어 모델이 아니므로, 벤치마크가 낮은 건 당연함
Nano Banana Pro가 마음에 들었음. 아직 로컬 대안이 있나? Qwen Image, Klein, 최근 Krea 얘기를 들었는데 추천할 만한 게 궁금함
Krea-2는 훌륭함. 제한적인 라이선스, 출력 속도, JSON 프롬프팅을 감수할 수 있다면 Ideogram 4가 최첨단 모델에 아마 가장 가까움
내 프로필의 GenAI Showdown을 보면 로컬 및 독점 모델들과 비교 벤치마크가 있음
실제로 Gemini 2.5, 즉 원래 NB보다 높은 점수를 냈는데 꽤 인상적임
Krea는 좋음. 공개 최첨단 모델에 대한 정보는 r/StableDiffusion을 보면 됨
이미지 생성 쪽은 많이 뒤처져 있어서, 가끔 역할극 토큰이나 장난, 개인용 임시 자산 만들 때만 씀. 내 기준에서는 이건 미친 수준임
2초 정도에 이미지를 만들 수 있음. 예전에는 ChatGPT로 같은 품질 이미지를 만들려면 30초에서 1분 걸렸음
여기 부정적인 반응이 이해가 안 됨
그래도 ChatGPT의 디테일이 훨씬 좋음. Nano Banana가 따라잡지 못하는 복잡한 6컷 만화 같은 것도 만들 수 있음
그리고 부정적인 반응 상당수는 AI 아트라는 개념 자체를 싫어해서 실패하길 바라는 사람들에게서 나옴
쓰임새가 다름.
이미지 자체가 중심인 작업을 하는 사람들은 이미지당 더 많은 비용을 쓰고 싶어함
반면 이미지가 보고서의 일부거나 버릴 결과물, 데모에 들어가는 경우라면 저렴한 접근이 더 나음
이 페이지의 “hands on” 섹션에 나온 실시간 프로토타입 같은 건 어떻게 얻는지 궁금함
gemini.g에서는 캔버스를 추가하거나 이미지 생성을 쓸 수는 있는데, “space lift” 프롬프트를 어디에 넣어야 데모처럼 나오는지 잘 모르겠음
와, 지연 시간이 엄청나게 줄었음. 이 정도면 몇몇 활용 사례가 새로 열릴 텐데, 링크된 웹페이지는 모델 간 차이를 이해하기 쉽게 설명하진 않음
다만 일반 이미지 모델을 써본 개인 경험으로는, 내 작업 흐름에서는 Google이 가장 좋다고 봄. 물론 극동권 제공업체들은 아직 써보지 않았음
다른 사람들은 어떻게 생각하는지 궁금함
AI 자동 생성 콘텐츠
본 콘텐츠는 GeekNews의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기