Nano Banana 2 Lite

집 인테리어 생성 첫 예시는 형언하기 어려울 정도로 싫음. 요즘 부동산 중개인들이 낡고 안 팔리는 아파트를 전부 AI 필터에 넣어 돌려서, 실제로 어떤 끔찍한 물건을 터무니없는 가격에 팔려는지 보기 전에 “이케아풍으로 꾸미면 이렇게 보일 수도 있다”는 이미지 수십 장을 먼저 넘겨야 함

이런 건 불법적인 허위 표시로 봐야 한다고 생각함. AI 사용에는 회색지대가 너무 많음

거의 사기에 가깝다고 봄. Streeteasy에서 어떤 아파트는 책상, 서랍장, 퀸 침대를 모두 ‘넣은’ 것처럼 보였는데, 이미지 모델이 현실에는 존재하지 않는 비율로 가구를 그냥 축소한 게 뻔했음
실제 침실에는 퀸 침대 하나만 겨우 들어갈 수 있었음 ;(

아파트 실제 모습 자체를 속이는 건 사회적으로든 법적으로든 받아들일 수 없어야 한다는 데 100% 동의함. 다만 내 욕실 리모델링에서 이미지 모델은 디자인 선택에 꽤 도움이 됐음
특히 어떤 부분에 타일을 붙였을 때 전체 공간이 어떻게 보일지 직접 상상하기 어려운 경우에 유용했음

내가 사는 NYC에서는 그런 보정 이미지를 올리는 게 10년도 넘게 일반적이었음
예전에는 그런 작업을 해줄 사람을 고용하는 비용이 더 비쌌을 뿐임
보정된 이미지는 늘 똑같이 밝은 벽과 회색 잡지풍 가구를 보여줌
AI가 더 싸게 만들었을 뿐, 결국 이렇게 될 수밖에 없었음
이런 식으로 보정된 이미지는 보정 사실을 알리는 작은 워터마크가 붙어 있긴 함

좋은 사진가만 있어도 효과가 엄청남. 친구가 집을 팔 때 매물 사진에서 집이 얼마나 좋아 보이는지, 또 내가 작지 않다는 걸 아는데도 얼마나 커 보이는지 보고 놀랐음 AI 필터가 나오기 전에도 있던 문제라 새롭지는 않지만, 지금은 훨씬 더 심해지고 비용도 낮아졌음

이 모델을 테스트할 수 있는 조기 접근 권한을 받았음. 업무를 통해서였고, Google이 개인적으로 나를 좋아하게 된 건 여전히 아님 lol
여기서 광고한 대로 동작하고, 좋은 텍스트 렌더링 같은 요소에서는 Nano Banana 2를 증류한 버전처럼 보임. Nano Banana 1은 이 부분이 훨씬 약함
물론 세밀한 프롬프트에서는 기본 Nano Banana 2 수준은 전혀 아님. 가장 큰 불만은 NB2에서는 프로그래밍으로 화면비를 강제할 수 있는데 NB2L에서는 안 된다는 점임
다만 이미지당 $0.034라는 가격은 예상보다 높음. 보통 가격은 생성 시간과 연관되는데, Nano Banana 1보다 절반 시간에 생성하면서도 Nano Banana 1은 이미지당 $0.039임
NB1 파이프라인을 NB2L로 바로 대체할 수 있다는 Google의 주장은 타당함
어제 Google은 Gemini 앱에서 무료 이미지 생성을 허용한다고 발표했지만(https://blog.google/innovation-and-ai/products/gemini-app/pe...), 어떤 모델을 쓰는지는 명시하지 않았음. Nano Banana 2 Lite의 주된 동기가 여기에 있다고 봄

Vertex를 통해 NB2 Lite에서도 프로그래밍으로 화면비를 설정할 수 있음 [1]. GenAI Showdown용 이미지를 만들 때 쓰는 프로그램을 업데이트해서 모델 ID를 gemini-3.1-flash-lite-image로 바꿨고, 16:9, 4:3 같은 화면비를 사용할 수 있었음
[1] - https://cloud.google.com/developers/vertex-ai

어떤 업무를 하길래 자동 이미지 생성을 대규모로 해야 하는지 궁금함

괜찮긴 한데 Google의 망가진 AI Studio 위에 있음. 거기 기능 절반은 Google One 계정이 필요해서 못 씀
나는 Workspace 계정이라 자격이 안 되고, 전환도 못 함. Google One은 자체 도메인을 지원하지 않기 때문임
그럼 멋진 이메일 주소와 Banana를 둘 다 쓰려면 계정 두 개를 운영하고 비용까지 내야 하나? 여기서 맞는 유료 Google 계정 수는 0개라는 생각이 들기 시작함

비슷한 상황이었음. Google은 모델 사용과 결제 사용자 경험을 정말 개선해야 함
내 해결책은 OpenRouter였음. 개발·테스트용 채팅에서 Google 모델로 이미지를 생성할 수 있고, 같은 프롬프트를 다른 모델들과 나란히 실행해 볼 수도 있음. 가벼운 이미지 생성에는 아주 편리함

나도 거의 같은 처지임. 개인용으로 One과 Workspace를 둘 다 내고 있는데, 이런 기능에 어느 쪽을 써야 할지 애매함
대체로 더 많은 맥락이 있는 개인 계정을 기본으로 쓰지만, 그러면 Workspace Drive 같은 자료를 가져오는 데 몇 단계가 더 필요함
그리고 Project Genie 같은 건 Workspace에서 아예 사용할 수 없는데, 꽤 이상하게 느껴짐

약간 노골적인 홍보지만, burlap은 Gemini Studio나 OpenAI의 키를 넣어서 웹 인터페이스를 건드리지 않고 이것저것 시험해 볼 수 있게 해줌. 그래서 만들었음 https://www.burlap.app/download

속도는 확실히 인상적임. 기본 NB2는 이미지당 약 30초인데, 이건 5초 미만으로 보임
아이들을 등장인물로 넣어 삽화가 있는 이야기를 만들어 주는 앱을 만들었음. 삽화 스타일은 유지하면서도 아이들의 닮은꼴을 우선하고 싶었음
여러 모델을 테스트했지만, 스타일화한 상태에서 닮은꼴을 유지하는 데 이만큼 가까운 모델은 없어 보임. 다른 모델들은 흔한 캐릭터처럼 만들어 버림
사용자가 최대한 빨리 “아하” 순간을 느끼게 하고 싶어서 앱 온보딩에 이 모델을 넣는 게 기대됨. 30초 이상 기다리는 건 이상적이지 않음
다만 실제 삽화에는 여전히 기본 NB2를 쓸 예정임. 이 Lite 버전은 다른 사람들이 말한 것처럼 뉘앙스와 일관성에서 아직 약간 문제가 있음

비슷한 걸 시도했는데, 어린이와 관련된 건 할 수 없다는 오류가 떴음. 그게 바뀐 건가?

비교 차트에 ChatGPT를 넣지 않았음. 그 자체로 많은 걸 말해줌

그건 짚을 만함. 모르는 사람을 위해 말하면, ChatGPT Image 2는 ELO가 1387로 터무니없이 높고, 2위 모델 1273보다 100점 이상 높음(https://arena.ai/leaderboard/text-to-image)
대신 지연 시간이 문제고, ChatGPT Image 2의 High 설정은 1024x1024에서 약 2분으로 느림
어느 쪽이든 이 차트에 넣었으면 차트를 쓸모없게 왜곡했을 것임
ChatGPT Image 2에 대한 글을 쓰고 싶지만, 이제 사람들은 세밀한 이미지 생성에는 관심이 없는 것 같음. 기존 테스트에서는 ChatGPT Image 2가 전부 압도하는데도 그렇다

Grok의 이미지 모델이 여기서 강조한 거의 모든 지표에서 Nano Banana를 이긴다는 게 좀 놀라움

정말 그런가? 내가 못 본 게 있나? 첫째로는 사실이 아닌 것 같고, Lite가 아닌 버전들은 전반적으로 Grok을 이기는 듯함
둘째로 이건 애초에 저비용 대량 생성 모델이지 최첨단 프런티어 모델이 아니므로, 벤치마크가 낮은 건 당연함

Nano Banana Pro가 마음에 들었음. 아직 로컬 대안이 있나? Qwen Image, Klein, 최근 Krea 얘기를 들었는데 추천할 만한 게 궁금함

Krea-2는 훌륭함. 제한적인 라이선스, 출력 속도, JSON 프롬프팅을 감수할 수 있다면 Ideogram 4가 최첨단 모델에 아마 가장 가까움
내 프로필의 GenAI Showdown을 보면 로컬 및 독점 모델들과 비교 벤치마크가 있음
실제로 Gemini 2.5, 즉 원래 NB보다 높은 점수를 냈는데 꽤 인상적임

Krea는 좋음. 공개 최첨단 모델에 대한 정보는 r/StableDiffusion을 보면 됨

이미지 생성 쪽은 많이 뒤처져 있어서, 가끔 역할극 토큰이나 장난, 개인용 임시 자산 만들 때만 씀. 내 기준에서는 이건 미친 수준임
2초 정도에 이미지를 만들 수 있음. 예전에는 ChatGPT로 같은 품질 이미지를 만들려면 30초에서 1분 걸렸음
여기 부정적인 반응이 이해가 안 됨

그래도 ChatGPT의 디테일이 훨씬 좋음. Nano Banana가 따라잡지 못하는 복잡한 6컷 만화 같은 것도 만들 수 있음
그리고 부정적인 반응 상당수는 AI 아트라는 개념 자체를 싫어해서 실패하길 바라는 사람들에게서 나옴

쓰임새가 다름.
이미지 자체가 중심인 작업을 하는 사람들은 이미지당 더 많은 비용을 쓰고 싶어함
반면 이미지가 보고서의 일부거나 버릴 결과물, 데모에 들어가는 경우라면 저렴한 접근이 더 나음

이 페이지의 “hands on” 섹션에 나온 실시간 프로토타입 같은 건 어떻게 얻는지 궁금함
gemini.g에서는 캔버스를 추가하거나 이미지 생성을 쓸 수는 있는데, “space lift” 프롬프트를 어디에 넣어야 데모처럼 나오는지 잘 모르겠음

와, 지연 시간이 엄청나게 줄었음. 이 정도면 몇몇 활용 사례가 새로 열릴 텐데, 링크된 웹페이지는 모델 간 차이를 이해하기 쉽게 설명하진 않음
다만 일반 이미지 모델을 써본 개인 경험으로는, 내 작업 흐름에서는 Google이 가장 좋다고 봄. 물론 극동권 제공업체들은 아직 써보지 않았음
다른 사람들은 어떻게 생각하는지 궁금함

Insights

Nano Banana 2 Lite

요약

핵심 포인트

댓글

AI 채팅 상태 관리를 위한 Angular Signals (2026)

Rule of 40은 하드웨어에도 적용될까?

Anthropic의 인용

AI 채팅 상태 관리를 위한 Angular Signals (2026)

Rule of 40은 하드웨어에도 적용될까?

Anthropic의 인용