Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
Google DeepMind 95건필터 해제

GoogleDeepMind가 최신 이미지 생성 모델인 'Nano Banana 2'를 공개하며, 속도와
Google DeepMind가 새로운 이미지 생성 모델 'Nano Banana 2'를 출시했습니다. 이 모델은 기존의 고급 기능(Pro)과 Gemini Flash의 초고속 처리 능력을 결합한 것이 특징입니다. 사용자는 이제 빠르고 쉽게 고품질 이미지를 생성하고 수정할 수 있습니다. 주요 개선점으로는 실시간 웹 검색 기반의 심층적인 세계 지식 활용, 정확한 텍스트 및 번역 기능 구현, 그리고 최대 5개 캐릭터와 14개 객체의 일관성을 유지하는 향상된 제어 능력이 포함됩니다. 또한, Google은 AI 생성 콘텐츠 식별을 위해 'Syn

대규모 워크로드에 최적화된 AI, Gemini 3.1 Flash-Lite 출시
Google이 대용량 워크로드에 특화된 새로운 AI 모델, Gemini 3.1 Flash-Lite를 공개했습니다. 이 모델은 Google AI Studio와 Vertex AI를 통해 개발자 및 기업에게 프리뷰로 제공됩니다. 가장 큰 장점은 뛰어난 비용 효율성과 속도입니다. 입력 토큰당 $0.25, 출력 토큰당 $1.50의 저렴한 가격으로 2.5 Flash보다 훨씬 빠르며, 응답 시간(Time to First Answer Token)이 2.5배 더 빠르고 출력 속도는 45% 향상되었습니다. 또한, Gemini 3.1 Flash-Lte
10년전, 알파고(AlphaGo)가 바둑 세계 챔피언을 이긴 사건은 단순한 게임 승리를 넘어 현대 AI
10년 전, 알파고(AlphaGo)는 바둑 세계 챔피언을 이기며 인공지능(AI)의 새로운 시대를 열었습니다. 초기 성공은 단순한 게임 승리를 넘어, AI가 현실 과학 문제 해결에 적용될 수 있음을 증명했습니다. 이후 개발된 알파제로(AlphaZero)와 알파폴드(AlphaFold)는 이러한 잠재력을 극대화했습니다. 특히 알파폴드는 단백질 구조 예측이라는 50년 난제를 해결하며 생물학 분야에 혁명을 일으켰고, 수학적 추론이나 알고리즘 발견 등 다양한 영역에서 AI의 역할을 확장하고 있습니다. 이는 AGI(Artificial Super

GoogleDeepMind는 인공일반지능(AGI)의 잠재력을 측정하기 위한 새로운 인지적 프레임워크를
Google DeepMind는 인공일반지능(AGI)에 도달하는 과정을 객관적으로 측정하기 위한 새로운 인지적 프레임워크를 발표했습니다. 이 프레임워크는 심리학, 신경과학 등 여러 학문의 연구 결과를 바탕으로 10가지 핵심 인지 능력을 정의합니다. 주요 능력으로는 지각(Perception), 생성(Generation), 주의(Attention), 학습(Learning), 기억(Memory), 추론(Reasoning), 메타인지(Metacognition) 등이 포함됩니다. 단순히 이론에 머무르지 않고, 이 프레임워크를 실제 적용하기에,
Google이최신 음악 생성 모델인 Lyria 3 Pro를 공개하며 창작자들에게 새로운 가능성을
Google이 최신 음악 생성 모델인 Lyria 3 Pro를 공개하며, 사용자들이 더 길고 복잡한 구조의 음악을 만들 수 있도록 기능을 대폭 확장했습니다. Lyria 3 Pro는 최대 3분 길이의 트랙 생성이 가능하며, 인트로(intro), 벌스(verse), 코러스(chorus) 등 곡의 특정 구성 요소를 지정하여 높은 수준의 창작 통제가 가능해졌습니다. 이 모델은 Vertex AI를 통해 기업 단위로 확장되어 대규모 오디오 제작이 가능하며, Google AI Studio, Gemini 앱, Google Vids, Producer
AI모델의 대화 능력이 향상됨에 따라, 이 상호작용이 사람과 사회에 미치는 영향에 대한 심층적인 검토가
본 보고서는 AI 모델이 자연스러운 대화 능력을 갖추면서 발생할 수 있는 '유해한 조작(Harmful Manipulation)' 위험에 대한 최신 연구 결과를 발표합니다. 유해한 조작이란, 사실과 증거가 아닌 감정적/인지적 취약점을 악용하여 사람들의 생각이나 행동을 부정적이고 속이는 방식으로 변화시키는 것을 의미합니다. DeepMind는 이를 측정하기 위해 영국, 미국, 인도 등지에서 10,000명 이상의 참가자를 대상으로 금융 및 건강과 같은 고위험 환경 시뮬레이션을 진행했습니다. 연구 결과, AI가 조작에 성공하는 정도(Efic

Google은 최고 품질의 오디오 및 음성 모델인 Gemini 3
Google이 최고 품질의 오디오 모델인 Gemini 3.1 Flash Live를 공개하며, 실시간 대화형 AI 경험을 혁신했습니다. 이 모델은 향상된 정밀도와 낮은 지연 시간(latency)을 자랑하며, 더욱 자연스럽고 직관적인 음성 상호작용이 가능하게 합니다. 개발자들은 이를 Gemini Live API를 통해 활용하여 복잡한 작업을 수행하는 음성 에이전트를 구축할 수 있으며, 기업 고객 경험(CX) 분야에서도 높은 신뢰성을 제공합니다. 일반 사용자들에게는 Search Live와 Gemini Live에 적용되어 200개국 이상을

Google DeepMind가 가장 지능적인 오픈 모델인 'Gemma 4'를 발표했습니다
Google DeepMind가 최고 수준의 지능을 갖춘 오픈 모델 'Gemma 4'를 공개했습니다. Gemma 4는 Gemini와 같은 기술 기반으로 개발되었으며, 2B부터 31B까지 다양한 크기로 제공되어 사용자가 어떤 하드웨어 환경에서도 최첨단 AI 기능을 활용할 수 있도록 설계되었습니다. 이 모델은 단순한 채팅을 넘어 복잡한 논리 추론(Advanced reasoning), 함수 호출(Function-calling) 기반의 에이전트 워크플로우, 코드 생성 등 다양한 고급 작업을 지원합니다. 특히 31B 모델은 현재 오픈 모델 중
로봇이일상생활과 산업 현장에서 진정으로 유용하려면 단순한 지시 이행을 넘어 물리적 세계에 대한 '체화된
Gemini는 로봇이 단순한 명령어 수행을 넘어 실제 환경에서 '체화된 추론(embodied reasoning)'을 할 수 있도록 모델을 업그레이드했습니다. 새로운 Gemini Robotics-ER 1.6은 공간적 이해, 다중 시점 분석 능력을 크게 향상시켜 다음 세대 물리 에이전트의 자율성을 높였습니다. 이 모델은 시각/공간 이해, 작업 계획, 성공 감지 등 로봇에 필수적인 추론 기능을 제공하며, 구글 검색이나 VLA 같은 도구를 호출하여 작업을 수행합니다. 특히, 복잡한 계기판(gauge)을 읽는 '계측기 판독' 능력을 추가하여

Google이 최신 텍스트-음성 변환(TTS) 모델인 Gemini 3
Google이 새로운 텍스트-음성 변환(TTS) 모델인 Gemini 3.1 Flash TTS를 공개했습니다. 이 모델은 전반적인 음성 품질과 표현력이 크게 향상되어, 개발자와 기업 모두가 차세대 AI 음성 애플리케이션을 구축할 수 있게 합니다. 특히 '오디오 태그(audio tags)' 기능을 통해 자연어 명령만으로 목소리의 스타일, 속도, 전달 방식 등을 정밀하게 제어할 수 있습니다. 70개 이상의 언어를 지원하며, 모든 생성된 오디오에는 허위 정보 확산을 방지하기 위해 SynthID 워터마크가 삽입됩니다.
AI가 밝혀낸 심장병 핵심 단백질 구조
과학자들은 AI 도구인 AlphaFold를 활용하여 '나쁜 콜레스테롤'을 구성하는 주요 단백질, apoB100의 구조를 밝혀냈습니다. 이 발견은 심혈관 질환(ASCVD) 치료에 혁신적인 변화를 가져올 잠재력을 지니고 있습니다. ApoB100은 저밀도지단백 (LDL)의 핵심 구성 요소로, 혈액 내 지방 운반체이자 주요 위험 인자입니다. 기존에는 크기가 너무 크고 복잡하게 결합하는 특성 때문에 구조 규명이 어려웠습니다. 미주리 대학교(Mizzou)의 과학자들은 극저온 전자현미경 (cryo-EM)으로 얻은 데이터와 AlphaFold를 결
알파폴드, 생물학 연구의 새로운 지평을 열다
2020년, AlphaFold 2는 단백질 구조 예측이라는 50년간 난제였던 생물학적 문제를 해결하며 과학계에 혁명을 일으켰습니다. 단백질은 아미노산 사슬이 접혀서 기능을 수행하는 미세 기계 장치이며, 이 구조를 이해하는 것은 질병 진단 및 신약 개발의 핵심입니다. AlphaFold는 기존에는 수년이 걸리던 복잡한 단백질 구조 예측을 놀라운 정확도로 가능하게 했고, 이는 2024년 노벨 화학상 수상으로 인정받았습니다. 현재 전 세계 연구자들은 이 플랫폼을 활용하여 꿀벌 보존, 심장병 치료제 개발 등 실생활 문제 해결에 적용하고 있어
기후 변화와 지구 온난화가 심화되면서 주요 식량 작물의 수확량이 위협받고 있습니다
지구 온난화와 가뭄으로 인해 주요 식량작물의 수확량이 감소하고 있습니다. 이 문제는 단순히 환경적인 요인에 그치지 않고, 작물 내부의 분자 기계가 고온에서 손상되는 생리적 문제와도 관련됩니다. 연구진은 광합성에 필수적인 효소(glycerate kinase, GLYK)를 개선하여 열 스트레스에 강한 작물을 개발하는 데 집중했습니다. 이들은 AlphaFold 같은 AI 도구를 활용해 기존에는 실험적으로 구조 파악이 어려웠던 효소의 3차원 구조를 예측하고, 이를 분자 시뮬레이션에 적용했습니다. 그 결과, 고온에서 불안정해지는 특정 루프(
대규모언어 모델(LLMs)이 정보 전달의 핵심 수단으로 자리 잡으면서, 답변의 사실적 정확성을 확보하는
대규모 언어 모델(LLMs)이 정보 제공의 주요 수단으로 사용되면서 사실적 정확성 확보가 중요해졌습니다. 이에 DeepMind는 Kaggle과 협력하여 'FACTS Benchmark Suite'을 공개했습니다. 이 벤치마크는 기존 FACTS Grounding Benchmark를 업데이트한 v2와 함께, 모델의 능력을 다각도로 측정하는 네 가지 새로운 평가 영역을 포함합니다. 주요 테스트 항목으로는 내부 지식 기반 질문(Parametric), 웹 검색 도구 활용 능력(Search), 이미지 기반 질의응답(Multimodal) 등이 새
GoogleDeepMind는 영국 정부와의 파트너십을 강화하여 AI가 가져올 번영과 안보에 기여하고자
Google DeepMind는 영국 정부와 파트너십을 심화하여 AI 기술이 가져올 번영과 안보를 목표로 합니다. 이 협력은 과학, 교육, 공공 서비스 현대화, 국가 안보 강화 등 네 가지 핵심 분야에 집중됩니다. 특히 'AI for Science' 모델 접근성을 높여 AlphaFold 같은 시스템으로 생명과학 연구를 가속하고, 2026년 영국 내 최초의 자동화된 과학 실험실을 설립할 예정입니다. 교육 분야에서는 Gemini가 교사들의 행정 업무 부담을 줄이고 학생 학습 효과를 높이는 데 기여하며, 공공 서비스에는 계획 문서 디지털화
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.