본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

Google DeepMind 95필터 해제

DeepMind헤드라인

Veo 3.1 출시: Flow의 창작 기능과 오디오 제어 강화

AI 비디오 제작 도구인 Flow가 대규모 업데이트를 발표했습니다. 핵심은 최신 모델인 Veo 3.1을 도입하고, 기존 기능 전반에 걸쳐 오디오 지원을 강화한 것입니다. 사용자는 이제 'Ingredients to Video', 'Frames to Video', 'Extend' 같은 기능을 활용하여 시각적 요소뿐만 아니라 풍부하게 생성된 오디오까지 제어하며 장면을 구성할 수 있습니다. 또한, 'Insert'와 'Remove' 같은 새로운 편집 기능을 통해 영상 내 특정 요소를 추가하거나 제거하는 등 더욱 정교한 스토리텔링이 가능해졌고

4월 23일2
DeepMind헤드라인

Gemini 2.5 Computer Use 모델 출시: UI 상호작용 에이전트 시대 개막

Google DeepMind가 새로운 전문 모델인 Gemini 2.5 Computer Use를 발표했습니다. 이 모델은 Gemini 2.5 Pro의 시각 이해 및 추론 능력을 기반으로 하며, 사용자가 웹사이트나 애플리케이션의 사용자 인터페이스(UI)와 직접 상호작용하는 에이전트 구축을 가능하게 합니다. 기존 API 방식으로는 처리하기 어려웠던 양식 작성, 드롭다운 메뉴 조작 등 인간과 유사한 복잡한 디지털 작업을 수행할 수 있게 되었습니다. 이 모델은 반복적인 루프를 통해 스크린샷과 사용자 요청을 분석하고 클릭, 타이핑 등의 함수(

4월 23일2
DeepMind중요헤드라인

최고 성능의 차분 프라이버시 LLM, VaultGemma 공개

본 글은 최고 수준의 성능을 갖춘 '차분 프라이버시 (Differential Privacy, DP)' 기반 대규모 언어 모델(LLM)인 VaultGemma를 소개합니다. AI에 사생활 보호 기능을 핵심으로 통합하는 것이 중요해지면서, 연구진은 DP가 LLM 학습에 미치는 트레이드오프를 분석했습니다. 이들은 '차분 프라이버시 스케일링 법칙 (Scaling Laws for Differentially Private Language Models)'을 수립하여 컴퓨팅 자원, 프라이버시 예산, 데이터 예산 간의 최적 조합을 제시했습니다. 그에

4월 23일2
DeepMind중요헤드라인

초경량 AI 구현의 핵심: Gemma 3 270M 모델 소개

Google DeepMind가 개발한 새로운 경량 언어 모델, Gemma 3 270M이 공개되었습니다. 이 모델은 이름처럼 작고(2억 7천만 개 파라미터), 특정 작업에 최적화된 '컴팩트' 아키텍처를 가졌습니다. 기존의 거대한 범용 모델 대신, 이 모델을 활용하여 텍스트 분류나 데이터 추출 같은 전문적인 태스크에 맞게 미세 조정(fine-tuning)할 수 있습니다. 이를 통해 개발자들은 빠르고 비용 효율적이며 운영이 간소화된 프로덕션 AI 시스템을 구축할 수 있습니다. Gemma 3 270M은 강력한 기본 성능과 함께, 다양한 소

4월 23일2
DeepMind중요헤드라인

AI 지능 측정의 새로운 패러다임: 게임 기반 벤치마크

기존의 AI 벤치마크는 모델이 단순히 데이터를 암기하는지, 아니면 실제로 문제를 해결하는지를 구분하기 어렵고 포화 상태에 이르렀습니다. 이에 DeepMind는 전략적 게임을 활용한 새로운 공공 평가 플랫폼인 'Kaggle Game Arena'를 소개합니다. 게임은 구조화되고 측정 가능한 결과를 제공하여, 모델의 전략적 추론 능력과 장기 계획 수립 능력을 검증하는 이상적인 환경입니다. Game Arena는 모든 모델 쌍 간의 경합(all-play-all system)을 통해 통계적으로 신뢰할 수 있는 성능 측정을 제공하며, 앞으로 바

4월 23일2
DeepMind헤드라인

AI와 융합 에너지: 차세대 핵융합 기술의 혁신적 발전

DeepMind는 글로벌 선도 기업인 Commonwealth Fusion Systems (CFS)와 파트너십을 체결하고, 인공지능(AI)을 활용하여 차세대 핵융합 에너지 개발에 박차를 가합니다. 태양의 에너지를 모방하는 핵융합은 청정하고 무한하며 장수명 방사성 폐기물이 없는 이상적인 에너지원입니다. 이 기술 실현의 핵심 난제는 1억 도 이상의 초고온 플라즈마(plasma)를 안정적으로 제어하는 것입니다. DeepMind는 기존에 심층 강화학습 (deep reinforcement learning)을 이용해 토카막(tokamak) 자석

4월 23일2
DeepMind중요헤드라인

코드 보안을 위한 AI 에이전트 CodeMender 소개

CodeMender는 코드의 보안 취약점을 자동으로 검증하고 수정하는 AI 에이전트입니다. 단순히 코드를 패치하는 것을 넘어, 근본적인 원인(root cause)을 파악하여 기능적으로 정확하며 회귀(regression)를 일으키지 않는 고품질의 패치를 제안합니다. 이를 위해 정적 분석 (static analysis), 동적 분석 (dynamic analysis), 퍼징 (fuzzing) 등 다양한 고급 프로그램 분석 기법과 다중 에이전트 시스템을 활용합니다. CodeMender는 디버거, 소스 코드 브라우저 등의 도구를 사용하여 복

4월 23일2
DeepMind중요헤드라인

Gemini 3 Deep Think: 과학 연구 및 공학 난제 해결 능력 대폭 강화

Google이 전문 추론 모드인 Gemini 3 Deep Think를 주요 업데이트로 출시했습니다. 이 기능은 과학, 연구, 공학 분야의 복잡하고 명확한 가이드라인이 부족한 난제 해결에 초점을 맞췄습니다. 수학적 논리 오류 발견(예: 물리학 논문), 신소재 제작 방법 최적화(예: 결정 성장 레시피 설계) 등 실제 사례에서 그 성능을 입증했습니다. 또한, Humanity’s Last Exam 48.4%, ARC-AGI-2 84.6% 등의 최고 수준의 학술 벤치마크를 달성했으며, 3D 프린팅 파일 생성과 같은 실질적인 공학 응용까지 범

4월 23일3
DeepMind헤드라인

Gemini 로보틱스 1.5: AI 에이전트가 물리 세계로 진출하다

Google DeepMind의 Gemini 로보틱스 1.5는 인공지능(AI) 에이전트를 실제 물리 환경으로 확장하는 중요한 이정표를 제시했습니다. 이 업데이트는 단순한 소프트웨어 성능 향상을 넘어, AI가 복잡하고 예측 불가능한 현실 세계에서 자율적으로 임무를 수행할 수 있는 능력을 갖추었음을 의미합니다. Gemini 로보틱스는 다양한 작업을 학습하며 물리적 상호작용을 이해하고, 이를 통해 인간의 개입이 필요한 상황을 최소화하는 것을 목표로 합니다. 이는 AI가 단순한 디지털 보조 도구를 넘어, 실생활 문제 해결에 직접적으로 기여할

4월 23일2
DeepMind중요헤드라인

프론티어 안전 프레임워크(FSF) 3차 업데이트: 위험 관리 강화

DeepMind는 AI의 급격한 발전에 맞춰 '프론티어 안전 프레임워크 (Frontier Safety Framework, FSF)'를 세 번째 버전으로 대폭 업데이트했습니다. 이번 업데이트는 고도화된 AI 모델이 초래할 수 있는 위험을 식별하고 완화하는 데 중점을 둡니다. 주요 개선 사항으로는 악의적인 조작(harmful manipulation)에 대한 '임계 역량 수준 (Critical Capability Level, CCL)' 도입과, 정렬되지 않은 AI(misaligned AI)가 운영 시스템에 개입할 수 있는 미래 시나리오에

4월 23일2
DeepMind헤드라인

AI로 유체 역학의 난제 해결: 불안정 특이점 발견

본 연구는 AI 기술을 활용하여 수세기 동안 풀리지 않은 유체 역학(fluid dynamics)의 난제를 다루고 있습니다. 기존에는 이론적 한계를 파악하기 위해 '특이점(singularities)' 같은 가상의 상황을 설정해왔습니다. 이 논문에서는 새로운 수학적 특이점 계열을 제시하고, 특히 불안정(unstable)한 특이점을 체계적으로 발견하는 새로운 AI 방법을 소개했습니다. 이는 유체 운동을 설명하는 복잡한 방정식에 대한 이해를 높이고, 나아가 미해결 난제인 내비에-스토크스 (Navier-Stokes) 방정식을 포함한 분야의

4월 23일2
DeepMind중요헤드라인

Gemini, 국제 프로그래밍 대회에서 금메달급 성과 달성

Google DeepMind의 Gemini 모델이 국제 대학생 프로그래밍 경진대회(ICPC) 세계 결선전에서 뛰어난 성능을 보여 금메달 수준의 성과를 거두었습니다. 이 프로젝트는 여러 팀원들의 대규모 협업 결과물로, 특히 Gemini의 추론 및 코딩 능력을 활용한 'Gemini Deep Think for ICPC' 시스템이 핵심입니다. 성공적인 대회 참여와 높은 점수는 모델의 실질적인 문제 해결 능력과 복잡한 알고리즘 구현 역량을 입증했습니다. 이는 AI가 학술적이고 전문적인 영역에서도 인간 수준에 근접하는 강력한 잠재력을 가졌음을

4월 23일2
DeepMind중요헤드라인

AI 기반 기술로 우주 관측 정밀도 극대화

DeepMind는 새로운 AI 방법인 Deep Loop Shaping을 개발하여 중력파 관측소의 제어 시스템 안정성을 획기적으로 개선했습니다. 이 기술은 우주에서 발생하는 미세한 공간-시간의 파동(중력파)을 측정하는 데 필요한 민감한 장비의 노이즈를 대폭 줄이고 제어 정밀도를 높입니다. Deep Loop Shaping은 LIGO와 같은 관측소의 불안정한 피드백 루프에서 노이즈 레벨을 30~100배 감소시켜, 천문학자들이 우주의 역동적인 과정과 근본 물리학 이론을 이해하는 데 필수적인 데이터를 더 많이, 그리고 더 정밀하게 수집할 수

4월 23일2
DeepMind중요헤드라인

Genie 3: 월드 모델을 통한 새로운 창작의 지평

Google DeepMind가 발표한 Genie 3는 '월드 모델(World Model)' 기술의 진보를 보여주는 프로젝트입니다. 이 모델은 사용자의 입력에 따라 가상 세계를 생성하고, 그 안에서 다양한 상호작용을 시뮬레이션할 수 있게 합니다. 기존의 AI 모델들이 정적인 콘텐츠 생성을 넘어, 동적이고 시간의 흐름이 있는 환경 자체를 구축하는 단계로 나아갔음을 의미합니다. Genie 3는 단순히 이미지를 만드는 것을 넘어, 마치 게임처럼 플레이 가능한 세계를 만들어냄으로써, 차세대 인터랙티브 미디어와 시뮬레이션 분야에 혁신을 가져올

4월 23일2
DeepMind헤드라인

AI 기반 고대 비문 해석 모델 'Aeneas' 소개

DeepMind가 발표한 Aeneas는 고대 비문을 맥락적으로 분석하는 최초의 AI 모델입니다. 로마 시대의 방대한 양의 일상생활 기록물인 비문들은 정치적 낙서부터 개인적인 메모까지 다양한 정보를 담고 있지만, 대부분 파편적이거나 훼손되어 있어 해석이 어렵습니다. Aeneas는 이러한 고대 비문을 다루는 역사학자들의 전통적인 '유사 사례(parallels)' 찾기 과정을 혁신적으로 가속화합니다. 이 모델은 수천 개의 라틴어 비문 전체를 학습하여, 텍스트적 유사성뿐 아니라 맥락적 정보까지 순식간에 검색해 제공함으로써, 학자들이 고대사

4월 23일2
DeepMind중요헤드라인

Gemini의 'Deep Think' 기능, IMO 금메달 수준 달성

Google DeepMind가 개발한 Gemini 모델에 'Deep Think' 기능을 통합하여 국제 수학 올림피아드(IMO)의 금메달 수준에 도달했음을 발표했습니다. IMO는 1959년부터 매년 개최되는 세계 최고 권위의 젊은 수학자 경연 대회입니다. 참가국들은 대수학, 조합론, 기하학, 정수론 등 네 분야에서 출제된 매우 어려운 여섯 문제를 해결하기 위해 경쟁합니다. 이번 성과는 AI가 인간 수준의 고난도 추론 및 문제 해결 능력을 갖추었음을 보여주는 중요한 이정표로 평가됩니다.

4월 23일2
DeepMind중요헤드라인

딥마인드, 미국 에너지부와 협력해 과학 혁신 가속화 지원

구글 딥마인드는 미국의 국가적 과학 혁신 계획인 '제네시스 미션(Genesis Mission)'을 지원하며 미국 에너지부(DOE)와 협력합니다. 이 파트너십은 인공지능(AI) 기술을 활용하여 에너지, 신소재, 국방 등 국가적으로 중요한 난제 해결 속도를 높이는 것을 목표로 합니다. 딥마인드는 현재 모든 DOE 국립 연구소의 과학자들에게 최첨단 AI 모델과 에이전트 도구를 제공하고 있으며, 이를 통해 가설 생성부터 연구 제안까지의 과정을 단축합니다. 향후에는 알파에볼브(AlphaEvolve), 알파게놈(AlphaGenome) 등 전문

4월 23일2
DeepMind중요헤드라인

AI 안전 강화를 위한 영국 기관과의 협력 확대 발표

Google DeepMind는 영국 AI 보안 연구소(UK AI Security Institute, AISI)와의 파트너십을 대폭 강화한다고 발표했습니다. 이번 협력은 단순 모델 테스트를 넘어, 기초적인 안전 및 책임 연구 전반으로 확대됩니다. 이들은 독점 모델과 데이터를 공유하고 공동 보고서를 발간하며, 기술적 논의를 통해 복잡한 안전 문제를 해결할 계획입니다. 주요 연구 분야로는 AI 추론 과정 모니터링(Chain-of-Thought Monitoring), 사회/감정 영향 평가, 그리고 경제 시스템 영향 분석 등이 포함됩니다.

4월 23일2
DeepMind중요헤드라인

Gemini 2.5 Flash로 진화한 음성 AI: 대화 및 통역 기능 강화

Google이 Gemini 2.5 Flash Native Audio 모델을 업데이트하여 라이브 음성 에이전트와 글로벌 커뮤니케이션 기능을 크게 향상시켰습니다. 이번 개선으로 AI는 복잡한 워크플로우 처리, 사용자 지침 준수, 자연스러운 대화 흐름 유지 능력이 강화되었습니다. 또한, Google 번역 앱에 실시간 음성 통역 기능(Live speech translation)이 베타로 출시되어 화자의 억양과 속도를 보존하며 70개 이상의 언어를 지원합니다. 개발자들은 Vertex AI를 통해 이 강력한 기능을 활용하여 차세대 기업용 고객

4월 23일2
DeepMind중요헤드라인

Gemma Scope 2 공개: LLM 내부 작동 원리 분석 도구

DeepMind가 모든 Gemma 3 모델 크기(270M~27B)를 지원하는 포괄적인 해석 가능성(Interpretability) 도구 모음인 'Gemma Scope 2'를 공개했습니다. 이 도구는 LLM의 내부 결정 과정을 투명하게 분석하여, 시스템이 예상대로 작동하지 않을 때 그 원인을 정확히 파악할 수 있게 합니다. Gemma Scope 2는 Sparse Autoencoders (SAEs)와 transcoders를 결합하여 모델의 '사고 과정'을 들여다보게 하며, 해킹(jailbreaks), 환각(hallucinations)과

4월 23일2

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.