Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
SoftBank가 이 영국 AI 칩 기업에 4억 5,000만 달러를 투입했습니다
일본의 투자 거물 SoftBank가 영국 기반의 AI 칩 개발 기업 Graphcore에 4억 5,700만 달러 규모의 자금을 투입했습니다. 이 자금은 Graphcore가 인공 일반 지능(AGI) 개발을 목표로 SoftBank와 협력하는 과정에서 나온 것으로 보입니다. SoftBank는 OpenAI 및 Oracle과의 대규모 프로젝트 참여 등 AI 인프라 분야에 지속적으로 막대한 투자를 진행하고 있으며, 향후 미국 내 독립적인 AI 기업 설립 및 프랑스 데이터 센터 프로젝트 논의도 진행 중인 것으로 알려졌습니다.
jakevdp/PythonDataScienceHandbook
이 저장소는 Python Data Science Handbook 전체 내용을 Jupyter notebooks 형태로 무료로 제공합니다. 사용자는 온라인 링크, Google Colab, 또는 binder를 통해 코드를 실행할 수 있으며, 이 책은 IPython, NumPy, Pandas, Matplotlib, Scikit-Learn 등 데이터 과학에 필수적인 핵심 라이브러리를 다룹니다.
NVIDIA가 Hugging Face에 AnyFlow를 출시했습니다
NVIDIA가 Hugging Face에 AnyFlow라는 새로운 텍스트-투-비디오(text-to-video) 확산 모델을 출시했습니다. 이 모델은 추론 예산과 관계없이 고품질의 비디오를 생성할 수 있는 최초의 any-step 비디오 확산 모델로, 단계 수(예: 4단계 또는 50단계)가 변해도 품질 저하 없이 매끄럽게 확장되는 것이 특징입니다.
이스라엘의 AI 표적 시스템 내부: 휴대폰 데이터가 어떻게 사형 선고가 되는가
이스라엘 군은 스마트폰 데이터, 드론, 소셜 미디어 등 다양한 출처의 데이터를 융합하여 Hezbollah(헤즈볼라) 표적을 식별하는 AI 기반 시스템을 운용하고 있습니다. 이 시스템은 방대한 데이터 파이프라인을 통해 개인의 위치, 관계, 활동을 추적하며, 전문가들은 이러한 알고리즘 기반의 표적 지정이 민간인을 오인할 위험이 있다고 경고합니다.
Large Language Models의 긴 문맥 추론을 위한 On-Policy 최적화와 증류(Distillation)의 결합
본 논문은 LLM의 긴 문맥 추론 능력을 향상시키기 위해 On-policy 증류와 GRPO를 결합한 dGRPO 방법론을 제안합니다. 기존 Off-policy 방식의 노출 편향 문제와 On-policy 방식의 낮은 샘플 효율성 문제를 동시에 해결하며, 이를 검증하기 위한 합성 데이터셋인 LongBlocks를 함께 소개합니다.
연산 및 메모리 가격 상승으로 인해 IT 지출이 훨씬 더 높아짐
연산 및 메모리 부품의 수요 급증과 공급 부족으로 인해 IT 지출이 역대 최고치를 기록할 전망입니다. 특히 GenAI 열풍으로 인해 Anthropic, OpenAI와 같은 AI 모델 구축 기업들의 인프라 투자가 가속화되면서, 데이터센터 시스템 지출이 폭발적으로 성장하고 있습니다.
LISA: 신호 없는 자율 교차로 관리를 위한 인지적 중재 (Cognitive Arbitration)
LISA는 LLM을 활용하여 차량의 의도를 추론하고 신호등 없이 자율적으로 교차로를 관리하는 인지적 중재 프레임워크입니다. 기존 시스템이 신호 인프라에 의존하거나 의도 인식이 부족했던 한계를 극복하여, 대기 시간을 획기적으로 줄이고 연료 소비를 절감하는 성능을 입증했습니다.
지도 미세 조정 (Supervised Finetuning)된 모델로부터 개인 식별 정보 (PII)의 재구성
본 논문은 지도 미세 조정(SFT)된 모델이 학습 데이터에 포함된 개인 식별 정보(PII)를 유출할 수 있는 위험성을 처음으로 연구합니다. 의료 및 법률 분야의 다회차 Q&A 데이터셋을 구축하여 공격자의 추론 능력을 평가하였으며, 기존 방식보다 뛰어난 성능을 보이는 새로운 디코딩 알고리즘인 COVA를 제안합니다.
Feature Association Map을 이용한 AI 설명 가능성을 위한 새로운 기술
AI 시스템의 투명성과 신뢰성을 높이기 위해 특징 집합의 그래프 이론적 정식화를 활용한 새로운 XAI 알고리즘인 FAMeX를 제안합니다. FAMeX는 특징 간의 연관성을 기반으로 하는 Feature Association Map(FAM)을 모델링의 기초로 삼습니다. 실험 결과, FAMeX는 분류 작업에서 기존의 PFI 및 SHAP보다 우수한 특징 중요도 측정 성능을 보여주었습니다.
DeepSeek-V4-Flash W4A16+FP8 with MTP self-speculation: 85 tok/s @ 524k on 2×
DeepSeek-V4-Flash 모델을 2개의 RTX PRO 6000 Max-Q 환경에서 구동했을 때, 524k 컨텍스트 길이에서 85.52 tok/s의 높은 처리 속도를 달성했습니다. 이 과정에서 MTP 헤드 로딩 문제와 vLLM의 CustomAllreduce 사용 시 발생하는 데드락 문제를 해결하기 위해 `--disable-custom-all-reduce` 플래그를 반드시 적용해야 합니다. 또한, 최적의 성능을 위해서는 특정 NCCL 튜닝과 패치된 vLLM 포크 사용이 필수적입니다.
MEME: 다중 개체 및 진화하는 메모리 평가
LLM 기반 에이전트가 여러 세션에 걸쳐 정보를 저장, 업데이트, 추론해야 하는 환경을 반영하여, MEME는 다중 개체 및 진화하는 메모리 공간을 포괄하는 여섯 가지 작업을 정의했습니다. 이 평가 결과, 모든 시스템은 기본 구성에서의 의존성 추론(Cascade 및 Absence)에서 성능 저하를 보였습니다. 이는 단순한 검색 성능만으로는 부족하며, 최적의 프롬프트 엔지니어링이나 강력한 LLM조차도 해결하기 어려운 근본적인 문제입니다.
퀄컴, 기록적인 AI 주가 상승세에 하락하며 11% 급락
반도체 섹터가 AI 관련 거래 확산에 따른 대규모 랠리 이후 조정 국면에 진입하며 하락세를 보였습니다. 퀄컴을 포함한 주요 반도체 기업들의 주가가 급락했으며, 이는 높은 소비자 물가 지표와 유가 상승으로 인한 투자자들의 위험 회피 심리가 복합적으로 작용한 결과입니다. 최근의 강세장은 LLM 기반 CPU 및 GPU 수요 증가에 힘입어 기록적인 수준까지 상승했었습니다.
테스트 시간 LLM 가이드를 통한 태스크 적응형 임베딩 정제
본 논문은 까다로운 제로샷 검색 및 분류 작업에서 임베딩 모델의 활용도를 높이기 위한 LLM 기반 쿼리 정제 패러다임을 제시합니다. 이 접근 방식은 소수의 문서를 이용해 생성형 LLM이 사용자 쿼리의 임베딩 표현을 정제하며, 이를 통해 임베딩이 특정 작업에 실시간으로 적응할 수 있게 합니다. 실험 결과, LLM 가이드 쿼리 정제는 다양한 벤치마크에서 일관되게 성능을 향상시키며, 특히 문헌 검색 및 의도 감지 분야에서 최대 +25%의 개선을 보였습니다.
Waymo, 일부 차량이 '고인 물로 진입'할 수 있는 결함으로 3,800대의 로보택시 리콜
Waymo는 소프트웨어 결함으로 인해 일부 로보택시가 침수된 도로로 진입할 수 있는 문제를 수정하기 위해 약 3,800대의 차량을 리콜합니다. 이 문제는 NHTSA의 조사와 최근 산 안토니오에서 개울로 쓸려 내려가는 사고를 계기로 자발적으로 이루어졌습니다. Waymo는 현재 서비스 재개를 준비하고 있으며, 과거에도 스쿨버스 양보 실패나 정전 사태에서의 성능 저하 등으로 비판을 받아온 바 있습니다.
AI 기반 워크플로우로 AutoScout24의 엔지니어링 확장
AutoScout24 Group은 대규모 온라인 자동차 마켓플레이스 운영 과정에서 증가하는 시스템 복잡성과 혁신 요구에 대응하기 위해 AI 기반의 엔지니어링 확장 전략을 도입했습니다. 이들은 ChatGPT를 전 직원에게 배포하여 광범위한 AI 리터러시를 확립하고, Codex를 핵심 빌더들에게 통합하여 코딩 에이전트 역할을 수행하게 했습니다. 이러한 '이중 계층' 접근 방식은 개발 주기를 획기적으로 단축시키고 코드 품질을 개선하며, 비기술적 역할까지 혁신 속도를 높이는 데 기여했습니다.
LongMemEval-V2: 숙련된 동료를 위한 장기 에이전트 메모리 평가
LongMemEval-V2 (LME-V2)는 웹 에이전트가 전문적인 웹 환경에서 숙련된 동료처럼 행동하는 데 필요한 장기 메모리 능력을 평가하기 위해 개발된 새로운 벤치마크입니다. LME-V2는 정적 상태 회상, 동적 상태 추적 등 다섯 가지 핵심 메모리 능력을 다루며, 최대 500개의 트래젝토리와 115M 토큰의 히스토리 트래젝토리를 포함합니다. 연구진은 AgentRunbook-R (효율적인 RAG 기반)과 AgentRunbook-C (코딩 에이전트 호출) 두 가지 메모리 방법 세트를 제안했으며, AgentRunbook-C가 가장 높은 정확도를 보였으나 지연 시간 문제가 있었습니다.
애플의 AI 재부팅에 앞서 안드로이드의 중심에 Gemini를 배치하기 위해 구글이 경쟁 중
구글은 애플이 WWDC에서 선보일 것으로 예상되는 AI 경쟁에 대비하여, 최신 Android 업데이트를 통해 Gemini를 단순한 챗봇을 넘어 휴대폰, 브라우저, 차량 등 전반적인 운영 계층(operating layer)으로 통합하고 있습니다. 구체적으로 앱 자동화, 개선된 Chrome 및 Android Auto 경험 등을 선보이며, 사용자가 통제권을 유지하는 '인간 개입(human in the loop)' 방식을 강조합니다. 이러한 전략은 Gemini를 안드로이드 생태계 전반의 AI 백본으로 확립하여 OpenAI나 Anthropic과 경쟁하고, 애플의 새로운 AI 전략에 대응하려는 목적을 가지고 있습니다.
Unsloth에서 MTP 사용하기
Unsloth에서 MTP(Model Type Preservation) 레이어를 보존한 모델이 출시되었으며, 관련 Hugging Face 링크를 통해 접근할 수 있습니다. 하지만 현재로서는 MTP 기능의 완전한 활용을 위해 llamacpp PR을 확인하고 직접 빌드하는 과정이 필요합니다. Unsloth는 모델 카드에 MTP 사용 방법을 안내하고 있으므로 이를 참고해야 합니다.
EU, 북극해 밑에 해저 케이블 설치 검토... 유럽과 아시아 연결 목표로 호르무즈 해협 및 러시아 우회
EU는 아시아와 연결하기 위한 목적으로 북극해 밑에 해저 케이블 설치를 검토하고 있습니다. 이 경로는 홍해나 페르시아만 같은 지정학적 위험 지역을 우회할 수 있다는 장점이 있습니다. 다만, 혹독한 북극 기후라는 어려움이 존재합니다.
트럼프 대통령이 엔비디아 CEO에게 전화를 건 후 젠슨 황, 트럼프의 중국 방문에 합류
Nvidia CEO Jensen Huang은 도널드 트럼프 전 미국 대통령이 직접 연락하여 요청한 후, 중국 방문에 합류하게 되었습니다. 트럼프는 이번 주 베이징으로 12명 이상의 미국 경영진을 이끌고 가서 시진핑 국가주석과 만날 예정입니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.