Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
© 2026 Molayo
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.
Meta가 인도 핀테크 기업 CRED에 9억 달러를 투자하고, CRED 창립자 Kunal Shah를 WhatsApp 리더로 영입했습니다. 이번 결정은 Meta의 인도 내 디지털 결제 및 금융 서비스 시장 점유율 확대를 목표로 합니다.

Qwen-AgentWorld는 에이전트 환경 시뮬레이션을 위한 언어 기반 월드 모델 연구입니다. 7개 도메인을 아우르는 시뮬레이션 능력을 갖춘 파운데이션 모델을 제안하며, 에이전트 강화학습 및 성능 향상을 위한 새로운 패러다임을 제시합니다.
형식 의미론의 구성성 원리를 진화 모델링에 통합하여 어휘적 의미와 구성 함수가 함께 진화하는 프레임워크를 제안합니다. 양화 의미의 진화를 분석하여 보수성이 효율적인 시스템 추상화로서 나타남을 입증했습니다.
공유 어휘를 사용하는 LLM 제품군에서 효율적인 소스 선택을 위한 새로운 연구인 FisherSketch를 소개합니다. FisherSketch는 계산 비용이 높은 Fisher 행렬 대신 활성화와 오차 공간의 코사인 유사도를 활용하여 태스크 간의 업데이트 기하학을 실용적으로 추정합니다.
언어 모델이 지식을 태스크 특화적인 방식으로 인코딩한다는 점을 행동적 및 기계론적 분석을 통해 규명합니다. 동일한 사실이라도 태스크에 따라 서로 다른 파라미터 서브셋을 사용함을 밝혀내어, 모델을 단순한 지식 베이스로 보는 관점에 의문을 제기합니다.

AI 시대의 핵심 동력이 GPU에서 메모리로 이동함에 따라 삼성전자와 SK하이닉스의 중요성이 커지고 있습니다. HBM을 넘어 HBF, HBS로 이어지는 차세대 메모리 시장과 커스텀 HBM 시대의 도래를 분석합니다.
LLM이 역사적 언어를 처리할 때 발생하는 난이도를 토큰화 비용과 이해 비용으로 분해하여 분석한 연구입니다. 17세기 이탈리아어와 18세기 러시아어 데이터를 통해 인코딩 비용과 예측 불확실성의 차이를 규명했습니다.

다국어 추론 시 발생하는 정보 손실을 줄이기 위해 '문맥 인식 번역 캐스케이드' 방식을 제안합니다. 원래 질문과 추론 과정을 최종 번역 단계에 포함함으로써 다양한 언어 환경에서 성능을 크게 향상시켰습니다.
정신과 전문의의 주석을 바탕으로 관계적 맥락에서의 정신 건강 상태를 모델링하기 위한 RSPC 벤치마크를 소개합니다. Reddit 데이터를 활용해 기분 장애, 관계적 트리거, 관계 단계를 분석하며 다양한 LLM의 성능을 비교합니다.
검열을 피하기 위해 사용되는 간접 언어 표현(ILE)을 탐지하기 위해 메커니즘 중심의 새로운 분류 체계를 제안하는 연구입니다. LLM을 활용해 알고스피크와 완곡어법 등을 효과적으로 분류하며, 기존 방식 대비 정확도와 F1 점수를 크게 향상시켰습니다.
유럽 정치 엘리트 네트워크를 매핑하기 위해 다국어 공동 개체-관계 추출을 수행하는 오픈 웨이트 파이프라인을 제안합니다. LLM의 교차 언어 능력 한계를 극복하고 Wikidata 식별자 매핑과 MoE 모델을 활용해 시계열 지식 그래프를 구축합니다.
독일 중앙은행의 증권 담보 적격성 검토를 위해 LLM 기반의 생성적 정보 추출 파이프라인을 제안하는 연구입니다. 기존 NER 방식의 한계를 극복하기 위해 추출, 정규화, 해석 단계로 프로세스를 분해하여 복잡한 투자설명서를 처리합니다.
Ribbon은 고차원 모델의 예측 불확실성을 효율적으로 정량화하기 위한 새로운 근사법을 제안합니다. 반복적인 모델 재학습 대신 영향 함수(influence-function) 선형화를 사용하여 비용을 획기적으로 줄이면서도 베이지안 부트스트랩의 구조를 유지합니다.
소셜 미디어 내 조작적인 베팅 광고를 탐지하기 위한 설명 주석 데이터셋인 BetXplain을 제안합니다. 이 데이터셋은 광고의 기만적 요소를 식별하고 논리적 근거를 제공하며, 다중 작업 학습을 통해 모델의 설명력을 높이는 데 중점을 둡니다.
시계열 예측에서 모델 규모를 키우는 대신 전처리 최적화를 통해 선형 모델의 성능을 극대화하는 연구를 소개합니다. 릿지 회귀를 활용해 8개 벤치마크에서 컨텍스트 길이, 정규화, 증강 패턴을 분석한 결과, 최적화된 선형 모델이 Transformer나 CNN 등 복잡한 모델을 능가함을 입증했습니다.
관측된 해 데이터를 통해 지배 방정식을 학습하는 과학적 머신러닝 분야의 식별 가능성 문제를 다룹니다. 하우스도르프 거리를 도입하여 선형 및 비선형 ODE의 식별 가능성 경계를 설정하고, 방정식 복구에 필요한 샘플 복잡도를 정량적으로 분석합니다.
채용 검색 쿼리 생성을 위한 RLAIF 프레임워크와 보상 신호 설계 연구를 다룹니다. LLM이 보상을 해킹하여 문구를 그대로 복사하는 문제를 해결하기 위해 구조화된 보상 엔지니어링의 중요성을 입증했습니다.
아날로그 하드웨어의 물리적 제약을 극복하고 저전력 생성 모델링을 가능하게 하는 '아날로그 상호작용 시스템(AIS)' 프레임워크를 제안합니다. 시변 매개변수와 숨겨진 물리적 상태를 활용해 하드웨어와 소프트웨어 간의 표현력 격차를 줄이고, 디지털 대비 획기적인 에너지 효율을 달성했습니다.
하프스페이스 절단이 적용된 고차원 가우시안 분포를 학습하는 최적의 샘플 복잡도를 가진 새로운 알고리즘을 제안합니다. 기존 연구보다 효율적인 샘플 및 시간 복잡도를 달성하며, 상대적 절단 파라미터를 활용해 복잡한 경사 하강법 없이도 기저 가우시안을 복구할 수 있습니다.
Claude Code에서 `/clear` 명령 사용 시 세션 ID가 변경되어, `SessionStart`에서 설정한 안전 hook이 무력화될 수 있는 보안 취약점을 설명합니다. 에러 없이 조용히 작동하지 않으므로 'fail closed' 설계의 중요성을 강조합니다.