Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
© 2026 Molayo
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.
본 연구는 훈련 없이 MLLM을 활용하여 객체 및 부품 수준에서 국소적 개념 명명을 수행하는 제로샷 접근 방식을 제안합니다. 실험 결과, 7B-32B 규모의 모델들이 객체 수준에서 62%-88%의 높은 정확도를 보이며 저비용 C-XAI의 잠재력을 입증했습니다.
질문의 난이도에 따라 검색 자원을 유동적으로 조절하는 AB-RAG 프레임워크를 제안합니다. 모델의 확실성, 일치성, 검색 점수 분산을 결합하여 신뢰도를 추정하고 최적의 검색 예산을 결정합니다.
신경망 구조나 파라미터 최적화를 위한 진화적 외부 루프 구축 전, 비용 효율성을 판단할 수 있는 사전 등록된 스크리닝 규칙을 제안합니다. 회복률(R) 지표를 통해 고비용의 외부 루프가 저비용 싱글샷 방식보다 유의미한 이득을 줄 수 있는지 구현 전에 결정합니다.
AI에 대한 의인화된 언어 사용이 대중의 인식에 미치는 영향을 연구한 논문입니다. 실험 결과, 의인화된 프레이밍이 LLM이나 추천 시스템에 대한 즉각적인 인식 변화를 일으키는 효과는 미미한 것으로 나타났습니다.
DistilledGemma는 다국어 역사적 기사에서 인물-장소 관계를 추출하기 위한 효율적인 지식 증류 시스템입니다. Gemma 4 26B 모델의 추론 능력을 2.3B 소형 모델로 전이하여 정확도와 계산 효율성 사이의 최적의 균형을 달성했습니다.
데바나가리 문자에 대한 OCR-VLMs의 성능을 벤치마킹하고 스트레스 테스트를 수행한 연구입니다. 합성 데이터와 실제 스캔본 간의 성능 격차를 분석하고, 특정 모델의 치명적 오류 패턴과 사후 교정 효과를 규명했습니다.
LLM 에이전트가 기업 정책을 준수하도록 돕는 대화 기반 서브 에이전트 검증기인 PolicyGuard를 소개합니다. 기존의 단순 차단 방식과 달리 전체 대화 문맥을 파악하고 실행 가능한 피드백을 제공하여 정책 준수 성능을 높였습니다.
여행 도메인의 전문 지식 그래프(KG)를 활용하여 LLM의 추론 정확도와 신뢰성을 높이는 모듈형 파이프라인을 제안합니다. 지식 그래프 기반의 지도 미세 조정(SFT)을 통해 Qwen3-4B 모델의 성능을 크게 향상시켰습니다.
LLM 에이전트의 메모리 공고화 과정에서 유보적인 표현이 확신에 찬 단언으로 변하며 발생하는 보안 취약점을 분석합니다. 메모리에 저장된 문구의 확신도가 에이전트의 판단에 미치는 영향을 규명하고, 이를 방지하기 위한 설계적 교훈을 제시합니다.
언어 모델의 추론 단계가 증가함에 따라 성능이 저하되는 양상을 평가하는 Complexity Ceiling Benchmark(CCB)를 제안합니다. 실험 결과, 모델들은 도메인에 따라 서로 다른 성능 한계치를 보이며 기하급수적인 성능 저하 패턴을 나타냅니다.
동기 면담(MI) 상담 에이전트의 효과를 높이기 위해 치료적 사고 과정을 생성하는 경량 사고 모델 MIThinker를 제안합니다. AugR1-MI 파이프라인을 통해 상담사의 사고를 역설계하여 학습하며, 기존 모델 대비 적은 계산량으로도 뛰어난 상담 역량을 보여줍니다.
노래 가사의 감정 인식을 위해 인간과 LLM 간의 정렬을 조사하는 새로운 하이브리드 프레임워크를 제안합니다. 문장 수준의 가사 데이터셋을 통해 주석 작성 시 발생하는 불일치를 예측하고 최적화하는 방법을 다룹니다.
Meta가 Instagram과 Meta Glasses 광고에 사용자 사진을 활용하는 약관과 관련하여, 개인정보 보호 및 윤리적 문제를 비판합니다. 플랫폼의 독점적 지위로 인해 사용자들이 원치 않는 환경에서도 서비스를 이용할 수밖에 없는 구조적 문제를 지적합니다.
Google 검색의 58.5% 이상이 클릭 없이 종료되는 '제로 클릭 검색' 현상이 심화되고 있습니다. AI Overviews 도입으로 인해 검색 엔진이 답변 엔진으로 진화하며 웹사이트 트래픽이 급감하는 비즈니스 환경의 변화를 분석합니다.
AI 코딩 에이전트의 성능을 극대화하기 위해 프로젝트의 컨텍스트를 제공하는 AGENTS.md 표준에 대해 설명합니다. README와 달리 에이전트가 작업을 수행하는 데 필요한 명령어, 컨벤션, 가드레일을 집중적으로 다루는 가이드입니다.
미국 하원이 아동 온라인 안전 조치 패키지를 통과시켰으나, 상원과의 선점(preemption) 조항을 둘러싼 갈등이 예상됩니다. 이번 입법은 기술 기업의 책임 범위와 주 정부의 규제 권한을 결정짓는 중요한 분기점이 될 전망입니다.
이종 그래프 신경망(HGNN)의 블랙박스 환경에서의 강건성을 테스트하기 위한 새로운 공격 프레임워크인 Blackknife를 제안합니다. 모델의 내부 정보 없이 하드 레이블과 제한된 쿼리만으로 효과적인 회피 공격을 수행할 수 있음을 입증했습니다.
Meshtryoshka는 중첩된 메쉬 쉘 구조를 활용하여 대규모 경계 없는 장면을 재구성하는 새로운 미분 가능한 렌더링 프레임워크입니다. 기존의 객체 중심 한계를 넘어 기성품 래스터라이저와 호환되면서도 고품질의 3D 재구성을 가능하게 합니다.
과학적 도식 생성을 평가하기 위한 새로운 벤치마크인 SciDraw-Bench를 소개합니다. 기존 벤치마크가 놓친 텍스트 정확성, 구조적 품질, 학문적 관례 준수 등을 4차원 프로토콜로 측정하며, 도메인 특화 모델의 우수성을 입증했습니다.
KM-Speaker는 음성 기반 3D 얼굴 애니메이션의 품질과 제어력을 높이기 위한 새로운 키포인트 조건부 플로우 기반 생성 프레임워크를 제안합니다. 오디오 기반 입술 모션과 상안면 역학을 분리하여 정밀한 스타일 제어와 높은 입술 동기화 정확도를 달성합니다.