Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
OpenBioRQ: 에이전트를 위한 미해결 생물 의학 연구 질문들
에이전트 모델의 인용 정확도와 생물 의학적 추론 능력을 검증하기 위한 새로운 벤치마크인 OpenBioRQ를 소개합니다. 12,553개의 미해결 질문을 통해 모델의 충실도와 도구 사용 능력을 평가하며, 기존 모델들의 한계와 에이전트 붕괴 현상을 분석합니다.
줌(Zoom)하기 전에 살펴보기: Visual RAG의 해상도-컨텍스트 트레이드오프를 위한 적응형 라우팅 (Adaptive Routing
시각-언어 모델(VLM)의 해상도와 컨텍스트 간 트레이드오프 문제를 해결하기 위한 경량 프레임워크 ViRGo를 제안합니다. 객체 크기에 따라 전역 인지, 패치 기반 검색, 어텐션 기반 검색 중 최적의 방식을 선택하는 적응형 라우팅을 통해 정확도와 효율성을 동시에 개선합니다.
전이중(Full-Duplex) 음성 대화 시스템에 얼굴 생성 통합하기
Moshi-Face는 기존의 전이중 음성 모델에 얼굴 생성 기능을 통합한 최초의 모델입니다. VQ-VAE 기반의 페이스 코덱과 Face Transformer를 사용하여 실시간으로 동기화된 오디오와 얼굴 움직임을 생성합니다.
A11YRepair: 지식 강화형 분할 정복(Divide-and-Conquer) 수정을 통한 웹 접근성 장벽 해소
웹 접근성(A11Y) 문제를 해결하기 위해 LLM 기반의 분할 정복(Divide-and-Conquer) 프레임워크인 A11YRepair를 제안합니다. WCAG 지식을 통합하여 다중 결함을 효율적으로 수정하며, 실제 오픈 소스 프로젝트에 적용되어 그 성능을 입증했습니다.
LLM은 가독성을 제어할 수 있는가? CEFR 제어 아랍어 생성을 위한 다차원 평가 프레임워크
LLM의 아랍어 가독성 제어 능력을 평가하기 위한 다차원 프레임워크를 제안합니다. CEFR 기준에 맞춘 텍스트 생성을 위해 제어된 프롬프팅과 어휘 제약 검증을 활용하며, 구조화된 프롬프팅이 가독성 정렬에 효과적임을 입증했습니다.

소비 침체가 지속됨에 따라 중국의 618 쇼핑 축제 성장세 급감
중국의 618 쇼핑 축제 매출 성장률이 전년 대비 4%에 그치며 소비 침체가 지속되고 있습니다. 하이테크 및 AI 부문의 성장에도 불구하고 가계 지출 감소와 부동산 시장 부진이 중국 경제의 주요 취약점으로 나타났습니다.
Holmes: 산업 규모의 혼합 언어 모바일 크래시를 위한 멀티모달 에이전트 기반 진단
Holmes는 대규모 혼합 언어 모바일 환경의 크래시 진단을 위해 멀티모달 런타임 신호를 활용하는 멀티 에이전트 시스템입니다. 계층적 아키텍처를 통해 복잡한 코드베이스 내 근본 원인을 자동 분석하며, 실제 데이터 적용 결과 디버깅 시간을 98% 이상 단축했습니다.
고성능 다국어 ASR에 강력한 코드 스위칭 (Code-switching) 능력 추가하기
다국어 ASR 시스템에서 코드 스위칭(Code-switching) 성능을 높이면서 기존 단일 언어 성능을 유지하는 연구를 소개합니다. 베이지안 인수 분해 적응 방식을 통해 소량의 합성 데이터만으로도 효율적인 지식 통합이 가능함을 입증했습니다.
중간 표현(Intermediate Representation)을 통한 실제 바이너리의 교차 플랫폼 소프트웨어 버스마킹 (Software
본 논문은 Ghidra P-code를 중간 표현(IR)으로 활용하여 서로 다른 플랫폼 간의 소프트웨어 버스마킹 성능을 평가합니다. 실험 결과, ISA와 무관하게 높은 일관성을 입증했으며 Windows 바이너리에서의 희석 효과를 식별했습니다.
음소-자소 변환(G2P)을 위한 대규모 언어 모델(LLM) 벤치마킹: 일본어 사례 연구
일본어 음소-자소 변환(G2P) 성능 향상을 위해 30개 이상의 LLM을 벤치마킹한 연구입니다. 파싱 모드와 직접 모드 전략을 비교한 결과, 규칙 기반 후처리를 결합한 파싱 모드가 더 우수한 성능을 보였습니다.
LLM 서빙을 위한 기하학 인지형 온라인 스케줄링: 이론적 경계에서 시스템 실무까지
LLM 추론 시 KV 캐시의 동적 메모리 관리를 위해 기하학적 특성을 고려한 SVF(Smallest Volume First) 스케줄링 알고리즘을 제안합니다. 수학적 증명을 통해 기존 방식보다 개선된 경쟁비를 입증했으며, vLLM에 통합하여 Llama-3.1 모델에서 지연 시간 감소와 처리량 향상을 확인했습니다.
ARIA: 신뢰할 수 있는 재료 발견을 위한 LLM 추론 구제용 인과 인지 프레임워크
LLM이 재료 발견 과정에서 물리적 인과관계를 무시하고 검색된 증거에만 매몰되는 '맥락적 터널링' 현상을 해결하기 위한 ARIA 프레임워크를 제안합니다. ARIA는 지식 그래프를 활용해 인과적 추론, 물리 기반 유추, 파라미터 폴백의 3단계 과정을 거쳐 신뢰할 수 있는 재료 설계를 지원합니다.
대규모 흉부 CT 데이터셋에서 보고서 기반 라벨의 LLM 지원 정제
대규모 흉부 CT 데이터셋인 CT-RATE에서 LLM을 활용해 라벨과 보고서 간의 불일치를 정제하는 연구를 수행했습니다. GPT-5.4를 이용한 라벨링이 높은 일치도를 보였으며, 다중 LLM 다수결 방식이 가장 우수한 성능을 기록했습니다.
Vision Transformer의 매개변수 효율적 미세 조정을 위한 구조적 하이퍼엣지 적응 (Structured Hyperedge
Vision Transformer의 매개변수 효율적 미세 조정(PEFT)을 위해 토큰 단위가 아닌 하이퍼엣지 공간에서 적응을 수행하는 HyperAdapter를 제안합니다. 하이퍼그래프 기반 아키텍처를 통해 토큰 간의 구조적 관계를 학습함으로써 기존 어댑터 방식보다 뛰어난 성능을 보여줍니다.
Gold Points Sniper: 미세한 동작 이해를 위한 VLM의 자기 유도형 시각적 추론
미세한 인간 동작을 이해하기 위해 경량 VLM에 자기 유도형 멀티모달 추론 능력을 부여하는 GPS 프레임워크를 제안합니다. Gold Points Extractor, Selective Socratic Questioner, Semantic Entailment Evaluator를 통해 사실적 충실도와 정보 풍부함을 동시에 확보합니다.
MetaPS: 시장 에이전트를 위한 적응형 프로그래밍 전략 선택
MetaPS는 시장 상황에 따라 최적의 프로그래밍 전략을 선택하는 적응형 에이전트 프레임워크를 제안합니다. LLM이 직접 행동을 생성하는 대신, 검증된 전략 라이브러리에서 최적의 코드를 선택하도록 학습시켜 성능과 해석 가능성을 높였습니다.
코드는 메모리가 아니다: 코딩 에이전트 내부의 구조적 코드베이스 인덱스
코딩 에이전트의 성능 향상을 위해 구조적 코드베이스 인덱스를 도입하는 실험을 진행했습니다. 연구 결과, 인덱스 추가는 비용 페널티 없이 로컬라이제이션과 문제 해결 능력을 유의미하게 향상시켰습니다.
SVGym (SciVerseGym): 결정 구조 발견을 위한 강화학습 (RL) 및 베이지안 최적화 (Bayesian Optimization)
결정 구조 발견을 위한 강화학습 및 베이지안 최적화용 Gymnasium 호환 환경인 SciVerseGym을 소개합니다. 원자 단위의 편집과 평가를 통합하여 폐쇄 루프 재료 탐색을 위한 재현 가능한 테스트베드를 제공합니다.
Nous: 장기 에이전트 메모리를 위한 예측적 세계 모델 (Predictive World Model)
Nous는 지식을 저장하는 대신 예측적 세계 모델을 통해 유지하는 새로운 에이전트 메모리 아키텍처입니다. 베이지안 사후 확률 업데이트를 통해 엔티티의 속성을 관리하며, 외부 데이터베이스 없이도 장기 대화 메모리 벤치마크에서 우수한 성능을 입증했습니다.
MMGist: 2027년을 위한 포괄적인 멀티모달 벤치마크 (Multimodal Benchmark)
기존 멀티모달 벤치마크의 시각적 의존성 부족, 성능 포화, 신뢰성 문제를 해결하기 위해 새로운 벤치마크 MMGist를 제안합니다. 3단계 필터링 파이프라인을 통해 변별력을 높였으며, 27개의 LVLM을 대상으로 실험하여 모델 간 차이를 효과적으로 구분함을 입증했습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.