Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.AI 2012건필터 해제
Evaluation Cards: AI 평가 보고를 위한 해석 계층
AI 평가 결과가 다양한 출처에서 일관성 없이 보고되는 문제를 해결하기 위해 통합 운영 보고 계층인 EvalCards를 제안합니다. 벤치마크, 실행 데이터, 모델 메타데이터를 통합하여 재현성과 비교 가능성을 높이는 구조적 프레임워크를 제시합니다.
FASE: 코드 품질을 위한 빠른 적응형 의미론적 엔트로피 (Fast Adaptive Semantic Entropy)
멀티 에이전트 코드 생성의 신뢰성을 높이기 위해 불확실성을 정량화하는 새로운 지표인 FASE를 제안합니다. FASE는 그래프 이론을 활용하여 기존 LLM 기반 방식보다 훨씬 빠르고 정확하게 코드의 기능적 정확성을 근사합니다.
에이전시 전이형 모델 프리 정책 강화 기법
기존의 베이스라인 정책을 강화학습 과정에 임베딩하여 학습 효율성과 성능을 동시에 개선하는 새로운 기법을 제안합니다. 초기에는 베이스라인에 의존하다가 점진적으로 에이전시를 학습 정책으로 전이하여, 최종적으로는 독립적인 고성능 신경망을 생성합니다.
OmniGameArena: 개선 역학(Improvement Dynamics)을 포함한 VLM 게임 에이전트를 위한 통합 UE5 벤치마크
VLM 에이전트의 성능을 다각도로 평가하기 위한 통합 벤치마크인 OmniGameArena를 제안합니다. Unreal Engine 5 기반의 12개 게임을 통해 솔로, PvP, 협동 플레이를 지원하며, 에이전트의 성찰 능력을 측정하는 IDC 지표를 도입했습니다.
Physical AI를 위한 하네스 엔지니어링: 로봇 미들웨어는 하네스 계층이다
Physical AI 시대에 로봇 미들웨어가 AI 모델의 제어, 컴퓨팅, 통신을 중재하는 '하네스(Harness)' 역할을 수행해야 함을 제안합니다. 이를 위해 투영(Projection), 격리(Isolation), 전이(Transfer)라는 세 가지 핵심 기능을 미들웨어 계층에서 강제할 것을 강조합니다.
영국 국방 분야의 AI 보증: JSP 936의 운영화 과정에서의 과제
영국 국방 분야의 AI 보증 지침인 JSP 936 Part 1을 실제 운영에 적용할 때 발생하는 기술적, 조직적 과제를 분석합니다. AI 시스템의 복잡성, 안전성, 윤리성, 인간과의 상호작용 등 8가지 주요 도전 과제를 식별하였습니다.
원자 분해능 STEM의 결함 분류를 위한 문맥 인식 딥러닝 (Context-Aware Deep Learning)
전자 현미경 이미지의 대비에만 의존하던 기존 방식의 한계를 극복하기 위해, 화학적 조성과 실험적 메타데이터를 통합한 문맥 인식 딥러닝 프레임워크를 제안합니다. 이 모델은 시뮬레이션 데이터에서 98% 이상의 정확도를 기록하며 물리적 근거에 기반한 결함 분류를 가능하게 합니다.
WeaveBench: 하이브리드 인터페이스를 사용하는 컴퓨터 사용 에이전트(Computer-Use Agents)를 위한 장기적 관점의 실세계
컴퓨터 사용 에이전트(CUA)의 교차 인터페이스 오케스트레이션 능력을 평가하기 위한 새로운 벤치마크 WeaveBench를 소개합니다. GUI, CLI, 코드 작업을 결합한 114개의 실세계 태스크를 통해 에이전트의 장기적 작업 수행 능력을 측정합니다.
LargeMonitor: 거대 사전 학습 모델을 통한 온라인 태스크 프리 지속 학습 (Task-Free Continual Learning)
LargeMonitor는 거대 사전 학습 모델을 활용하여 태스크 식별자 없이 데이터 스트림에서 지식을 축적하는 온라인 TFCL 프레임워크입니다. LVM의 안정적 표현 공간을 통해 드리프트를 탐지하고, LMM을 통해 변동의 의미론적 원인을 진단하여 최적의 적응 전략을 수행합니다.
AliyunConsoleAgent: 증류(Distillation) 및 강화학습(Reinforcement Learning)을 통한 실제 클라우드
AliyunConsoleAgent는 클라우드 콘솔 문서와 UI의 일치 여부를 검증하기 위한 웹 에이전트 프레임워크입니다. 증류된 모델의 SFT와 GRPO 기반 강화학습을 결합하여, 독점 모델 수준의 성능을 유지하면서도 추론 비용을 92% 절감했습니다.
하수 기반 우선 인플루엔자 모니터링을 위한 베이지안 선택적 잠재 추론 (Bayesian Selective Latent Inference)
하수 데이터를 활용한 인플루엔자 모니터링의 한계를 극복하기 위해 베이지안 선택적 잠재 추론(BSLI) 방법론을 제안합니다. 이 모델은 하수 데이터의 충분성을 판단하고, 추가적인 공식 데이터를 조회할 시점과 기권 시점을 최적화하여 비용 대비 성능을 개선합니다.
창발적 정렬(Emergent alignment)과 윤리적 페르소나의 투영 가능성
LLM의 미세 조정이 특정 윤리적 관점을 습득하여 광범위한 안전 행동으로 확장되는 '창발적 정렬' 현상을 연구합니다. 헌법적 AI(CAI) 접근 방식을 통해 모델이 특정 윤리적 페르소나를 투영할 수 있음을 입증했습니다.
TheoremBench: 형식 수학(Formal Mathematics)에서의 정리 증명에 대한 LLM 평가
형식 수학(Formal Mathematics) 분야의 LLM 성능을 정밀하게 평가하기 위한 Lean4 기반 벤치마크인 TheoremBench를 소개합니다. 기존의 단순 문제 풀이 방식을 넘어, 증명의 구조적 전개와 부분적 진행 상황을 측정할 수 있는 메인 및 전제 버전을 제공합니다.
컴퓨터 해석 가능 가이드라인이 없는 뇌졸중 케어에서의 LLM 오케스트레이션 기반 적합성 검사
컴퓨터 해석 가능한 가이드라인(CIGs)이 없는 환경에서 LLM 오케스트레이션을 통해 의료 적합성을 검사하는 모듈형 프레임워크를 제안합니다. 비정형 임상 텍스트와 가이드라인을 분석하여 환자 케어 경로의 준수 여부를 정량적으로 평가합니다.
로봇 학습 파이프라인을 침해하기 위한 월드 모델 (World Models) 타겟팅 공격
월드 모델(World Models)을 이용한 로봇 학습 파이프라인 대상의 새로운 데이터 포이즈닝 공격 방식을 제안합니다. 겉보기에 안전한 데이터셋에 악의적인 프롬프트나 전이 역학을 주입하여, 월드 모델을 통해 위험한 로봇 정책이 생성되도록 유도할 수 있음을 입증했습니다.
LLM 지원 임상 논문 작성(Clinical Manuscript Preparation)을 위한 결정론적 무결성 게이트(Deterministic
LLM을 활용한 임상 논문 작성 시 발생하는 허위 정보와 오류를 방지하기 위해 생성과 검증을 결합한 새로운 아키텍처를 제안합니다. 결정론적 검증 방식을 통해 기존 LLM 검토 방식보다 높은 결함 탐지율을 입증했습니다.
사전-사후 루프 닫기: 분석 기반 LLM 반복을 통한 자기 성찰적 분자 설계
LLM을 단순한 생성 도구에서 인과적 추론기로 변모시키기 위해 물리화학적 근거를 피드백 루프에 통합하는 연구입니다. RAG와 자기 성찰 모듈을 결합하여 단순 점수 대신 오비탈 에너지 등 상세 데이터를 활용함으로써 분자 설계의 정밀도를 획기적으로 높였습니다.
SecureClaw: LLM 에이전트의 제어권 탈환
LLM 에이전트의 보안 취약점인 승인되지 않은 외부 동작과 민감 정보 노출을 해결하기 위한 이중 경계 아키텍처 SecureClaw를 제안합니다. 권한 부여와 평문 격리를 분리하여 에이전트의 유용성을 유지하면서도 공격 성공률을 획기적으로 낮췄습니다.
비트 플립 연쇄(Chain of Bit-Flips)를 이용한 연합 모델 적응(Federated Model Adaptation) 대상 모델
연합 학습(FL) 환경에서 하드웨어 결함(bit-flips)을 이용해 백도어를 심는 새로운 모델 포이즈닝 공격 방식을 제안합니다. Rowhammer와 같은 하드웨어 취약점을 활용해 사전 학습된 모델의 파라미터를 조작함으로써 태스크 불가지론적 백도어를 성공적으로 구축할 수 있음을 입증했습니다.
FuseFSS: 함수 비밀 공유 (Function Secret Sharing)를 이용한 효율적인 보안 LLM 추론
FuseFSS는 함수 비밀 공유(FSS)를 활용하여 LLM의 보안 추론 성능을 높이는 새로운 컴파일러 프레임워크입니다. 연산자별 맞춤형 프로토콜 대신 단일 컴파일 파이프라인을 사용하여 비선형 연산의 병목 현상을 해결합니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.