Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.AI 2061건필터 해제
불일치 인지 최소화: 라벨이 없는 데이터를 활용한 일반화 성능 향상
본 논문은 라벨이 없는 데이터를 활용해 일반화 성능을 높이는 새로운 지표인 '국소 불일치(local inconsistency)'를 제안합니다. 정보 기하학적 관점에서 피셔 정보 행렬과 손실 헤시안을 연결하여 이론적 토대를 구축했으며, 이를 학습 목적 함수에 통합한 IAM 방법론을 소개합니다.
FBHM: 혐오 밈 탐지를 위한 VLM의 기능적 벤치마킹 및 스티어링 (Steering)
VLM의 혐오 밈 탐지 능력을 평가하기 위해 수사적 기능과 대상 커뮤니티를 축으로 한 새로운 벤치마크 FBHM을 제안합니다. 기존 모델들이 데이터셋 휴리스틱에 의존하는 문제를 지적하며, 학습 가능한 스티어링 벡터(LSV)를 통해 성능을 획기적으로 개선하는 방법을 제시합니다.
AI에서의 공감의 적절성: 신호-비용 관점
본 논문은 AI의 공감이 맥락적으로 적절한지를 평가하기 위해 신호 이론(Signaling Theory)을 도입합니다. 정서적, 인지적, 연상적 공감을 신호 비용 대리 지표로 매핑하여 공감의 적절성을 체계적으로 측정하는 프레임워크를 제안합니다.
dashi: 신뢰할 수 있는 AI 개발 및 배포를 지원하기 위한 데이터셋 변화(Dataset Shift) 특성화용 Python 라이브러리
dashi는 데이터셋 변화(Dataset Shift)를 탐색하고 정량화하기 위해 설계된 오픈 소스 Python 라이브러리입니다. 비지도 학습 기반의 정보 기하학적 접근과 지도 학습 기반의 성능 저하 분석을 통해 AI 모델의 신뢰성과 안전성을 지원합니다.
자원 제약이 있는 시각적 에이전트의 공유 상태 협업 실패 모드 진단
저용량 환경에서 모듈형 시각적 에이전트가 공유 메모리를 사용할 때 발생하는 협업 실패 모드를 연구합니다. CoSee 프레임워크를 통해 노이즈 강화와 정책 붕괴라는 두 가지 주요 실패 원인을 규명했습니다.
타인을 꿈꾸다: 다중 에이전트 강화학습 (MARL)을 위한 월드 모델 내 잠재적 팀원 모델링
MARL 환경에서 팀원의 의도를 파악하기 위해 월드 모델 내에 팀원 모델링을 통합하는 새로운 아키텍처를 제안합니다. RSSM의 잠재 상태를 환경과 팀원으로 분해하고 마음 이론(ToM) 헤드를 통해 파트너의 성격과 의도를 추론합니다.
HypoAgent: 지식 그래프 상의 상호작용적 귀추적 가설 생성을 위한 에이전트 기반 프레임워크
지식 그래프(KG) 상에서 상호작용적인 귀추적 가설 생성을 지원하는 에이전트 기반 프레임워크 HypoAgent를 제안합니다. 의도 인식, 가설 생성, 근본 원인 분석의 세 가지 에이전트를 통합하여 다회차 대화 환경에서도 정교한 가설 생성과 진단이 가능합니다.
적응하는 법 배우기: 인지 인식 탐색을 통한 자기 개선형 웹 에이전트
SCALE은 MLLM 기반 웹 에이전트의 적응성을 높이기 위해 제안된 자율 학습 프레임워크입니다. Selector, Predictor, Judger라는 세 가지 역할을 통해 에이전트의 한계를 스스로 탐색하고, SCALE-Hop 전략으로 효율적인 경로를 계획합니다.
DynaTree: 시의성이 중요한 뉴스 검색을 위한 동적 에이전트 기반 검색 트리
DynaTree는 시의성이 중요한 뉴스 검색을 위해 제안된 2단계 에이전트 기반 RAG 프레임워크입니다. 오프라인에서 검색 트리를 구축하고 온라인에서 가벼운 서브트리 선택을 수행하여, 높은 추론 비용 없이도 뉴스 검색의 신선도와 관련성을 크게 개선합니다.
Maximal Clique Complexes를 이용한 고차 그래프 학습의 확장성 개선
본 논문은 고차 그래프 모델의 표현력을 유지하면서 확장성 문제를 해결하기 위한 새로운 프레임워크를 제안합니다. sCWL 및 fCWL 테스트를 통해 계산 효율성을 높이고, CliqueWalk를 도입하여 메모리 및 시간 복잡도를 획기적으로 줄였습니다.
검, 방패, 그리고 아킬레스건: 내비게이션 계획을 위한 대규모 언어 모델(LLM)의 언어적 귀납적 편향(Linguistic Inductive
LLM 기반 내비게이션 시스템에서 텍िस्ट 기반 공간 표현의 언어적 구조가 모델의 계획 능력에 미치는 영향을 분석한 연구입니다. 이중 개입 프레임워크를 통해 위상, 기하, 의미론적 정보가 LLM의 추론에 미치는 편향을 규명했습니다.
대규모 언어 모델(LLM)을 활용한 수어 번역(SLT)용 타겟 측 패러프레이즈 증강
본 연구는 데이터 부족 문제를 해결하기 위해 GPT-4o를 활용하여 수어 번역(SLT)의 타겟 문장을 패러프레이징하는 증강 기법을 제안합니다. Signformer 모델을 사용하여 사전 학습과 미세 조정을 수행하며, 실험 결과 PHOENIX14T 데이터셋에서 성능 향상을 확인했습니다.
대규모 언어 모델 (LLM) 에이전트의 기술 가용성 및 제시 세분성: SkillsBench 통제 연구
LLM 에이전트에게 제공되는 기술 문서의 세분성이 작업 성공률에 미치는 영향을 연구한 논문입니다. 실험 결과, 기술 가용성은 성능 향상에 결정적이지만, 가이드의 추상화 수준이나 예시 추가 여부는 모델에 따라 효과가 작고 불확실함을 확인했습니다.
FAM-Bench: 상태 인지형 식사 요법(Food-as-Medicine) 추론을 위한 멀티모달 벤치마크
FAM-Bench는 특정 건강 상태에 따른 음식의 적합성을 판단하는 멀티모달 벤치마크입니다. 기존의 단순 영양소 추정을 넘어, 임상 영양 제약 조건을 고려한 고차원적 추론 능력을 평가합니다.
뉴로-심볼릭 구문 분석: CYK 알고리즘을 이용한 신경망 형성
CYK 알고리즘을 신경망 구조에 직접 주입하는 CYKNN 구조를 제안합니다. 문맥 자유 문법 분석을 위해 행렬-벡터 곱셈을 활용한 RNN 구조를 사용하며, 기존 대규모 언어 모델보다 뛰어난 성능을 입증했습니다.
DOA: SpeechLLM을 활용한 장문 동시 번역을 위한 학습이 필요 없는 디코더 전용 어텐션 (Decoder-Only Attention)
SpeechLLM의 디코더 전용 아키텍처를 활용하여 별도의 학습 없이 장문 동시 음성-텍스트 번역을 수행하는 DOA(Decoder-Only Attention) 기술을 제안합니다. 셀프 어텐션에서 프록시 정렬 신호를 도출하여 저지연 스트리밍 번역을 가능하게 합니다.
속성 감성 삼중항 추출(ASTE)을 위한 진단적 추론 감독 기반의 세밀한 검증
본 논문은 속성 감성 삼중항 추출(ASTE)의 신뢰성을 높이기 위해 진단적 추론 감독 기반의 검증 프레임워크인 FiVeD를 제안합니다. FiVeD는 유효성 분류와 품질 점수 추정을 통해 추출된 삼중항을 검증하며, 기존 모델의 성능을 최대 3.53 F1 포인트 향상시킵니다.
강화학습 (RL)을 위한 Answer-Set Programming 기반의 추상화
강화학습의 거대한 상태 공간 문제를 해결하기 위해 Answer-Set Programming(ASP)을 활용한 CARCASS 프레임워크의 추상화 방식을 제안합니다. Blocks World와 Minigrid 사례 연구를 통해 ASP 기반 구현이 도메인 지식을 활용한 효과적인 추상화 도구임을 입증했습니다.
중고차 판매 봇? 부분 정보 상황에서 협상 에이전트로서 LLM의 정직성과 신뢰성
정보 비대칭 상황에서 LLM 에이전트의 협상 능력과 정직성, 신뢰성을 게임 이론 관점에서 분석한 연구입니다. 미세 조정이 협상력은 높이지만 부정직함을 유발하여 에이전트 안전성에 위협이 될 수 있음을 경고합니다.
PithTrain: 컴팩트하고 에이전트 친화적인(Agent-Native) MoE 학습 시스템
PithTrain은 에이전트 친화적(Agent-Native) 설계를 통해 MoE 학습 프레임워크의 효율성을 높인 시스템입니다. 기존 프레임워크의 높은 운영 비용을 해결하기 위해 에이전트-태스크 효율성(ATE) 개념을 도입하고, ATE-Bench를 통해 성능을 검증했습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.