Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.AI 2086건필터 해제

검색 증강 상업용 채팅(RAG)에서의 브랜드 추천에 대한 페르소나 조건화: 중요도 계층화에 따른 교차 제공자 감사

RAG 환경에서 사용자 페르소나 조건화가 브랜드 추천 결과에 미치는 영향을 분석한 연구입니다. 페르소나 설정 시 추천 브랜드의 유사도가 감소하며, 특히 미드마켓 브랜드에서 이러한 변동성이 크게 나타남을 확인했습니다.

5월 29일0

arXiv논문

Meta에서의 저위험 코드 리뷰 자동화: RADAR, 위험 보정(Risk Calibration), 그리고 리뷰 효율성

Meta는 AI 에이전트로 인한 코드 급증과 리뷰 병목 현상을 해결하기 위해 RADAR 시스템을 도입했습니다. RADAR는 위험 점수 기반의 다단계 퍼널을 통해 저위험 코드를 자동 리뷰하며, 운영 안정성을 유지하면서도 리뷰 대기 시간을 획기적으로 단축합니다.

5월 29일0

arXiv논문

BORA: 오프라인 강화학습(Offline RL)과 온라인 잔차 적응(Online Residual Adaptation)을 통한 실세계 숙련된

BORA는 VLA 모델의 숙련된 로봇 조작을 위해 설계된 오프라인-투-온라인 강화학습 프레임워크입니다. 오프라인 비평가 구축과 온라인 잔차 적응 메커니즘을 통해 실세계의 실행 오류를 줄이고 물리적 환경 적응력을 높입니다.

5월 29일0

arXiv논문

LLM 기반 멀티 에이전트 프롬프트 최적화에서의 시간적 및 구조적 신용 할당 통합

멀티 에이전트 시스템(MAS)의 최적화 문제를 해결하기 위해 시간적 및 구조적 신용 할당 방식을 제안합니다. 상태 공간 병목과 정적 역할 정책을 통해 오류 신호를 분리하고, 이를 기반으로 한 블록 좌표 하강 알고리즘을 통해 효율적인 프롬프트 최적화를 구현합니다.

5월 29일0

arXiv논문

3D VQA를 넘어: 강화된 기하학적 추론을 위한 Vision-Language Models에 3D 공간적 사전 지식(Spatial

VLM의 3D 공간 추론 능력을 향상시키기 위해 기하학적 사전 지식을 트랜스포머 레이어에 직접 주입하는 GASP 프레임워크를 제안합니다. 대규모 비디오 장면의 정답 기하학을 활용한 이중 목적 함수 학습을 통해 3D VQA 데이터 없이도 벤치마크 성능을 크게 개선했습니다.

5월 29일0

arXiv논문

언어 모델은 상태 변화에 따라 엔티티를 추적하는가?

언어 모델(LM)이 상태 변화에 따라 엔티티를 추적하는 메커니즘을 조사한 연구입니다. 모델이 점진적으로 상태를 추적하는 대신 마지막 토큰에서 정보를 병렬적으로 집계하는 비-점진적 방식을 사용함을 발견했습니다.

5월 29일0

arXiv논문

강건한 루브릭 보상을 활용한 강화학습 (Reinforcement Learning with Robust Rubric Rewards)

시각-언어 작업의 세밀한 감독을 위해 제안된 $RLR^3$ 방법론을 소개합니다. 결정론적 검증기와 LLM-as-a-Judge를 결합하여 루브릭 기반의 강건한 보상을 제공하며, 기존 RLVR 대비 우수한 성능을 입증했습니다.

5월 29일0

arXiv논문

동일한 증거, 다른 답변: 멀티턴 언어 모델을 위한 정준 문맥 온폴리시 증류 (Canonical-Context On-Policy

멀티턴 대화 시 정보가 점진적으로 공개될 때 발생하는 모델의 성능 저하 문제를 해결하기 위한 CCOPD 기법을 제안합니다. 동일한 정보를 제공하더라도 대화 방식에 따라 답변이 달라지는 '자기 고정 드리프트' 현상을 완화하는 데 집중합니다.

5월 29일0

arXiv논문

LLUMI: 온라인 커뮤니티 피드백을 통한 정신 건강 지원용 LLM 글쓰기 보조 기능 개선

LLUMI는 정신 건강 지원을 위해 Reddit 커뮤니티의 피드백을 활용하여 LLM의 공감 능력과 안전성을 개선하는 프레임워크입니다. 생성 모델과 개선 모델을 결합하여 오픈 소스 모델로도 GPT와 대등한 성능을 구현하며 개인정보 보호 문제를 해결합니다.

5월 29일0

arXiv논문

PhyGenHOI: 동적 인간-물체 상호작용의 물리 인지형 4D 생성

PhyGenHOI는 텍스트 입력을 기반으로 물리적으로 정확한 4D 인간-물체 상호작용(HOI) 장면을 생성하는 새로운 프레임워크입니다. Motion Diffusion Model과 물리 시뮬레이션(MPM)을 결합하여 시각적 충실도와 물리적 일관성을 동시에 확보합니다.

5월 29일1

arXiv논문

Qwen-VLA: 작업, 환경 및 로봇 형태(Embodiment)를 아우르는 통합 시각-언어-행동 모델링

Qwen-VLA는 로봇의 조작, 내비게이션, 궤적 생성을 단일 모델로 통합한 체화된 파운데이션 모델입니다. DiT 기반 행동 디코더를 통해 다양한 로봇 형태와 환경에서도 높은 일반화 성능을 보여줍니다.

5월 29일0

arXiv논문

Loong: 관찰 및 행동 적응형 컨텍스트 선택을 통한 인간 유사 장문 문서 번역 에이전트

Loong은 3E 메모리 모듈을 활용하여 장문 문서 번역 시 발생하는 컨텍스트 제약과 중복 문제를 해결하는 에이전트입니다. 심층 추론과 강화학습을 통해 최적의 컨텍스트를 적응적으로 선택하며, 다국어 번역에서 높은 품질과 안정성을 입증했습니다.

5월 29일0

arXiv논문

ProjectionBench: 점진적 정보 공개 환경에서의 LLM 과학적 가설 생성 평가

점진적 정보 공개 환경에서 LLM의 과학적 가설 생성 능력을 평가하는 새로운 벤치마크 프레임워크인 ProjectionBench를 소개합니다. 모델이 최소한의 정보에서부터 상세한 기술 정보까지 단계적으로 제공받으며 혁신성과 근거 있는 추론 능력을 어떻게 발휘하는지 측정합니다.

5월 29일0

arXiv논문

mcp-proto-okn: Model Context Protocol을 통한 오픈 과학 지식 그래프에 대한 자연어 접근

mcp-proto-okn은 AI 어시스턴트가 자연어로 과학 지식 그래프를 탐색하고 질의할 수 있게 돕는 Python 기반 MCP 서버입니다. FastMCP 프레임워크를 사용하여 SPARQL 실행 및 온톨로지 확장 기능을 제공하며, 생물 의학 분야의 지식 분석 장벽을 낮춥니다.

5월 29일0

arXiv논문

MIRA: 소스 인지적 데이터 선택을 위한 중간 학습 루브릭 앵커링 (Mid-training Rubric Anchoring)

MIRA는 LLM 중간 학습 단계에서 이질적인 데이터 소스에 최적화된 데이터 선택을 위해 제안된 프레임워크입니다. 자기 앵커링 루브릭 발견 기술을 통해 소스별 맞춤형 기준을 설정하고, 이를 학생 스코어러로 증류하여 확장성을 확보합니다. 실험 결과, 코드 중심 학습에서 데이터 사용량을 절반으로 줄이면서도 뛰어난 성능을 입증했습니다.

5월 29일0

arXiv논문

MedCase-Structured: 임상적으로 현실적인 EHR 환경에서 진단적 추론을 벤치마킹하기 위한 Text-to-FHIR 데이터셋

임상적 추론 능력을 평가하기 위해 비구조화된 텍스트를 HL7 FHIR R4 형식으로 변환하는 MedCase-Structured 데이터셋을 제안합니다. LLM의 환각을 줄이기 위해 단계별 생성과 용어 기반 검증 파이프라인을 결합하여 구조적 일관성을 확보했습니다.

5월 29일0

arXiv논문

Archon: 총체적 디지털 휴먼 생성을 위한 통합 멀티모달 모델

Archon은 텍스트, 오디오, 모션, 시각적 콘텐츠 등 7가지 양식을 통합하는 인간 중심의 멀티모달 모델입니다. 시맨틱 비디오 재매개변수화와 '양식 내 사고(Thinking in Modality)' 방식을 통해 고충실도 디지털 휴먼 생성을 구현합니다.

5월 29일1

arXiv논문

GPIC: 시각적 생성을 위한 거대 허용형 이미지 코퍼스

시각적 생성 모델링 연구를 위한 대규모 허용형 이미지 코퍼스인 GPIC를 소개합니다. 약 28조 픽셀 규모의 데이터셋으로, 상업적 이용이 가능한 라이선스와 안전 필터링을 거친 1억 개의 학습 데이터를 포함합니다.

5월 29일0

arXiv논문

RoboWits: 로봇의 창의적 문제 해결을 위한 예상치 못한 도전 과제들

로봇의 인지적 추론과 창의적 문제 해결 능력을 평가하기 위한 새로운 양손 로봇 벤치마크인 RoboWits를 제안합니다. 멀티 에이전트 협력 프레임워크를 통해 자동화된 태스크 생성 파이프라인을 구축하여 다양한 변이 시나리오를 제공합니다.

5월 29일0

arXiv논문

LLM 학습 성능 향상을 위한 데이터 구성의 신비 해제

LLM 학습 효율을 높이기 위해 데이터 선택을 넘어 전략적 데이터 구성(Data Organization)의 중요성을 탐구한 연구입니다. 사전 계산된 점수를 재사용하여 계산 오버헤드를 최소화하면서, 네 가지 핵심 가이드라인을 통해 최적의 데이터 순서 지정 방법을 제안합니다.

5월 29일0

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드