Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
LLM 추론을 위한 RL 업데이트의 핵심 요소는 무엇인가?
LLM의 추론 능력 향상을 위한 RLVR(검증 가능한 보상 기반 강화학습)의 업데이트 역학을 이론적으로 분석한 연구입니다. 중요도 샘플링 비율의 분포와 클리핑 동작이 업데이트에 미치는 영향을 규명하고, 이를 개선한 ACPO 알고리즘을 제안합니다.
DJM: 삼각형 야코비안 (Triangle Jacobians)을 이용한 변위 매핑 (Displacement Mapping)용 컴팩트 베이스
삼각형 야코비안(DJM)을 활용하여 변위 매핑용 컴팩트한 베이스 메쉬를 구축하는 새로운 방법을 제안합니다. 기존 방식보다 적은 삼각형 수로도 높은 정확도를 유지하며, 왜곡을 최소화하는 매핑을 통해 효율적인 렌더링과 신경망 인코딩을 지원합니다.
변형된 RoPE 강화 확산 모델을 이용한 제어 가능한 텍스처 타일링 (Controllable Texture Tiling with
Diffusion Transformers를 기반으로 사용자가 지정한 매개변수에 따라 텍스처를 정밀하게 타일링하는 새로운 프레임워크를 제안합니다. 좌표 변환 RoPE와 분리된 어텐션 마스크를 통해 구조적 충실도와 조명 일관성을 동시에 확보합니다.
VolHuMe: 고해상도 대규모 볼륨메트릭 인간 메쉬 (Volumetric Human Meshes) 데이터셋
VolHuMe는 64개의 RGB 및 32개의 깊이 카메라를 사용하여 캡처한 고품질 4D 인간 스캔 데이터셋입니다. SMPL-X, 고해상도 메쉬, 다중 뷰 이미지 등 광범위한 그라운드 트루스를 제공하며, 기존 데이터셋보다 정밀한 신체 세부 사항을 보존합니다.
주행 영상에서 시뮬레이션 가능한 시나리오로
주행 영상에서 시뮬레이션 가능한 시나리오를 자동으로 생성하는 새로운 프레임워크 D-V2S를 소개합니다. VLM을 통해 도로 상황을 분석하고 LLM을 통해 실행 가능한 시나리오로 변환하여 자율주행 안전성 평가를 돕습니다.
NL2Scratch: 블록 기반 프로그래밍을 위한 실행 가능한 벤치마크 및 평가
텍스트 기반 NL2Code 연구의 한계를 넘어, 블록 기반 프로그래밍인 Scratch를 위한 실행 가능한 벤치마크 NL2Scratch를 제안합니다. 새로운 평가 지표인 SAC를 통해 기존 지표가 놓치던 모델의 의미론적 오류를 정밀하게 측정합니다.
MeshFlow: 등변 Flow Matching을 이용한 메쉬 생성
MeshFlow는 메쉬의 대칭성을 유지하며 삼각형 수프 형태로 3D 메쉬를 직접 생성하는 새로운 연구입니다. 등변 최적 운송 플로우 매칭을 통해 기존 자기회귀 방식보다 약 18배 빠른 추론 속도와 높은 품질을 달성했습니다.
CFAgentBench: 자율 건설-금융 에이전트를 위한 재현 가능한 환경 및 벤치마크
자율 건설-금융 에이전트의 성능을 평가하기 위한 재현 가능한 벤치마크인 CFAgentBench를 소개합니다. 실제 소프트웨어 스택을 모사한 실행 가능한 환경을 통해 에이전트의 기능적 정확성을 엄격하게 검증합니다.
신호는 어디에 존재하는가? 의료 인코더 사전 학습을 위한 웹 데이터 레시피
의료 도메인 인코더의 성능 향상을 위해 웹 데이터 큐레이션 레시피를 제안합니다. 의료 용어 밀도 필터링과 LLM을 활용한 신호 증폭 재구문 기법을 통해 프랑스어 의료 NLP 성능을 극대화했습니다.
Arbor: 제어 가능한 3D 에셋 생성을 위한 명시적 기하학적 조건화 (Explicit Geometric Conditioning)
Arbor는 텍스트 및 이미지 기반 3D 생성 시 공간적 제어를 가능하게 하는 새로운 연구입니다. 제약 메쉬(constraint meshes)를 통해 객체가 존재해야 할 영역, 피해야 할 영역, 접촉해야 할 영역을 명시적으로 지정할 수 있습니다.
시맨틱 브라우징 (Semantic Browsing): 이미지 생성을 위한 제어 가능한 다양성
텍스트-이미지 모델의 시각적 다양성 부족 문제를 해결하기 위해 '시맨틱 브라우징' 기술을 제안합니다. VLM과 에이전트 워크플로우를 활용하여 사용자가 의미 있는 변동 축을 따라 창의적으로 이미지를 탐색할 수 있도록 돕습니다.
멱등적 생성을 위한 인코더-디코더 매니폴드 정렬 (Encoder-Decoder Manifold Alignment for Idempotent
생성 모델의 멱등성을 보장하기 위해 인코더와 디코더 간의 매니폴드 불일치 문제를 해결하는 새로운 학습 프레임워크를 제안합니다. 기하학적 구조를 정렬함으로써 반복적인 적용 시에도 안정적인 투영과 일관된 출력을 유지할 수 있습니다.
추론 모델은 자신의 사고 사슬 (Chain of Thought) 변화를 감지할 수 있는가?
추론 모델이 자신의 사고 사슬(CoT)에 가해진 인위적인 개입이나 편집을 감지할 수 있는지에 대한 연구를 다룹니다. 실험 결과, 모델들은 자신의 CoT 변화를 식별하는 데 매우 낮은 정확도를 보이며 타 모델의 CoT 변화를 감지하는 것과 유사한 수준의 능력을 나타냈습니다.
엔트로피 가이드 경계 감독을 통한 특이도 및 보정 인지 유방 초음파 분할
유방 초음파 병변 분할 시 발생하는 경계 누출과 위양성 문제를 해결하기 위해 엔트로피 가이드 경계 감독 기법을 제안합니다. 픽셀별 예측 엔트로피를 활용해 불확실한 경계에 학습을 집중함으로써, 분할 품질은 유지하면서 특이도와 확률 보정 성능을 크게 향상시켰습니다.
매니폴드 복원 혼합(Manifold Restore Mixing)을 통한 단백질 표현 학습 강화
단백질 표현 학습(PRL) 시 데이터 증강 과정에서 발생하는 구조적 파괴 문제를 해결하기 위해 매니폴드 복원 혼합(MRM) 기법을 제안합니다. 은닉 표현을 혼합하여 구조 정보를 복원하는 동시에, 샘플 난이도 스케줄러를 통해 학습 성능을 극대화합니다.
커리큘럼 강화학습 (Curriculum Reinforcement Learning)은 베이스 모델을 넘어 LLM의 추론 능력을 유도할 수 있는가
기존 RLVR 방식이 베이스 모델의 기존 지식 내에서 확률만 재배분하는 한계를 극복하기 위해 '경계 인식 커리큘럼 강화학습'을 제안합니다. 이 방식은 모델의 추론 능력 경계를 파악하고 그 너머의 패턴을 학습시켜 pass@1과 pass@k 성능을 모두 향상시킵니다.
Diffusion Integrated Gradients: 유연한 특징 기여도 산출을 위한 제어 가능한 경로 생성
기존 Integrated Gradients(IG)의 고정된 경로 문제를 해결하기 위해 확산 모델을 활용한 DiffIG 방법론을 제안합니다. DiffIG는 경로 생성을 조건부 생성 모델링 문제로 재정의하여, 사용자 가이드에 따라 제어 가능한 고품질의 특징 기여도를 산출합니다.
양자 머신러닝에서의 참조 프레임 없는 일반화 불가능성
양자 머신러닝에서 외부 참조 프레임이 없을 때 발생하는 일반화 불가능성 문제를 다룹니다. 학습 데이터가 특정 방향을 제공하지 않으면 유니터리 대칭성으로 인해 예측이 붕괴됨을 증명하며, 이를 해결하기 위한 물리적 구조의 필요성을 강조합니다.
모든 경로는 붕괴로 이어진다
트랜스포머의 어텐션 싱크, 표현 붕괴, 노름 계층화 현상이 어텐션뿐만 아니라 모든 콘텐츠 기반 라우팅 메커니즘에서 발생하는 공통적 병리 현상임을 규명합니다. 소프트맥스 어텐션이 키의 크기를 인식하지 못하는 특성으로 인해 라우팅이 집중되고 표현이 붕괴됨을 수학적으로 분석합니다.
웨어러블 A-mode 초음파 프로브를 이용한 손과 손목 전체의 운동학적 추적을 향하여
웨어러블 A-mode 초음파를 활용하여 손과 손목의 23개 자유도(DoFs)를 추적하는 새로운 프레임워크를 제안합니다. 소형 CNN 모델과 점진적 학습 전략을 통해 온디바이스 환경에서 저전력·저지연으로 정밀한 운동학적 추적을 구현했습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.