Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
SPOT-E: Frozen VLM을 위한 시각적 스포트라이트를 이용한 테스트 시간 엔트로피 셰이핑 (Test-Time Entropy
SPOT-E는 Frozen VLM의 증거 판독 능력을 개선하기 위한 테스트 시간 엔트로피 셰이핑 방법론입니다. GRPO 기반의 경량 튜닝을 통해 질문에 최적화된 시각적 스포트라이트를 생성하여 모델의 추론 성능과 강건성을 높입니다.
신뢰할 수 없는 파라미터 및 문맥 지식 탐색: LLM 추론을 위한 명시적 지식 충돌 해결
LLM의 내부 파라미터 지식과 외부 문맥 간의 충돌을 해결하기 위한 새로운 프레임워크 MACR을 제안합니다. 멀티 에이전트 추론 방식을 통해 지식 간 불일치를 능동적으로 분석하고 해결하여 추론 성능을 높입니다.
시각-언어-행동 (VLA) 모델의 파인튜닝에는 생각보다 더 적은 레이어가 필요합니다
VLA 모델의 레이어 간 표현 중복성을 활용하여 모델 깊이를 최대 50%까지 압축하는 training-free 구조적 압축 파이프라인을 제안합니다. 이를 통해 성능 저하 없이 파인튜닝 시간과 실시간 추론 속도를 획기적으로 개선했습니다.
편집적 정렬 (Editorial Alignment): LLM 매개 지식 전파에 편집 전문성을 참여시키는 참여적 접근 방식
LLM 기반 정보 서비스가 공공 지식 기관의 편집 권위를 위협하는 상황에서, 편집자의 전문성을 AI 인터페이스 설계에 반영하는 '편집적 정렬(Editorial Alignment)' 개념을 제안합니다. 북유럽 공공 기관과의 사례 연구를 통해 참여적 AI 디자인 프로세스를 탐구합니다.
학생이 그린 과학 모델에 대한 신뢰도 인지 자동 평가
학생이 그린 과학 모델 그림을 자동으로 채점하기 위해 Vision Transformer(ViT)를 활용한 연구입니다. 신뢰도 인지 채점 프레임워크를 통해 높은 신뢰도의 응답은 자동 채점하고, 불확실한 사례는 인간에게 넘기는 선택적 자동화 방식을 제안합니다.
Lagrange: 일반화된 엔드투엔드 (End-to-End) 주행을 위한 오픈 보캐블러리 (Open-Vocabulary) 및 에너지 기반 희소
Lagrange는 오픈 월드 자율 주행을 위해 제안된 새로운 엔드투엔드 프레임워크입니다. VLM을 활용한 오픈 보캐블러리 인지와 에너지 기반의 희소한 계획 방식을 결합하여, 계산 효율성과 차량 운동학적 준수 능력을 동시에 확보했습니다.
ELVA: 랭킹 기반의 범용 멀티모달 검색 탐색
ELVA는 멀티모달 검색 시 발생하는 '입도 무시(Grain Blindness)' 현상을 해결하기 위한 새로운 강화학습 프레임워크입니다. 랭킹 기반의 규칙 기반 보상을 통해 모델이 부정 샘플 간의 미세한 차이를 학습하도록 유도합니다.
그래프 구조적 얽힘 해소를 위한 적응형 대조 학습 기반 경계 임베딩 형성 (Boundary Embedding Shaping)
그래프 신경망(GNN)의 성능을 저해하는 구조적 얽힘 문제를 해결하기 위해 적응형 대조 학습 기반의 BES 모듈을 제안합니다. 결정 경계 근처의 가짜 상관관계를 억제하여 노드 분류 및 링크 예측 성능을 크게 향상시켰습니다.
지능형 고장 진단 시스템 (IFDS) 설계 시 데이터 부족 문제를 해결하기 위한 시스템 비선형성 활용
데이터가 부족한 상황에서 지능형 고장 진단 시스템(IFDS)을 구축하기 위해 시스템의 비선형성을 활용하는 새로운 접근 방식을 제안합니다. 다중 흥분 레벨 절차를 통해 CNN이 분석 가능한 이미지를 생성하며, 철도 팬터그래프 실험을 통해 데이터 증강 효과를 검증했습니다.
상호작용 궤적 마이닝을 통한 컴퓨터 사용 에이전트용 SKILL.md 생성 자동화
GUI 궤적 마이닝을 통해 컴퓨터 사용 에이전트용 기술 라이브러리(SKILL.md)를 자동 생성하는 3단계 파이프라인을 제안합니다. 연구 결과, 마이닝된 클러스터는 높은 순도를 보였으나 실제 정책 성능 향상 및 도메인 전이에는 한계가 있음을 확인했습니다.
SoftSkill: 문맥 적응을 위한 행동 압축 (Behavioral Compression)
SoftSkill은 에이전트의 행동 지침을 긴 자연어 마크다운 대신 압축된 연속적 문맥 객체(soft delta)로 변환하는 연구입니다. 동결된 모델의 백본을 유지하면서도 가상 토큰을 통해 작업 성능을 획기적으로 개선할 수 있음을 보여줍니다.
CRAX: 빠르고 안전한 강화학습 (RL) 벤치마킹
CRAX는 MuJoCo XLA(MJX)를 기반으로 구축된 빠르고 안전한 강화학습(RL) 벤치마킹 프레임워크입니다. 기존 CPU 기반 벤치마크 대비 최대 100배 빠른 속도를 제공하며, 다양한 환경과 난이도에서 Safe RL 방법론의 성능과 안전성 간 트레이드오프를 분석합니다.
공통 노이즈 내 Wasserstein 불확실성 하에서의 평균장 제어를 위한 강건한 $Q$-learning
공통 노이즈와 Wasserstein 불확실성 환경에서 이산 시간 평균장 제어 문제를 해결하기 위한 강건한 Q-learning 알고리즘을 제안합니다. 양자화-투영 방식과 Wasserstein 쌍대 재구성을 결합하여 알고리즘의 수렴성을 입증했습니다.
벡터 데이터베이스는 마법이 아닙니다, 내부에서 실제로 어떤 일이 일어나고 있는지 알아보겠습니다
벡터 데이터베이스의 내부 작동 원리인 HNSW와 IVF 인덱싱 구조를 심층 분석합니다. 단순 API 호출을 넘어 프로덕션 환경에서 발생할 수 있는 재현율 저하 및 지연 시간 문제를 해결하기 위한 핵심 파라미터와 거리 측정 지표 활용법을 다룹니다.

PowerBuilder의 PBL을 텍스트 형식으로 에스포트(Export)하는 절차
PowerBuilder의 바이너리 형식인 PBL 파일을 텍스트 형식으로 에스포트하는 방법을 설명합니다. 이를 통해 소스 코드를 Git으로 관리하고 AI가 읽기 쉬운 형태로 변환할 수 있습니다.
플랫폼별 상태 코드가 멀티 채널 퍼블리싱 디버깅을 용이하게 만드는 방법: 빌더를 위한 실무 노트
멀티 채널 퍼블리싱 환경에서 플랫폼별 상태 코드를 활용해 콘텐츠 배포의 검증 과정을 자동화하고 디버깅을 용이하게 하는 방법을 다룹니다. 단순 초안 작성을 넘어, 소스 계층의 근거(Grounding)를 설정하여 플랫폼 간 일관성을 유지하는 아키텍처의 중요성을 강조합니다.
JustDiag!: 책임 있는 근본 원인 분석 (RCA)을 위한 진단 근거 엔진
LLM을 활용한 근본 원인 분석(RCA) 시 답변의 신뢰성을 높이기 위해 진단 근거를 명시적으로 생성하는 JustDiag 엔진을 제안합니다. 증거, 가설, 충돌 사항 등을 추적하는 프로세스 중심의 접근법을 통해 운영 환경에서의 책임성을 강화합니다.
주제 범위, 역량 및 인지적 깊이에 따른 커리큘럼 정렬 측정: CS2013 및 CS2023에 적용된 종단적 프레임워크
컴퓨터 과학 학부 커리큘럼의 가이드라인 준수 여부를 측정하기 위한 새로운 human-in-the-loop 프레임워크를 제안합니다. CS2013과 CS2023을 대상으로 종단적 분석을 수행하여 지식 커버리지와 인지적 깊이의 변화를 정량적으로 측정했습니다.
LLM 지원 양자 내성 암호(PQC) 개발에서의 보안 코딩 드리프트: 게임화된 해결책
LLM이 생성한 코드가 보안 관행을 저하시키는 '보안 코딩 드리프트' 현상을 분석하고, 이를 해결하기 위해 게임화된 LLM 증강 보안 코딩 프레임워크를 제안하는 연구입니다. 양자 내성 암호(PQC) 구현 시 발생하는 보안 취약성을 인간과 AI의 상호작용 관점에서 다룹니다.
FAPO: 다단계 LLM 파이프라인의 완전 자율 프롬프트 최적화
FAPO는 다단계 LLM 파이프라인의 병목 현상을 진단하고 프롬프트와 체인 구조를 자율적으로 최적화하는 프레임워크입니다. 벤치마크 테스트 결과, 기존 방식보다 뛰어난 성능 향상을 보이며 범용 및 보안 작업 모두에서 탁월한 효과를 입증했습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.