본문으로 건너뛰기

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

전체 AI Research AI Engineering Claude Code Codex Game Dev Hardware & Silicon Finance & Markets AI Design

이 피드의 글은 AI가 공개된 소스를 자동으로 수집·요약·번역한 것이에요. 저작권 안내를 확인해주세요.

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

필터arXiv cs.AI2771건

arXivAI 번역논문

O-VAD: 객체 중심 추적 및 추론을 통한 산업용 비디오 이상 탐지 (Industrial Video Anomaly Detection)

산업용 비디오 이상 탐지(IVAD)를 위해 객체의 상태 변화를 추적하는 학습이 필요 없는 에이전트 기반 프레임워크인 O-VAD를 제안합니다. 이 방법은 도메인 지식 주입 없이도 객체의 시공간적 역동성을 추적하여 비정상 객체를 식별하며, 기존 VLM 및 미세 조정된 모델보다 뛰어난 성능을 보입니다.

arXivAI 번역논문

스마트 그리드를 위한 LLMs 및 에이전트형 AI 시스템: 아키텍처와 응용에 관한 튜토리얼

스마트 그리드 분야에서 LLM과 에이전트형 AI를 활용한 예측, 최적화, 제어 시스템 설계 원칙을 다룹니다. 신뢰할 수 있는 솔버를 기반으로 한 설계 원칙과 4가지 사례 연구를 통해 에이전트의 오케스트레이션 능력과 도구의 계산 능력을 결합한 아키텍처를 제안합니다.

arXivAI 번역논문

현대적 VLM에서의 강력한 픽셀 수준 이미지 변조 탐지를 위한 단순한 도메인 일반화 (Domain Generalization)

현대적 VLM이 생성한 이미지의 변조를 탐지하기 위한 도메인 일반화(Domain Generalization) 연구를 소개합니다. 균형 잡힌 미니배치 샘플링과 후기 주입 전략을 통해 새로운 VLM 분포에서도 견고한 픽셀 수준 변조 위치 탐지가 가능함을 입증했습니다.

arXivAI 번역논문

압박 속에서의 논리적 판단: 학습된 소프트 접두사(Soft Prefixes)를 통한 삼단논법 안정성 진단

소프트 접두사(Soft Prefixes)를 활용하여 LLM의 삼단논법 추론 안정성을 진단한 연구입니다. Qwen 및 Gemma 모델을 대상으로 실험한 결과, 특정 연속 벡터가 모델의 논리적 판단을 의도적으로 오답으로 유도하며, 이는 논리적 연산보다는 광범위한 답변 선호도 편향에 기인함을 밝혀냈습니다.

arXivAI 번역논문

시각적 내비게이션을 위한 적응형 안전 마진 학습

로봇의 실내 내비게이션 시 고정된 안전 마진 문제를 해결하기 위해 적응형 여유 공간 선호도를 학습하는 안전 비평가 모델을 제안합니다. 확산 기반 플래너의 궤적 중 최적을 선택하도록 설계되었으며, 시뮬레이션 학습 후 휴머노이드 로봇에 성공적으로 전이되었습니다.

arXivAI 번역논문

GigaPath-Flash 및 GigaTIME-Flash: 전체 슬라이드 및 종양 미세환경 분석을 위한 효율적인 병리 파운데이션 모델

GigaPath-Flash와 GigaTIME-Flash는 대규모 조직병리 데이터 분석을 위한 효율적인 파운데이션 모델입니다. 지식 증류 기술을 통해 계산 비용을 획기적으로 줄이면서도 높은 성능을 유지하며, 오픈 웨이트로 공개되어 정밀 의료 연구를 지원합니다.

arXivAI 번역논문

엣지 디바이스에서의 저지연 EEG 분류를 위한 미분 가능한 논리 게이트 네트워크 (Differentiable Logic Gate

엣지 디바이스에서 저지연 EEG 분류를 위해 비트 연산 기반의 미분 가능한 논리 게이트 네트워크(Diff-Logic)를 제안합니다. 기존 MLP 대비 뛰어난 속도와 메모리 효율성을 보여주며, 자원 제한적인 BCI 환경에 최적화된 패러다임을 제시합니다.

arXivAI 번역논문

언어 모델은 분자 결합을 꿈꾸는가? 공간적 제약 조건 하에서의 LLM 벤치마킹

본 연구는 LLM이 3D 공간 제약 조건 하에서 분자 결합을 설계하는 능력을 체계적으로 분석합니다. 새로운 벤치마킹 전략인 3D-Fit을 통해 LLM의 공간적 추론 능력을 평가하며, 기존 확산 모델 대비 성능과 확장 가능성을 탐구합니다.

arXivAI 번역논문

자동화된 발견에는 보편적으로 우월한 하네스(Harness)가 존재하지 않는다

자율 발견 시스템(OpenEvolve, TTT-Discover 등)의 하네스 설계가 특정 문제에 최적화되어야 함을 입증하는 연구입니다. 실험 결과, 모든 상황에 우월한 범용 하네스는 없으며 초기 성능을 바탕으로 자원을 재할당하는 적응형 방식이 더 효과적임을 밝혔습니다.

arXivAI 번역논문

성찰적 LLM을 향하여: 정신 건강 분야에서 LLM 정렬 평가 및 개선을 위한 모듈형 프레임워크

정신 건강 분야를 중심으로 LLM의 윤리적 정렬을 평가하고 개선하기 위한 모듈형 프레임워크를 제안합니다. 이 프레임워크는 새로운 모델과 벤치마크를 유연하게 통합할 수 있는 확장 가능한 구조를 갖추고 있습니다.

arXivAI 번역논문

HOL에서 일차 모달 논리: 자동 충실도를 갖는 깊은 및 얕은 임베딩 (확장 프리프린트)

Isabelle/HOL 환경에서 일차 모달 논리(FML)를 심층 및 얕은 임베딩 방식으로 확장하는 연구를 소개합니다. 상수 도메인 Kripke 의미론을 활용하여 세 가지 임베딩 방식을 제안하며, Löwenheim-Skolem 정리를 메커제니제이션하여 충실성 증명을 자동화했습니다.

arXivAI 번역논문

지오폴리머 혼합물의 대리 모델 기반 역설계(Inverse Design)를 위한 점진적 트랜스포머(Incremental Transformer)

지오폴리머 혼합물 설계 시 소규모 및 이질적 데이터를 활용하기 위한 점진적 트랜스포머(INCRT) 기반의 역설계 프레임워크를 제안합니다. 물리적 제약과 위상 인식을 결합하여 신뢰할 수 있는 혼합물 후보를 선별하는 데 중점을 둡니다.

arXivAI 번역논문

증거 기반 비디오 질의응답 (Evidence-Backed Video Question Answering)

비디오 LLM의 블랙박스 문제를 해결하기 위해 시공간적 증거를 함께 출력하는 E-VQA 과제를 제안합니다. 인간 검증 벤치마크인 ST-Evidence와 160k 규모의 데이터셋을 통해 설명 가능한 비디오 이해 성능을 크게 향상시켰습니다.

arXivAI 번역논문

TerraZero: 대규모 제로 데몬스트레이션(Zero-Demonstration) 셀프 플레이를 위한 절차적 주행 시뮬레이션

TerraZero는 대규모 강화학습을 위한 절차적 주행 시뮬레이터이자 셀프 플레이 훈련 스택입니다. 인간의 데몬스트레이션 없이도 GPU 기반의 고속 시뮬레이션을 통해 자율 주행 에이전트를 효율적으로 훈련하며, 뛰어난 제로샷 일반화 성능을 보여줍니다.

arXivAI 번역논문

장기적 개인 건강 관리를 위한 자기 진화형 에이전트

개인의 변화하는 루틴과 건강 데이터를 반영하여 스스로 진화하는 오픈 소스 에이전트 아키텍처 HealthClaw를 소개합니다. 장기 기억과 안전 규칙을 분리하여 답변 정확도를 획기적으로 높이고 프롬프트 컨텍스트 노출을 줄였습니다.

arXivAI 번역논문

AI 평가를 위해 문항 반응 이론 (IRT)을 신뢰할 수 있는가?

AI 벤치마크 평가에 활용되는 문항 반응 이론(IRT)의 신뢰성을 분석한 연구입니다. AI 데이터의 특수성이 기존 IRT 추정 도구의 성능과 신뢰성에 미치는 영향을 시뮬레이션을 통해 체계적으로 조사했습니다.

arXivAI 번역논문

HCIG: 멀티모달 풍자 및 사이버불링 탐지를 위한 계층적 교차 모드 불일치 그래프 네트워크

텍스트와 시각 정보 간의 불일치를 활용해 멀티모달 풍자 및 사이버불링을 탐지하는 HCIG 프레임워크를 제안합니다. 그래프 어텐션 네트워크를 통해 토큰, 구, 전역 수준의 계층적 의미 불일치를 모델링하여 기존 방식보다 정교한 추론을 수행합니다.

arXivAI 번역논문

DADiff: 강화학습을 위한 확산 모델 기반의 교차 도메인 정책 적응 (Diffusion-Driven Cross-Domain Policy

강화학습에서 도메인 간 역학 불일치 문제를 해결하기 위해 확산 모델을 활용한 DADiff 프레임워크를 제안합니다. 생성 궤적의 차이를 이용해 역학을 추정하고, 보상 수정 및 데이터 선택 방식을 통해 타겟 도메인으로의 정책 적응을 수행합니다.

arXivAI 번역논문

사전 학습부터 후속 학습까지의 추론 이해하기

본 논문은 LLM의 복잡한 추론 능력을 이해하기 위해 사전 학습(Pre-training)부터 강화학습(RL)까지 전체 파이프라인을 연구합니다. 체스 게임이라는 통제된 테스트베드를 사용하여, RL 성능이 사전 학습 단계에서 형성되는 손실로부터 예측 가능하며, 어려운 문제에서는 SFT만으로는 얻기 어려웠던 능력을 발현함을 입증했습니다.

arXivAI 번역논문

CRAFT: 약한 LLM 역량을 진단하고 목표 지능형 파인튜닝 데이터를 생성하기 위한 클러스터링 루브릭

CRAFT는 기존 평가 시스템의 한계를 극복하고, LLM이 실패한 근본적인 역량(capability)을 진단하는 새로운 방법을 제시합니다. 이는 루브릭 기반 평가 데이터셋을 모델 특정 약점 진단으로 변환하여 계층적 역량 트리로 클러스터링합니다. 이 과정을 통해 목표 지능형 지도 학습 파인튜닝 데이터를 생성할 수 있습니다.

이전6 / 139전체 139페이지 중 6페이지다음