본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.AI 371필터 해제

arXiv논문

Less Is More: 모바일 애플리케이션 내장 소형 언어 모델 (SLM) 통합의 공학적 도전과제

본 논문은 모바일 애플리케이션 내장 소형 언어 모델(SLMs)의 공학적 도전과제를 실제 사례 연구를 통해 분석했습니다. 개발팀이 단어 추측 게임에 SLM을 통합하는 과정에서, 초기 야심찬 설계가 구조화된 퍼즐 생성 실패로 인해 실용적인 아키텍처로 급격히 수정되는 과정을 기록했습니다. 이 경험을 바탕으로, 장치 내 SLM의 성공적 적용을 위해 출력 형식 위반, 지연 시간 문제 등 다섯 가지 주요 실패 범주와 이를 해결한 구체적인 프롬프트 엔지니어링 및 시스템 설계 전략들을 제시합니다.

slmson-device-aimobile-development
6일 전4
arXiv논문

그린 실드 (Green Shielding): 신뢰할 수 있는 AI 를 위한 사용자 중심 접근법

본 논문은 LLM이 사용자의 일상적이고 비적대적인 입력 변화에 민감하게 반응하는 문제를 해결하기 위해 '그린 실드(Green Shielding)'라는 사용자 중심의 접근법을 제안합니다. 이 방법론은 Context, 참고 표준, 실제 유용성(Utility)을 포착하는 벤치마크와 현실적인 교란(perturbations)을 통해 모델 행동 변화를 특징화하고, 특히 의료 진단 분야에서 PCS 프레임워크 기반으로 구현되었습니다. 연구 결과, 일반 사용자 수준의 입력 변경은 모델 출력의 타당성을 높이고 간결하게 만들지만, 안전에 중요한 질환에 대한 포괄성 감소와 같은 트레이드오프가 발생할 수 있음을 보여주며, 고위험 분야에서의 안전한 LLM 배포를 위한 지침을 제공합니다.

llmsai-safetymedical-diagnosis
6일 전5
arXiv논문

관찰할 수 없는 것을 통제하기: 자율 AI 에이전트를 위한 적응형 런타임 거버넌스

본 논문은 자율 AI 에이전트가 코드 변경 없이도 발생할 수 있는 행동 드리프트, 적대자 적응 등으로 인한 안전성 문제를 다루기 위해 '정보적 생존 가능성 원칙(Informational Viability Principle)'을 제안합니다. 이 원칙에 따라 에이전트의 행동은 추정된 위험 상한선($ ext{B}(x)$)보다 큰 안전 마진 내에서만 허용됩니다. 이를 구현하는 'RiskGate' 프레임워크는 모니터링, 예견, 단조 제한이라는 세 가지 속성을 기반으로 하며, 예측형 거버넌스(Predictive Governance)를 제공하여 AI의 신뢰성과 안전성을 강화합니다.

autonomous-agentsai-governancesafety-critical
6일 전4
arXiv논문

패턴 기반 지식 구성 요소 (KC) 를 활용한 학생 코드 제출에 따른 개인화된 풀이 예제 생성

본 연구는 학생이 제출한 코드에서 패턴 기반 지식 구성 요소(KC)를 추출하고 이를 활용하여 개인화된 풀이 예제를 생성하는 접근법을 제시합니다. 기존의 고정된 라이브러리 기반 학습 콘텐츠는 학생의 실제 오류나 부분적 해결책과 괴리가 있어 비효율적이었습니다. 제안된 파이프라인은 AST 분석으로 코드 패턴을 추출하고, 이를 조건(condition)으로 사용하여 생성 모델을 조향함으로써, 학생의 논리적 오류와 주제적 초점에 맞는 관련성 높은 풀이 예제를 제공하여 대규모 개인화 학습을 지원할 수 있음을 입증했습니다.

personalized-learningcode-generationknowledge-components
6일 전4
arXiv논문

의료 기본 모델 임베딩에서의 양자 커널 우위와 고전적 붕괴에 대한 증거

본 연구는 MIMIC-CXR 흉부 X-선 영상 기반 이진 보험 분류 작업에서 양자 지원 벡터 머신(QSVM)의 성능을 검증했습니다. 세 가지 의료 기본 모델 임베딩을 활용하여, QSVM이 고전적 선형 SVM 대비 통계적으로 유의미한 F1 점수 향상을 보이며 '양자 커널 우위'를 입증했습니다. 특히, 고전적 방법론은 큐비트 수에 관계없이 다수 클래스 예측으로 붕괴되는 현상이 관찰된 반면, QSVM은 높은 재현율을 유지하며 성능 우위를 지속적으로 보여주었습니다.

quantum-machine-learningqsvmmedical-imaging
6일 전3
arXiv논문

연속 확산 음성 언어 모델의 스케일링 특성

본 논문은 기존의 이산 자기회귀(AR) 방식보다 연속 확산(CD) 기반의 음성 언어 모델(SLM)이 더 실현 가능함을 탐구합니다. 연구진은 CD SLM을 통해 스케일링 법칙을 분석하고, 계산 규모가 커질수록 최적 토큰-파라미터 비율이 감소하는 경향을 발견했습니다. 이 접근 방식은 빠른 추론의 잠재력을 보여주지만, 장문 일관성 확보는 여전히 해결해야 할 과제로 남아있습니다.

speech-synthesislanguage-modelsdiffusion-models
6일 전4
arXiv논문

Kwai Summary Attention 기술 보고서

긴 컨텍스트 처리는 LLM의 핵심 과제이지만, 표준 어텐션 메커니즘은 시퀀스 길이에 따라 2차 시간 복잡도로 인해 메모리 및 계산 비용이 급증하는 문제가 있습니다. 기존 해결책들은 KV 캐시를 줄이거나 로컬 주의에 의존하지만, 이는 성능과 효율성 사이의 트레이드오프가 존재합니다. 본 보고서는 이 간극을 메우기 위해, 컨텍스트를 학습 가능한 요약 토큰으로 압축하여 시퀀스 모델링 비용을 낮추는 새로운 'Kwai Summary Attention (KSA)' 메커니즘을 제안합니다.

llmattention-mechanismlong-context
6일 전7
arXiv논문

PhysNote: 진화 가능한 물리 추론을 위한 자기 지식 노트

PhysNote는 비전-언어 모델(VLMs)이 동적인 현실 시나리오에서 겪는 시간적 일관성 및 인과 추론의 한계를 극복하기 위해 설계된 에이전트 프레임워크입니다. 이 프레임워크는 물리 지식을 '지식 노트'라는 형태로 외부화하고 정제하는 메커니즘을 도입합니다. PhysNote는 공간-시간적 정규화를 통해 동적인 지각을 안정화시키고, 자기 생성 통찰력을 계층적 저장소에 조직하며, 반복적인 추론 루프를 거쳐 검증된 지식을 통합함으로써 물리 추론의 정확도를 크게 향상시킵니다.

vlmphysical-reasoningagent-framework
6일 전4
arXiv논문

XPU 를 통한 비전 - 언어 - 행동 (VLA) 모델 특성화: 온로봇 배포를 위한 제약 조건 및 가속화

본 논문은 범용 로봇 제어에 사용되는 VLA(Vision-Language-Action) 모델을 온로봇 환경에 배포할 때 발생하는 비용, 에너지, 시간적 제약을 다룹니다. 기존 연구가 데스크톱 GPU에 의존하여 엣지 가속기의 실제 성능을 제대로 평가하지 못했음을 지적하며, 모델과 하드웨어의 공동 특성화 분석을 통해 효율적인 저비용 엣지 디바이스를 제시합니다. 또한, VLM 백본과 액션 전문가 간의 추론 패턴 비효율성을 발견하고, DP-Cache 및 V-AEFusion이라는 새로운 최적화 기법을 제안하여 GPU와 NPU 환경 모두에서 높은 속도 향상을 달성했습니다.

vlaroboticsedge-ai
6일 전2
arXiv논문

SPLIT: 이미지 기반 촉각 센서를 위한 잠재적 산술을 통한 물리적 접촉 분리

본 논문은 로봇 촉각 센서 데이터 부족 문제를 해결하기 위해 이미지 기반 촉각 센서를 시뮬레이션하는 새로운 방법인 SPLIT을 제안합니다. SPLIT의 핵심은 접촉 기하학을 센서별 광학적 특성으로부터 분리하는 잠재 공간 산술 전략을 사용하는 것입니다. 이 접근 방식은 다양한 센서(DIGIT 배경)에 대한 재교정 없이 데이터 전이가 가능하며, 빠른 추론 속도와 가변 해상도의 유한 요소법 시뮬레이션을 제공하여 로봇 촉각 감지 연구의 효율성을 크게 높입니다.

robotic-tactile-sensingsimulationimage-based-sensors
6일 전2
arXiv논문

Generative Recommendation 을 위한 행동 강도 및 전이 모델링

본 논문은 다양한 상호작용 유형을 모델링하여 사용자의 전환을 예측하는 다중 행동 추천 시스템의 한계를 개선하기 위해 제안된 'BITRec'이라는 새로운 생성적 프레임워크를 소개합니다. 기존 방법들이 행동 강도 차이나 전이 패턴 포착에 실패했던 문제를 해결하고자, BITRec은 계층적 행동 집계(HBA)와 명시적인 관계 행렬을 이용한 전이 관계 인코딩(TRE)을 도입했습니다. 대규모 데이터셋 실험 결과, 여러 주요 추천 지표에서 15~23%의 높은 성능 향상을 입증하며 그 효과를 보여주었습니다.

recommendation-systemsmulti-behaviorgenerative-modeling
6일 전3
arXiv논문

인간-AI 팀워크에서의 성공적인 협력 측정: 인지된 협력성 및 팀워크 인식 척도의 개발과 검증

본 논문은 인간과 AI의 협력이 증가함에 따라, 그 주관적인 품질을 측정할 수 있는 두 가지 이론 기반 척도(PCS 및 TPS)를 개발하고 검증했습니다. PCS는 단일 상호작용에서의 인지된 협력 능력을 포착하며, TPS는 장기적이고 발생적인 팀워크의 느낌을 측정합니다. 이 척도들은 카드 게임, LLM 상호작용 등 다양한 환경에서 높은 신뢰성과 타당성을 보여주었으며, 향후 인간-AI 시스템 평가에 중요한 기초 자료를 제공할 것으로 기대됩니다.

human-ai-collaborationmeasuring-cooperationllm-interaction
6일 전3
arXiv논문

GAMMAF: LLM 다중 에이전트 시스템의 그래프 기반 이상 탐지 벤치마킹을 위한 공통 프레임워크

본 기술 기사는 LLM 다중 에이전트 시스템(MAS)의 취약점을 탐지하기 위한 표준화된 벤치마킹 프레임워크인 GAMMAF를 소개합니다. MAS는 협업 능력을 높였지만, 프롬프트 감염 등 새로운 공격 표면을 노출시켰습니다. GAMMAF는 합성 데이터셋 생성과 실시간 방어 모델 평가라는 두 가지 파이프라인을 통해 다양한 네트워크 토폴로지에서 에이전트 상호작용 데이터를 포착하고, 이를 활용하여 기존 및 미래의 이상 탐지 방어 메커니즘 성능을 체계적으로 벤치마킹할 수 있게 합니다.

llmmulti-agent-systemanomaly-detection
6일 전2
arXiv논문

배치 정렬형 저정밀도 신경망 구조 탐색을 위한 우주 탑재 엣지 AI

본 논문은 엣지 AI 환경에서 발생하는 구조-정밀도 불일치 문제를 해결하기 위한 새로운 접근 방식을 제시합니다. 기존의 하드웨어 인식 신경망 구조 탐색(NAS) 방법들은 정밀도를 전제로 최적화한 후 저정밀도를 나중에 적용하여, 실제 배치 실행 시 정확도가 크게 떨어지는 문제가 있었습니다. 연구진은 이 한계를 극복하고자 '배치 정렬형 저정밀도 학습'을 NAS 파이프라인에 직접 통합했습니다. 제안된 프레임워크는 후보 구조를 탐색하는 과정(미세 조정 및 평가)에서부터 FP16과 같은 낮은 정밀도의 수치적 제약을 노출시켜, 구조적 효율성과 저정밀도 하에서의 견고성을 동시에 최적화합니다. 우주 탑재 해상 모니터링 태스크에 적용한 결과, 기존 방식 대비 정확도 손실을 크게 줄여 모델 복잡도를 증가시키지 않으면서 높은 성능을 유지할 수 있음을 입증했습니다.

edge-ainaslow-precision
6일 전4
arXiv논문

왜 AI 피해는 한 번의 정체성으로는 해결될 수 없는가: 5,300 건의 사고 보고서가 교차성 (Intersectionality) 에 대해 드러낸 것

본 기사는 기존 AI 위험 평가 방법론이 개별 정체성 범주를 중심으로 구축되어 있어, 실제 발생하는 교차적 피해(intersectional harms)를 제대로 포착하지 못하고 있음을 지적한다. 5,300건의 AI 사고 보고서를 분석한 결과, AI로 인한 피해는 단일 정체성 범주에서 발생하기보다 여러 정체성 범주가 교차하는 지점에서 훨씬 더 심각하게 증폭되는 것으로 나타났다. 따라서 향후 AI 위험 평가는 인종과 성별 같은 개별 범주를 넘어, 다양한 정체성 간의 상호작용(교차성)을 핵심 구성 요소로 포함해야 한다고 주장한다.

ai-ethicsrisk-assessmentintersectionality
6일 전2
arXiv논문

내감각 기반 기계 프레임워크: 인공지능 내의 규제 구조를 위한 내감각 영감을 받은 접근

본 글은 생물학적 개념인 내감각(interoception)에서 영감을 받아 '내감각 기반 기계 프레임워크'를 제안합니다. 이 프레임워크는 내부 상태 모니터링, 통합 및 규제 원리를 계산 구조로 변환하여 AI 시스템의 자율성과 적응성을 높이는 것을 목표로 합니다. 핵심적으로 항상성, 알로스타시스, 에나틱이라는 세 가지 기능적 원리를 통해 AI가 불확실한 환경에서도 견고하게 자기 규제하고 능동적으로 상호작용할 수 있도록 설계하는 방법을 제시합니다.

interoceptionembodied-aiself-regulation
6일 전3
arXiv논문

STELLAR-E: 맞춤형 엔드투엔드 LLM 애플리케이션 엄밀한 평가자를 위한 합성 데이터 시스템

본 논문은 사생활 보호 및 비용 문제로 인해 기존 데이터셋 확보가 어려운 상황에서, 사용자 지정 크기의 고품질 합성 데이터셋을 생성할 수 있는 전자동 시스템 STELLAR-E를 제안합니다. 이 시스템은 TGRT Self-Instruct 프레임워크 기반의 합성 데이터 엔진과 통계적/LLM 기반 평가 파이프라인으로 구성되어 있습니다. STELLAR-E는 기존 벤치마킹 대비 높은 성능 향상을 보여주며, 대형 및 소형 LLM을 포괄적으로 평가할 수 있는 확장 가능하고 공정한 자동화 품질 보증 프레임워크를 제공합니다.

llmsynthetic-databenchmarking
6일 전5
arXiv논문

GradMAP: 그리드-에지 유연성을 위한 기반 강화학습 다중 에이전트 근접 학습

GradMAP은 그리드 에지 환경의 대규모 기기 군집을 조정하기 위해 기반 강화학습 다중 에이전트 근접 학습(GradMAP)을 제안합니다. 이 방법은 각 에이전트에 독립적인 신경망 정책을 학습시키고, 온라인 의사결정 시 통신 없이 로컬 관측만 사용하면서도 3상 AC 배전망의 물리 법칙과 네트워크 제약 조건을 준수하도록 설계되었습니다. GradMAP은 원형-쌍대 학습 루프와 암묵적 미분을 사용하여 정확한 전력 흐름 모델을 통합하고, 근접 서브리거트를 통해 환경 그래디언트 재사용으로 높은 학습 효율성을 달성하여 복잡한 그리드 제어 문제를 효과적으로 해결합니다.

reinforcement-learningmulti-agent-systempower-systems
6일 전2
arXiv논문

계층적 행동 공간 (Hierarchical Behaviour Spaces)

본 논문은 기존 강화학습에서 옵션 보상 함수를 사용하는 방식의 한계를 극복하기 위해 '계층적 행동 공간(HBS)'이라는 새로운 프레임워크를 제안합니다. HBS는 컨트롤러가 단일 보상 함수 대신 여러 보상 함수의 선형 조합을 지정하게 함으로써, 기존보다 훨씬 표현력이 풍부한 정책 집합을 생성할 수 있습니다. NetHack 환경에서 테스트된 이 방법은 특히 장기 추론보다는 탐색 능력 향상을 통해 강력한 성능 개선을 입증했습니다.

reinforcement-learninghierarchical-rlbehavior-spaces
6일 전3
arXiv논문

보편적인 차트-코드 생성을 위한 정렬된 다중 뷰 스크립트

본 논문은 차트 이미지를 다양한 프로그래밍 언어(Python, R, LaTeX)의 실행 가능한 코드로 변환하는 '차트-코드 생성' 문제를 다룹니다. 기존 방법들이 파이썬에 국한되거나 감독 정보 활용에 미흡했던 한계를 극복하기 위해, 연구진은 정렬된 스크립트를 제공하고 176K개의 차트로 구성된 데이터셋 Chart2NCode를 소개합니다. 또한, LLaVA 기반 아키텍처에 언어 조건부 저랭크 서브스페이스 혼합을 추가한 효율적인 적응 모듈 CharLuMA를 제안하여, 여러 언어에서 일관되고 시각적으로 충실한 코드 생성을 달성했습니다.

chart-to-codemultimodal-generationllava
6일 전3

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.