본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv논문

(포스터) 센서에서 통찰력까지: 센서 기반 애플리케이션을 위한 빠른 엣지-코어 애플리케이션 개발

본 논문은 센서 데이터를 원본 스트림에서 실질적인 통찰력으로 변환하는 과정의 복잡성을 해결하기 위해, 패턴 기반 AI 보조 방법론을 제시합니다. 이 방법론은 'Pegasus 워크플로우'를 통해 코드를 기반으로 한 설계 방식에서 의도를 기반으로 하는 설계 방식으로 애플리케이션 개발 프로세스를 혁신합니다. 이를 통해 기존 센서 데이터 처리 워크플로우를 재사용 가능한 템플릿으로 구축하고, BlueField-3 DPUs와 같은 다양한 엣지 리소스로 쉽게 확장할 수 있음을 입증했습니다.

edge-computingsensor-dataai-assisted
1일 전5
HuggingFace헤드라인

Hugging Face inference providers DeepInfra 🚀

Hugging Face가 DeepInfra를 공식 Inference Provider로 추가하여, 사용자들이 Hugging Face Hub의 모델 페이지에서 직접 서버리스 AI 추론 기능을 확장할 수 있게 되었습니다. 이를 통해 개발자들은 최소한의 설정으로 100개 이상의 다양한 오픈 웨이트 LLM(예: DeepSeek V4, Kimi-K2.6)을 애플리케이션에 통합할 수 있습니다. 이 기능은 Python 및 JavaScript SDK를 통해 원활하게 통합되며, 사용자는 자신의 API 키를 직접 사용하거나 Hugging Face 계정을 통해 라우팅하여 비용을 관리할 수 있습니다. DeepInfra는 경쟁력 있는 토큰 단가를 제공하는 서버리스 AI 추론 플랫폼이며, 현재 텍스트 생성 및 대화형 작업을 지원하며, 향후 이미지/비디오 등 더 많은 모달리티를 지원할 예정입니다. 또한, 이 기능은 Pi, OpenCode와 같은 다양한 Agent Harness에 통합되어 개발 편의성을 극대화합니다.

hugging-facedeepinfrallm
1일 전3
HuggingFace헤드라인

무엇에 맞춰야 할까? MiniMax M2 의 에이전트 일반화 재고

LLM 에이전트 개발에서 벤치마크 성능과 실제 세계의 일반화 가능성 사이의 간극을 메우는 것이 핵심 과제입니다. 글쓴이는 M2를 설계하며, 단순히 높은 점수를 얻는 것보다 '야생(wild)' 환경에 견고하게 작동하는 에이전트를 만드는 데 집중했습니다. 이를 위해 에이전트가 임무 전반에 걸쳐 지속적으로 내부 독백(Interleaved Thinking)을 수행하도록 설계했는데, 이는 장기적인 일관성 유지와 외부 교란에 대한 적응력을 높이는 결정적인 요소입니다.

llm-agentsagent-generalizationinterleaved-thinking
1일 전4
arXiv논문

센서에서 통찰력까지: 센서 기반 애플리케이션을 위한 빠른 엣지-코어 애플리케이션 개발

본 논문은 과학자들이 증가하는 센서 데이터를 활용하여 통찰력을 얻는 과정에서 발생하는 어려움, 특히 엣지-클라우드 환경에서의 복잡한 데이터 처리 및 배포 문제를 해결하기 위한 경험 중심 방법론을 제시합니다. 이 방법론은 패턴 기반 워크플로우 엔지니어링과 AI 보조 개발(AI-assisted development)을 결합하여, 재사용 가능한 템플릿을 통해 다양한 센서 기반 애플리케이션(예: 수중 음향, 공기 질 모니터링)의 빠른 프로토타이핑 및 배포를 가능하게 합니다. 궁극적으로 이 접근 방식은 비전문가도 복잡한 분산 인프라 환경에서 반복적인 탐색과 개발을 수행할 수 있도록 진입 장벽을 낮추는 것을 목표로 합니다.

sensor-dataedge-computingworkflow-engineering
1일 전6
arXiv논문

CoRAL: 접촉이 풍부한 적응형 LLM 기반 로봇 조작 제어

CoRAL은 대규모 언어 모델(LLMs)의 고수준 추론 능력과 저수준 로봇 제어 간의 격차를 해소하기 위해 설계된 모듈형 프레임워크입니다. 이 시스템은 LLM을 직접적인 컨트롤러가 아닌 목표 함수를 생성하는 '비용 설계자'로 활용하고, 샘플링 기반 운동 계획기(MPPI)와 결합하여 접촉이 풍부한 환경에서의 제로샷 적응적 조작을 가능하게 합니다. 특히 VLM을 통해 물리 파라미터의 의미론적 선행 정보를 제공받고, LLM은 상호작용 피드백에 따라 비용 함수를 반복적으로 조정하며 실시간으로 전략적 오류를 수정하여 높은 안정성과 성능을 달성합니다.

roboticsllmsvlms
1일 전4
arXiv논문

자원 스펙트럼에 걸친 의존 구문 분석: 고저 자원 언어에서의 아키텍처 평가

본 연구는 고자원 및 저자원 언어에서 의존 구문 분석을 위해 다양한 파서 아키텍처(Biaffine LSTM, Stack-Pointer Network, AfroXLMR-large, RemBERT)를 비교 평가했습니다. 특히 형태학적으로 복잡한 저자원 아프리카 언어에 초점을 맞춘 결과, Biaffine LSTM이 저자원 환경에서 변환기 모델을 일관되게 능가하는 성능을 보였습니다. 이는 충분한 주석 데이터가 부족한 저자원 구문 도구 개발 시 Biaffine LSTM이 더 적합할 수 있음을 시사합니다.

dependency-parsinglow-resource-nlptransformer-models
1일 전1
arXiv논문

자동 계획에서의 반팩트 추론 (Counterfactual Reasoning)

본 기사는 자동 계획(Automated Planning)이 고정된 규칙과 결정론적 실행에 의존하는 한계를 지적하며, 실제 세계의 복잡성을 다루기 위한 유연한 접근 방식을 제시한다. 핵심 주제는 '반팩트 추론(Counterfactual Reasoning)'을 자동 계획에 적용하는 방법으로, 이는 원래 작업 파라미터에서 편차를 허용하여 예상치 못한 상황이나 결과를 개선할 수 있게 한다. 논문은 이 분야의 기존 연구들을 분류하고 주요 발견과 향후 연구 방향을 제시한다.

automated-planningcounterfactual-reasoningai-planning
1일 전4
arXiv논문

장기 보관된 루틴 샘플을 활용한 AI 기반 전단 모델의 전립선 병리 검증

본 연구는 장기간 보존된 전립선 생검 코어 샘플을 활용하여 AI 기반의 전립선 병리 검증 모델인 GleasonAI를 평가했습니다. 이 모델은 1998년부터 2015년까지 수집된 데이터를 사용하여 개발되었으며, 코어 수준 ISUP 등급에 대해 높은 일관성(quadratic-weighted kappa 0.86)을 달성하며 우수한 성능을 보였습니다. 특히, 장기간의 시간적 변이에도 불구하고 안정적인 성능을 유지하여 AI 모델의 일반화 가능성을 입증했으며, 병리 보관소 데이터를 대규모 연구 자원으로 활용할 잠재력을 제시했습니다.

ai-modelspathologyprostate-cancer
1일 전4
arXiv논문

SCGNN: Granular-ball Computing 기반의 의미 일관성 강화 그래프 신경망

SCGNN(Semantic Consistency enhanced Graph Neural Network)은 Granular-ball Computing (GBC)을 활용하여 노드 간 의미 일관성을 효율적으로 포착하는 새로운 그래프 신경망 프레임워크입니다. 기존의 계산 복잡하고 확장성이 낮은 전역 검색 알고리즘 기반 접근법과 달리, SCGNN은 노드를 적응적으로 분할하여 그룹 수준의 의미 구조를 모델링함으로써 계산 비용을 절감하고 잡음에 대한 견고성을 높였습니다. 이 프레임워크는 구조 강화 모듈(Anchor 기반 그래프 구축)과 감독 강화 모듈(Label Consistency Checking 수행)이라는 이중 강화 전략을 통해 의미 일관성을 효과적으로 활용하며, 다양한 GNN 백본에 적용 가능합니다.

graph-neural-networkssemantic-consistencygranular-ball-computing
1일 전2
arXiv논문

ViewSAM: 약식 감시 기반 크로스 뷰 참조 멀티 객체 추적 (CRMOT) 을 위한 시점 인식을 고려한 크로스 모달 의미 학습

본 논문은 자연어 설명에 따라 여러 객체를 여러 카메라 시점에서 일관되게 추적하는 크로스 뷰 참조 멀티 객체 추적(CRMOT) 문제를 다룹니다. 기존 방법들이 고비용의 공간적 주석과 정체성 감독에 의존했던 한계를 극복하기 위해, 약식 감시(weak supervision) 접근 방식을 제안합니다. 연구진은 Foundation Model을 활용하여 생성된 트랙렛을 가짜 레이블(pseudo-label)로 사용하고, 시점 인식을 명시적으로 모델링한 ViewSAM이라는 2단계 프레임워크를 통해 강력한 크로스 뷰 참조 추적 성능을 달성했습니다.

cross-view-trackingmulti-object-trackingweak-supervision
1일 전4
arXiv논문

신뢰할 수 있는 AI 는 불변성 충돌에 고통받고 있으며 인과성이 해결책이다

AI 모델이 고위험 도메인에 배포되면서 신뢰성 확보가 중요해지고 있지만, 공정성, 강건성, 프라이버시 등 여러 목표 간의 상충 관계(trade-off) 문제가 발생하고 있습니다. 이 논문은 이러한 신뢰할 수 있는 AI의 트레이드오프를 데이터 생성 과정의 불변성 충돌 문제로 재해석하며, 인과적 추론이 이 문제를 이해하고 해결하는 데 필수적인 접근 방식임을 주장합니다. 나아가 선택적 불변성을 통해 여러 목표 간의 상충 관계를 완화하거나 해소할 수 있는 통합 프레임워크를 제시합니다.

causalityreliable-aimachine-learning
1일 전5
arXiv논문

진화 게임 이론 관점에서Shortcut 학습 해독: 핵심 기능과 Shortcut 기능의 정의 및 최적화 노이즈의 영향 분석

본 논문은 딥러닝 모델이 데이터 내 불필요한 특징에 의존하는 'Shortcut 학습' 현상을 진화 게임 이론(EGT)을 적용하여 분석합니다. 연구진은 핵심 기능과 Shortcut 기능을 정의하고, 경사 하강법(GD)과 확률적 경사 하강법(SGD) 같은 최적화 기법이 각각 다른 안정 상태를 유도하며 편향 형성 메커니즘에 영향을 미친다는 것을 밝혀냈습니다. 나아가 연속 확률 미분 방정식을 통해 데이터 및 최적화 노이즈가 Shortcut 편향의 영향력에 미치는 이론적 역학을 제시합니다.

deep-learninggame-theoryshortcut-learning
1일 전4
arXiv논문

AcademiClaw: 학생이 AI 에이전트를 위한 과제를 설정할 때

본 기술 기사는 기존 AI 평가 벤치마크가 보조적인 수준의 과제에만 초점을 맞추어 온 한계를 지적하며, 대학원생들의 실제 학술 워크플로우에서 발생하는 복잡하고 장기적인 문제들을 다루는 새로운 이진어 벤치마크인 AcademiClaw를 소개합니다. 이 벤치마크는 수학, 언어학부터 GPU 기반 강화 학습 및 시스템 디버깅까지 25개 이상의 전문 분야에 걸쳐 80개의 복잡한 과제를 포함하며, 격리된 환경과 다차원 평가 기준을 통해 AI 에이전트의 실제 학술 역량을 엄격하게 측정합니다. 실험 결과, 최첨단 모델들조차도 높은 통과율을 달성하지 못했으며, 이는 향후 더 유능하고 범용적인 AI 에이전트를 개발하는 데 중요한 진단 신호를 제공할 것으로 기대됩니다.

ai-agentsbenchmarkingacademic-tasks
1일 전3
arXiv논문

대화 감정 인식 (ERC) 을 위한 불확실한 지문 인코더 사전 학습 언어 모델: 인간 평가 및 유효성 연구

본 논문은 대화 감정 인식(ERC) 모델이 단순히 높은 정확도를 넘어 인간의 직관과 일치하는 해석 가능성을 갖추도록 하는 새로운 접근법을 제안합니다. 기존의 사전 학습 언어 모델(PLM)은 성능은 뛰어나지만, 왜 특정 예측을 했는지에 대한 설명력이 부족하며, 특히 데이터 불균형 문제로 인해 소수 감정을 중립으로 오분류하는 경향이 있습니다. 이를 해결하기 위해 PLM과 '불확실한 지문(Fuzzy Fingerprints, FFP)'를 결합하여, 각 감정의 특징적인 프로토타입을 정의하고 입력 발화가 이 프로토타입들과 얼마나 불확실하게 유사한지를 측정함으로써 해석 가능성과 성능을 동시에 향상시킵니다.

emotion-recognitionnlppretrained-language-models
1일 전5
arXiv논문

2026 ACII Dyadic Conversations (DaiKon) 워크숍 및 챌린지 소개

2026 ACII Dyadic Conversations (ACII-DaiKon) 워크숍 및 챌린지는 쌍방향 대화에서 상호 감정 및 사회적 역동성을 모델링하기 위한 새로운 벤치마크를 소개합니다. 기존의 화자 중심(speaker-centric) 접근 방식의 한계를 극복하고, 방향성 영향력 예측, 발화권 전환 예측, 신뢰감 궤도 예측 등 시간적으로 진화하는 상호작용 패턴에 초점을 맞춥니다. 이 벤치마크는 자연주의적 조건에서 수집된 대규모 다중 모달 데이터셋을 기반으로 하며, 학제 간 비교와 모델 개선을 위한 표준화된 플랫폼을 제공합니다.

dyadic-conversationsemotion-modelingdialogue-analysis
1일 전5
arXiv논문

HADES: 약물 유발 간 손상 예측을 위한 설명 가능한 가설 기반 접근법

본 논문은 약물 유발 간 손상(DILI) 예측 문제를 단순한 이진 분류를 넘어, 설명 가능한 가설 생성 문제로 재구성할 것을 제안합니다. 이를 위해 의학 문헌 기반의 기전적 간독성 가설과 정교하게 선별된 분자 집합을 포함하는 DILER 벤치마크를 소개했습니다. 연구팀은 투명하고 감사 가능한 추론 트레이스를 생성하도록 설계된 에이전트 시스템 HADES를 개발하여, 분자 수준 예측, 대사물 분석, 구조적 이해 등을 결합해 DILI 위험을 기전적으로 평가하며 기존 모델 대비 우수한 성능과 더불어 가설 생성 측면에서 새로운 기준을 제시했습니다.

drug-safetyhepatotoxicityexplainable-ai
1일 전6
arXiv논문

제로 트러스트 에이전틱 AI 의 하이브리드 검사 및 작업 기반 접근 제어

본 논문은 LLM 기반 에이전트가 동적으로 도구 호출 및 보호된 자원에 접근할 때 발생하는 보안 위험을 해결하기 위한 새로운 프레임워크를 제안합니다. 기존의 승인 흐름으로는 복잡한 다중 턴 대화 환경에서의 권한 오용을 막기 어렵습니다. 이를 위해 결정론적 제어와 의미 기반 검사를 결합한 하이브리드 런타임 강제 모델과, 다단계 작업 추출 및 도구 매칭 과정을 포함하는 향상된 작업 기반 접근 제어(TBAC) 기법을 제시합니다.

zero-trustllm-agentsaccess-control
1일 전5
arXiv논문

SemEval-2026 과제 9: 다국어 편향 감지를 위한 LLM 미세 조정

SemEval-2026 과제 9는 다국어 환경에서 발생하는 편향을 식별하는 데 초점을 맞추고 있으며, 특히 온라인상의 유해 콘텐츠(혐오 발언 등) 감지가 주요 목표입니다. 이 문제를 해결하기 위해 연구진은 QLoRA 기법을 활용하여 중급 크기의 LLM을 시퀀스 분류 과제로 미세 조정했습니다. 훈련 데이터는 22개 언어의 다국어 데이터를 사용하여 편향 감지 모델의 견고성을 높였습니다.

semevalllm-fine-tuningmultilingual-bias
1일 전5
arXiv논문

데이터 효율적인 변형 물체 역학 모델 학습을 위한 PIEGraph: 분석 물리 및 데이터 기반 모델의 결합

본 논문은 변형 가능한 객체의 데이터 효율적인 역학 모델 학습 문제를 해결하기 위해 PIEGraph라는 새로운 프레임워크를 제안합니다. PIEGraph는 물리적으로 정보에 기반한 분석 모델(스프링-질량 시스템)과 입자 상호작용의 대칭성을 활용하는 등변성 그래프 신경 네트워크(EGNN)를 결합했습니다. 이 접근 방식은 제한된 실세계 데이터만으로도 강체 및 변형 가능한 객체의 역학을 정확하게 포착하여, 로봇 조작 계획 수립에 높은 신뢰도를 제공합니다.

roboticsgraph-neural-networksphysics-informed-learning
1일 전4
arXiv논문

ProPACT: 쌍 프로그래밍을 위한 능동적 AI 기반 적응형 협력 튜터

ProPACT는 전통적인 개인 중심적이고 반응적인 AI 시스템과 달리, '쌍 프로그래밍'이라는 공동 활동 자체를 교수의 대상으로 삼는 능동적 AI 협력 튜터입니다. 이 시스템은 Joint Visual Attention (JVA), Joint Mental Effort (JME)와 같은 다중 모달 데이터를 기반으로 학습하며, XGBoost 예측 모델을 활용하여 미래의 비최적 협력 상태를 미리 예측합니다. ProPACT는 이러한 예측을 바탕으로 최소한의 개입만 제공하면서도 점진적으로 지원을 줄이는 계층적 적응 정책을 구동함으로써, 실시간 협업 환경에서의 학습 효율성을 크게 향상시킵니다.

pair programmingadaptive learningai tutor
1일 전5

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.