본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv논문

디지털 신분증 문서의 필드별 위변조 탐지 (Field-Localized Forgery Detection for Digital Identity

본 논문은 원격 온보딩 과정에서 사용되는 디지털 신원 확인 시스템의 취약점을 해결하기 위해 'FLiD'라는 경량 필드 국소화 프레임워크를 제안합니다. 기존 위변조 탐지 방법들이 자연 이미지 포렌식에 초점을 맞춘 반면, FLiD는 신분증 문서 내의 얼굴이나 텍스트와 같은 핵심 신원 영역을 개별적으로 목표로 합니다. 이 프레임워크는 객체 탐지기를 사용하여 중요한 필드를 국소화한 후, 해당 영역만을 분석하여 위변조 여부를 정확하게 판별합니다.

digital-identityforgery-detectiondocument-forensics
4일 전5
arXiv논문

Constant-Target Energy Matching: 연속 및 이산 밀도 추정의 통합 프레임워크

본 기술 기사는 연속형, 이산형, 혼합 변수 도메인의 데이터 유형 전반에 걸쳐 공통된 통계 구조를 활용할 수 있는 통합 에너지 기반 밀도 추정 프레임워크인 Constant-Target Energy Matching (CTEM)을 제안합니다. 기존 방법론들이 연속 점수와 이산 확장을 별도의 목표 함수로 다루거나, 낮은 확률 상태 근처에서 불안정성을 보이는 문제를 해결하는 것이 목적입니다.

density-estimationenergy-based-modelscontinuous-discrete
4일 전4
arXiv논문

LLM 에이전트를 위한 토큰 경제학: 컴퓨팅과 경제학의 이중 관점 연구

LLM 에이전트가 발전함에 따라 토큰 소비가 급증하면서 계산적, 협업적, 보안 병목 현상이 심각한 문제로 대두되었습니다. 이 글은 이러한 문제를 해결하기 위해 '토큰 경제학(Token Economics)'이라는 통합적인 관점을 제시합니다. 컴퓨팅 과학과 경제학을 결합하여 토큰을 생산 요소, 교환 매개체, 계정 단위로 개념화함으로써, 출력 품질과 경제적 비용 사이의 근본적인 상충 관계를 다루는 포괄적인 프레임워크를 제공하는 것이 목표입니다.

llm-agentstoken-economicscomputational-science
4일 전6
X요약

[2026-05-05] 경제 브리핑 국제: 호르무즈發 유가 6% 급등 한국: 증시 과열…투자경고 50%↑ 기술: Peter Thiel, 10억

2026년 5월 5일 경제 브리핑은 국제 유가의 급등, 국내 증시 과열 경고, 그리고 주요 기술 트렌드를 다루고 있습니다. 특히 의료 AI 분야에서 인간 의사보다 빠르게 암을 진단하는 혁신적인 사례가 언급되며, 이 기술이 규제만 해결된다면 가장 큰 임팩트를 줄 것으로 전망됩니다.

economic-briefingoil-pricestock-market
4일 전4
arXiv논문

언어 모델 해석 가능성을 위한 데이터 기반 회로 발견

본 기사는 언어 모델(LM)의 동작을 해석하기 위한 '회로 발견' 방법론의 한계를 지적합니다. 기존 방식은 작업이 단일 회로로 구현된다는 강력한 가정을 전제하고, 데이터셋이 인간의 의미를 완벽히 대표한다고 가정합니다. 연구진이 제안하는 DCD(Data-driven Circuit Discovery)는 이러한 가설 기반 접근 방식을 탈피하여, 데이터가 LM 내부 메커니즘적 구조 자체를 드러내도록 함으로써 모델 해석의 정확성과 포괄성을 높입니다.

language-modelsinterpretabilitycircuit-discovery
4일 전6
arXiv논문

내부 대 외부 비교: 다중 에이전트의 헌법 설계에서 숙고와 진화 비교

본 기사는 다중 에이전트 AI 시스템의 행동 규범(behavioral constitutions) 설계에 있어, 규칙이 내부적으로 숙고되어야 하는지 아니면 외부 환경 최적화를 통해 진화해야 하는지를 비교 분석합니다. 연구진은 세 가지 사회 환경(협력 그리드 월드, 반복 공공재 게임, 양자 거래 시장)에서 통제된 시뮬레이션을 수행했습니다. 그 결과, 집단 행동 설정에서는 내부 숙고 방식보다 외부 진화 방식이 더 우수한 성능을 보이는 것으로 나타났습니다.

multi-agentai-governancebehavioral-constitutions
4일 전4
arXiv논문

MCP-Cosmos: 복잡한 작업 실행을 위한 World Model 증강 에이전트 (MCP Environments)

MCP-Cosmos는 대규모 언어 모델(LLMs)과 외부 도구 간의 인터페이스인 MCP 생태계에 World Model (WM)을 통합하여 에이전트의 예측적 작업 자동화를 가능하게 하는 프레임워크입니다. 이 프레임워크는 'Bring Your Own World Model' (BYOWM) 전략을 통해, 에이전트가 실제 실행 전에 잠재 공간에서 상태 전이를 시뮬레이션하고 계획을 개선할 수 있도록 합니다. 실험 결과, MCP-Cosmos는 도구 성공률 및 매개변수 정확도 등 핵심 성과 지표(KPI)를 크게 향상시키며, 새로운 평가 메트릭을 제공하여 에이전트 시스템의 신뢰성을 높였습니다.

llm-agentsworld-modelsagent-frameworks
4일 전6
X요약

SemEval-2026 Task 8 우승팀은 심사위원 주도 앙상블 사용

SemEval-2026 Task 8의 우승팀인 RaguTeam이 GPT-4o-mini를 기반으로 인스턴스당 7개의 다양한 LLM을 조합하는 '심사위원 주도 앙상블(Judge-led Ensemble)' 방식을 사용하여 대회에서 최고 성과를 거두었습니다. 이들의 접근 방식은 단순히 크기가 큰 초대형 모델들(120B급)의 성능을 능가했습니다. 또한, RaguTeam은 대규모 모델들과 경쟁할 수 있는 고성능 7B 전문 모델인 Meno-Lite-0.1도 공개하여 연구 커뮤니티에 기여했습니다.

llmensemble-learningsemeval
4일 전6
arXiv논문

BoostAPR: 실행 기반 강화학습을 통한 자동 프로그램 복구 향상

BoostAPR은 프로그램 복구를 위한 강화학습의 한계를 극복하기 위해 설계된 3단계 프레임워크입니다. 이 프레임워크는 지도 미세 조정을 통해 실행 검증 데모노스트레이션을 학습하고, 두 개의 보상 모델(시퀀스 레벨 평가자 및 라인 레벨 크레딧 할당기)을 훈련합니다. 특히, 라인 레벨 크레딧 할당기를 사용하여 코드 변경에 적합한 중간 수준의 세밀도로 보상을 재분배함으로써, 기존 강화학습 방식보다 훨씬 효과적으로 버그 수정 영역을 식별하고 프로그램 복구 성능을 크게 향상시킵니다.

reinforcement-learningprogram-repaircode-generation
4일 전4
X요약

테슬라 옵티머스 V3 양산 라인 프리몬트에서 가동 시작.

테슬라 옵티머스 V3 양산 라인이 프리몬트에서 가동을 시작하며 로봇 공학 분야의 중요한 이정표를 세웠습니다. 기사는 물리 세계 자동화의 핵심 경쟁력이 GPU 성능 자체보다는 액추에이터와 센서 통합 능력에 있음을 지적합니다. 또한, AI 반도체 경쟁의 초점이 단순 연산 성능에서 데이터 이동 효율성으로 변화하고 있으며, 이는 메모리-프로세서 간 데이터 전송 과정이 에너지 및 시간 소모의 주요 원인이기 때문입니다.

teslaoptimusrobotics
4일 전7
arXiv논문

jNO: 신경 연산자 및 파운데이션 모델 학습을 위한 JAX 라이브러리

jNO(jax Neural Operators)는 데이터 기반 및 물리 정보 기반 학습을 모두 통합적으로 지원하는 JAX 네이티브 라이브러리입니다. 이 라이브러리는 도메인, 모델 호출, 잔차 평가, 지도 손실 등 모든 요소를 단일 심볼릭 언어로 작성하고 하나의 최적화 파이프라인으로 컴파일할 수 있게 합니다. 이를 통해 사용자는 복잡한 연산자 회귀부터 PDE 제약 학습까지 별도의 코드 재구성을 거치지 않고 통합적인 워크플로우를 구축할 수 있습니다.

jaxneural-operatorsphysics-informed-learning
4일 전5
arXiv논문

전통적인 태거에서 LLM까지: 중세 로망스 언어의 품사 태깅 비교 연구

본 논문은 중세 오키탄어, 카탈루냐어, 프랑스어 등 세 가지 중세 로망스 언어에 대한 품사(POS) 태깅의 어려움을 다루며, 전통적인 규칙 기반/통계적 태거와 최신 LLM을 비교 평가합니다. 연구는 제로샷, 퓨샷 프롬프팅, 파인튜닝, 교차 언어 전이 학습 등 다양한 환경에서 실험한 결과, LLM 기반 접근 방식이 우수한 성능을 보였음을 입증했습니다. 특히 자원이 부족한 방언에 대한 교차 언어 전이 학습과 표적화된 이중 언어 훈련의 효과가 강조되며, 이는 역사적 NLP 연구를 위한 실질적인 지침을 제공합니다.

historical-nlppos-taggingllm
4일 전5
arXiv논문

OUIDecay: 온라인 활성화 패턴을 이용한 CNN의 적응형 레이어별 가중치 감쇠

본 논문은 CNN 훈련에서 레이어별로 다른 정규화 강도가 필요하다는 점에 착안하여, 과적합-과소적합 지표(OUI)를 활용한 적응형 가중치 감쇠 스케줄러인 OUIDecay를 제안합니다. OUIDecay는 각 레이어의 활성화 패턴을 온라인으로 모니터링하고, 이 정보를 기반으로 네트워크 내 다른 레이어들과 상대적으로 가중치 감쇠를 주기적으로 재조정합니다. 이는 검증 데이터 없이도 구조적 동작에 기반한 효과적인 적응형 정규화 방법이며, 다양한 CNN 아키텍처에서 기존 방식 대비 우수한 성능을 입증했습니다.

weight decaycnnregularization
4일 전5
arXiv논문

Self-Play를 넘어: 폐쇄 루프 교통 시뮬레이션의 연속 동작을 위한 계층적 추론

본 논문은 기존의 셀프-플레이 강화학습이 포착하지 못했던 인간 운전자의 사회적 인지 능력을 반영하기 위해 계층적 추론 아키텍처를 제안합니다. 이 프레임워크는 상위 레벨에서 스태켈베르크 스타일의 다중 에이전트 강화학습(MARL)을 사용하여 전략적 의도 명령을 생성하고, 이를 하위 레벨 연속 동작 모듈에 전달하여 물리적으로 일관되고 환경 반응적인 제어 시퀀스로 변환합니다. 또한, 분포 이동 문제를 해결하기 위해 MARL과 보조 복구 감독을 결합한 공동 훈련 방식을 도입했으며, SUMO 기반 테스트에서 높은 안전성과 효율성을 입증했습니다.

reinforcement-learningmulti-agent-systemautonomous-driving
4일 전5
arXiv논문

엔트로피 정규화된 Actor-Critic에서 혼합 정책 재검토

본 연구는 연속 행동 강화학습에서 사용되는 혼합 정책(Mixture policies)의 활용도를 높이는 것을 목표로 합니다. 기존에는 복잡성 대비 실제 이점이 불분명했던 혼합 정책에 대해, 저분산 리매개변수화 트릭이 부족하다는 근본적인 문제를 지적합니다. 이를 해결하기 위해 주변화된 리매개변수화(MRP) 추정기를 제안하며, 이것이 표준 우도비 접근 방식보다 낮은 분산을 제공함을 증명했습니다. 실험 결과, MRP 혼합 정책은 기존의 가우시안 정책과 동등하거나 더 나은 성능을 보여주며, 실용적인 강화학습 도구로 자리매김할 수 있음을 입증합니다.

reinforcement-learningmixture-policiescontinuous-control
4일 전4
Dev.to헤드라인

AI 에이전트에게 내 사업을 30일 동안 운영하게 해봤습니다. 결과는 이렇습니다.

글쓴이는 AI 에이전트에게 자신의 콘텐츠 제작 파이프라인을 30일 동안 운영하게 하는 실험을 진행했습니다. 그 결과, 에이전트는 많은 아티클을 발행하고 플랫폼 조사를 수행하는 등 높은 활동량을 보였으나, CAPTCHA와 같은 인간 중심의 시스템적 장벽(Bottleneck)과 '수입 창출'이라는 최종 단계에서는 여전히 인간의 개입(오디언스 구축, PMF 판단, 배포 전략)이 필수적임을 확인했습니다. 결론적으로 AI 에이전트는 인간을 대체하기보다 산만함이나 미루는 습관 등 업무 효율성을 증폭시키는 강력한 도구이며, 향후 API 접근성이 높은 플랫폼에 집중하는 것이 핵심 성공 요인입니다.

ai-agentscontent-automationworkflow-optimization
4일 전6
arXiv논문

공동 희소 코딩 및 시간 역학이 컨텍스트 재구성을 지원함

본 연구는 뇌가 다양한 환경(컨텍스트) 사이를 전환할 때 기존의 학습된 지식을 유지하며 표현을 재구성하는 신경 메커니즘에 초점을 맞추었습니다. 마우스 mPFC와 계산 네트워크 분석 결과, '공동 희소 코딩'과 '시간 역학'이 컨텍스트 전환 시 이전 표현 보존에 중요한 역할을 하는 것으로 밝혀졌습니다. 특히 이 두 가지 속성을 모두 갖춘 스파이킹 신경망은 평생 학습 동안 우수한 유지 능력을 보여주며, 이는 안정적이고 에너지 효율적인 적응 아키텍처 설계의 핵심 원리를 제시합니다.

neurosciencelifelong-learningsparse-coding
4일 전5
arXiv논문

심층 강화학습을 통한 신호등 제어의 효율성과 공정성 균형

본 논문은 기존 신호등 제어 시스템의 비효율성 문제를 해결하기 위해 심층 강화학습(DRL) 기반의 새로운 에이전트를 제안합니다. 이 에이전트는 차량과 보행자 교통 모두를 고려하여 공정성을 명시적으로 통합함으로써, 실시간 수요 변화에 따라 흐름을 동적으로 균형 있게 조정할 수 있습니다. 실험 결과는 이 시스템이 교통 혼잡을 효과적으로 줄이는 동시에 모든 도로 이용자에게 공평한 서비스를 제공함을 입증하며, 스마트 시티의 지능형 교통 관리에 기여합니다.

deep reinforcement learningtraffic controlsmart city
4일 전5
arXiv논문

FORTIS: 에이전트 스킬의 과도한 권한(Over-Privilege) 벤치마킹

본 논문은 LLM 에이전트가 사용하는 중간 스킬 계층이 종종 필요한 것보다 과도한 권한을 가지는 '과도한 권한(Over-Privilege)' 문제를 지적하며, 이를 평가하기 위한 벤치마크인 FORTIS를 제안합니다. FORTIS는 모델이 최소한의 충분한 스킬을 선택하는지, 그리고 그 스킬이 허용된 범위를 넘어서 행동하지 않는지를 두 단계로 검증합니다. 연구 결과, 최첨단 모델들조차도 작업에 필요한 것보다 더 높은 권한의 스킬과 도구를 사용하는 경향이 일반적이며, 이는 에이전트 시스템의 주요 취약점임을 보여줍니다.

llm-agentsagent-safetyprivilege-escalation
4일 전2
arXiv논문

불규칙 다변량 시계열 분류를 위한 원스텝 그래프 구조 신경 흐름 (One-Step Graph-Structured Neural Flows)

본 논문은 불규칙 다변량 시계열 데이터의 분류를 위해 원스텝 그래프 구조 신경 흐름(GSNF)을 제안합니다. 기존 신경 흐름 모델들이 변수 간 상호작용을 충분히 포착하지 못하는 문제를 해결하기 위해, GSNF는 재초기화 기반 궤적 발산 유도와 순방향-역방향 일관성 강제를 통해 그래프 구조 학습을 강화했습니다. 실험 결과, GSNF는 효율적인 계산 자원 사용과 함께 최첨단 분류 성능을 달성하여 해당 분야의 새로운 기준을 제시합니다.

neural-flowstime-seriesgraph-structured
4일 전5

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.