Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
추론 LLM의 숨겨진 기만 행위 해독: 기만 감사(Deception Auditing)를 위한 활성화 설명기(Activation
LLM의 기만적 행동을 탐지하고 그 이유를 설명하기 위한 새로운 활성화 설명기인 STATEWITNESS를 소개합니다. 이 모델은 은닉 상태를 분석하여 자연어 질의에 답하거나 구조화된 보고서를 생성함으로써 기존의 단순 점수 방식보다 높은 성능과 검사 가능한 증거를 제공합니다.
LSTM 및 Transformer 모델을 이용한 단기 전력 부하 예측을 위한 델타 기반 타겟 재구성 (Delta-Based Target
전력 부하 예측의 비정상성 문제를 해결하기 위해 LSTM과 Transformer 모델에 델타 기반 타겟 재구성 기법을 적용한 연구입니다. 절대값 대신 부하 변화량을 예측함으로써 학습 타겟을 안정화하고 예측 정확도를 높이는 방법을 제안합니다.
인식론적 권리(Epistemic Entitlement)를 통한 LLM의 2차 편향 평가
LLM이 편향된 콘텐츠를 평가할 때 나타나는 '2차 편향(second-order bias)'을 인식론적 관점에서 분석한 연구입니다. 권리 인식론을 바탕으로 모델이 인구통계학적 특성에 따라 편향된 판단을 내리는 방식을 체계적으로 평가하는 새로운 방법론을 제안합니다.
혼동 인지형 전이 교사 커리큘럼 학습 프레임워크: 점수 산정 및 속도 조절 효과의 분리
커리큘럼 학습의 핵심 요소인 점수 산정(scoring)과 속도 조절(pacing) 효과를 분리하여 분석하는 새로운 프레임워크를 제안합니다. 혼동 인지형 난이도 점수를 통해 데이터 효율성을 높일 수 있음을 실험적으로 입증했습니다.
랭킹을 위한 공정성 인지형 확률적 다기준 수용성 분석(SMAA) 확장 모델
불확실성을 처리하는 SMAA 프레임워크에 공정성 개념을 결합한 SMAA-Fair 모델을 제안합니다. 이 모델은 집단 공정성 지표를 활용해 랭킹을 재가중함으로써, 선호의 불확실성 속에서도 보호 집단의 표현력을 높이는 공정한 랭킹을 도출합니다.
비지도 대칭성 발견을 통한 잠재 도메인의 블라인드 복원
데이터 분포의 대칭성을 발견하여 잠재 도메인과 신호를 복원하는 새로운 비지도 학습 프레임워크를 제안합니다. 선형 변환으로 손상된 관측값으로부터 신호를 복원하기 위해 정상성 및 국소성 규제화를 활용합니다.
경량화된 경험적 잠재 메모리를 통한 지속적 자기 개선 (Continual Self-Improvement with Lightweight
LLM이 추론 과정에서 생성한 흔적을 지속 가능한 지식으로 전환하기 위해 경량화된 잠재 메모리를 활용하는 연구를 제안합니다. 모델 파라미터의 0.001% 수준인 소프트 프롬프트 메모리를 통해 파괴적 망각 없이 온라인으로 성능을 지속 개선할 수 있습니다.
엔터프라이즈 에이전트 라우팅의 확장: 성능 저하, 진단 및 복구
엔터프라이즈 환경에서 에이전트와 도구 카탈로그가 확장됨에 따라 발생하는 라우팅 성능 저하 문제를 분석합니다. 연구 결과, 정보가 불충분한 요청에서 성능이 크게 하락하며, 임베딩 기반 숏리스트 방식이 이를 효과적으로 보완함을 입증했습니다.

AI 에이전트에게 필요한 것은 '더 높은 자율성'이 아니라 '미션 컨트롤'이었다
AI 에이전트의 핵심 과제는 무조건적인 자율성 확대가 아니라, 인간의 통제력을 유지하는 '미션 컨트롤' 설계에 있음을 강조합니다. 저자는 실제 워크플로우 운영 경험을 통해 모델의 자율성보다 인간의 '통치 대역폭' 확보가 병목 현상임을 지적합니다.

Anthropic IPO의 충격! 기업 가치 690배 상승과 AI 투자 전쟁의 전모
Anthropic이 IPO 준비를 위해 실리콘밸리 명문 법률 사무소인 Wilson Sonsini를 기용하며 상장 절차에 착수했습니다. 기업 가치가 5년 만에 690배 급증한 배경과 구글, 아마존 등 빅테크의 투자 전쟁을 다룹니다.
QueryMarket: 데이터 시장에서의 비용 인식 온라인 능동 학습 (Cost-Aware Online Active Learning)
실시간 데이터 스트림 학습 시 예산 제약과 데이터 가격을 고려하여 최적의 레이블을 구매하는 QueryMarket 프레임워크를 제안합니다. D-최적성 기준을 활용한 OVBAL 알고리즘을 통해 비정상적 데이터 환경에서도 비용 효율적인 능동 학습을 수행합니다.
No-Free-Fairness: 학습 시스템에서의 근본적인 한계와 트레이드오프 (Trade-offs)
학습 시스템 내 불평등의 근본적인 원인을 규명하는 'No-Free-Fairness 정리'를 제안합니다. 성능과 공정성 사이의 트레이드오프, 유한 샘플 학습의 한계, 모델 표현력의 제약 등 세 가지 이론적 불가능성을 증명합니다.
어텐션에서의 기능적 동등성: 선형 모드 연결성(Linear Mode Connectivity)에 대한 응용을 포함한 종합적 연구
트랜스포머 아키텍처 내 위치 인코딩이 기능적 동등성과 선형 모드 연결성에 미치는 영향을 분석한 연구입니다. 사인형 인코딩과 RoPE의 대칭성 차이를 규명하여 RoPE의 표현력 향상 원리를 이론적으로 설명합니다.
현대적 신경망 구조를 위한 보존 법칙 (Conservation Laws)
경사 하강법 역학에서 나타나는 암묵적 편향을 설명하는 보존 법칙을 현대적 신경망 구조로 확장하는 연구입니다. GELU, SwiGLU, RoPE, MoE 등 최신 아키텍처를 포함하는 통합 프레임워크를 제안하고 이론적 발견을 실험으로 검증합니다.
표류에서 일관성으로: LLM 내 신념의 안정화
LLM의 예측 신념이 일관성을 유지하지 못하고 표류하는 현상을 분석하고, 이를 해결하기 위한 연구를 제시합니다. PPR 기법을 통해 신념의 안정화 과정을 관찰하고, 시드 답변 프롬프팅과 자기 일관성 손실을 통해 예측 일관성을 향상시킵니다.
Qwen-RobotManip 기술 보고서: 정렬(Alignment)을 통한 로봇 조작 파운데이션 모델의 스케일 확장
Qwen-RobotManip은 시각-언어-행동(VLA) 통합 정렬 프레임워크를 통해 로봇 조작 성능을 극대화한 파운데이션 모델입니다. 대규모 멀티 소스 데이터를 일관성 있게 학습하여 제로샷 지시 이행 및 교차 체화 전이 등 뛰어난 일반화 능력을 입증했습니다.
WallZero: 전략적 분석을 통한 WallGo 게임 마스터하기
AlphaZero 알고리즘을 기반으로 전략 보드 게임 WallGo를 마스터하는 에이전트 'WallZero'를 제안합니다. 맞춤형 액션 및 특징 설계를 통해 프로 바둑 기사를 상대로 승리하며, 게임의 공정성과 핵심 전략을 분석했습니다.
AnchorKV: 거부 앵커(Refusal Anchor)를 통한 소프트 패널티 기반의 안전 인지형 KV 캐시 압축
AnchorKV는 LLM의 KV 캐시 압축 과정에서 발생할 수 있는 안전 정렬 저하 문제를 해결하기 위한 새로운 연구입니다. 거부 앵커(Refusal Anchor)를 활용한 소프트 패널티 방식을 통해, 모델의 성능을 유지하면서도 탈옥 공격에 대한 방어력을 높입니다.
순서 독립적 셀 수준 표현을 통한 자기회귀적 멀티태스크 테이블 인식에서의 구조적 의존성 재고
멀티태스크 테이블 인식에서 발생하는 셀 표현의 순서 의존성 문제를 해결하기 위해 순서 독립적 셀 수준 표현 방식을 제안합니다. 비인과적 어텐션을 활용한 구조적 정제 모듈을 통해 전역적 일관성을 높이고 추론 속도를 3배 향상시켰습니다.
단조 Kolmogorov-Arnold Networks: 유도 편향(Inductive Bias)으로서의 단조성에 대한 이론적 및 경험적 연구
모든 파라미터에 대해 엄격한 단조성을 보장하는 새로운 KAN 변형인 MKAN을 제안합니다. 지수적 재매개변수화와 단조 기저 함수를 통해 제약 없는 경사 하강법만으로 훈련이 가능하며, 이론적 표현 비용 정리를 통해 단조 인코더의 크기 규칙을 제시합니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.