Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
AdversaBench: 다중 심사위원 확인 및 교차 모델 전이성을 활용한 자동화된 LLM 레드팀 테스트 (Red-Teaming)
LLM의 취약점을 자동으로 탐색하는 레드팀 테스트 파이프라인인 AdversaBench를 제안합니다. 3인 심사위원 패널과 프롬프트 변이 연산자를 활용하여 추론, 지시 이행, 도구 사용 능력을 다각도로 평가합니다.
딥러닝을 이용한 알츠하이머병 진행의 불확실성 인지 종단적 예측
알츠하이머병 진행의 불확실성을 고려한 종단적 예측을 위해 확률적 프레임워크를 제안합니다. Temporal Fusion Transformer과 Mixture Density Network을 결합하여 질병 단계의 궤적과 불확실성을 정밀하게 추정합니다.
법률 문맥 객체에 대한 LLMs의 프롬프트 유도: 형사 법률 문맥에서 소규모 온프레미스 LLMs의 과도한 거부(Overrefusal) 현상
소규모 온프레미스 LLM이 형사 법률 문맥에서 특정 프롬프트에 대해 과도하게 답변을 거부하는 현상을 연구했습니다. 권위 있는 스타일의 접두사가 거부율을 최대 20배까지 높인다는 사실을 발견하여, 실제 법률 현장 도입 시 발생할 수 있는 편향 위험을 경고합니다.
ScaleToT: 십억 단위 저활동 사용자 모델링을 위한 구조화된 LLM 추론의 일반화
ScaleToT는 상호작용 데이터가 부족한 수십억 명의 저활동 사용자를 위해 구조화된 LLM 추론을 확장하는 프레임워크입니다. Tree-of-Thought(ToT)와 OSIPO 기법을 통해 학습된 추론 능력을 경량 인코더로 전이하여, 비용 효율적으로 사용자 상태를 예측합니다.
ASALT: 다중 에이전트 강화학습 (MARL)의 측면 전이를 위한 적응형 상태 정렬
ASALT는 다중 에이전트 강화학습(MARL)에서 도메인 간 상태 공간 차원이 불일치할 때 발생하는 문제를 해결하기 위한 새로운 방법론을 제안합니다. 관측 및 상태 수준의 어댑터를 통해 이질적인 도메인 간의 효과적인 지식 전이를 지원합니다.
온톨로지 기반 데이터 액세스(OBDA)에서의 쿼리 추상화
온톨로지 기반 데이터 액세스(OBDA) 환경에서 데이터 쿼리를 온톨로지 계층으로 번역하는 쿼리 추상화 연구를 다룹니다. 최소 완전성 및 최대 타당성을 보장하는 추상화 개념과 확장된 UCQ 내에서의 구현 방안을 제시합니다.
멀티 에이전트 의미론적 재작성을 통한 개인정보 보호 RAG: 문맥적 충실도를 저해하지 않는 기밀성 달성
RAG 시스템의 개인정보 유출 위험을 방지하기 위해 멀티 에이전트 기반의 의미론적 재작성 프레임워크를 제안합니다. 세 개의 특화된 에이전트가 협력하여 문맥적 충실도를 유지하면서도 민감한 식별자를 효과적으로 제거합니다.
CineCap: 영화적 비디오 캡셔닝을 위한 시공간 앵커 기반의 구조적 추론
CineCap은 카메라 움직임, 구도 등 전문적인 영화 언어를 사용하여 비디오를 설명하는 새로운 프레임워크입니다. 시공간 앵커 기반의 구조적 추론과 강화학습을 결합하여 영화적 캡셔닝의 정확도와 포괄성을 높였습니다.
무한소 인과관계 (Infinitesimal Causality)
본 논문은 프로베니우스 마르코프 범주를 활용하여 무한소 인과관계(IDC)를 범주론적으로 정의합니다. 개입을 접선 변형으로 해석하며, Pearl의 do-calculus와 범주론적 구조 사이의 수학적 연결 고리를 제시합니다.
"우리는 국민이다" 시각화하기: 다원적 데이터 스토리텔링을 통한 인식 격차 해소
이 논문은 이분법적 시각화를 넘어 AI를 활용해 다원적 데이터 스토리텔링을 구현하는 방법을 제안합니다. 고차원적 의견 공간을 매핑하여 집단 간의 공통점과 미묘한 차이를 시각화함으로써 정치적 양극화를 해소하는 방안을 다룹니다.
SAFARI: 능동적 조사를 통한 장기적 에이전트 결함 원인 분석의 확장
SAFARI는 자율 에이전트의 긴 실행 궤적에서 발생하는 결함 원인을 분석하기 위한 새로운 프레임워크입니다. 도구 증강형 진단 루프와 단기 기억을 활용하여 컨텍스트 창의 제한을 극복하고 진단 정확도를 높였습니다.
CQ가 잘못될 때: OE-Assist를 활용한 CQ 검증의 과제
온톨로지 모델링의 핵심인 역량 질문(CQ) 검증 과정에서 발생하는 모호성과 복잡성 문제를 다룹니다. LLM 어시스턴트를 활용한 실험을 통해 CQ 검증의 어려움을 분석하고, 이를 정제하기 위한 도구의 필요성을 제안합니다.
Themis: 인간 피드백 기반 강화학습 (RLHF)을 위한 설명 가능한 AI (XAI) 지원 프레임워크
RLHF를 위한 설명 가능한 AI(XAI) 지원 프레임워크인 Themis를 소개합니다. 200개 이상의 환경을 지원하며, 인간의 선호도를 반영한 보상 모델 훈련과 대규모 사용자 피드백 수집을 위한 클라우드 플랫폼을 제공합니다.
Mistral OCR 4 공개
Mistral에서 공개한 문서 이해 특화 모델인 OCR 4에 대한 분석과 비평을 담고 있습니다. 범용 모델이 아닌 특정 태스크에 최적화된 전문 모델의 필요성과 OCR 모델의 올바른 활용 범위 및 한계를 다룹니다.
F3 - 미래를 위한 오픈소스 데이터 파일 형식
새로운 오픈소스 데이터 파일 형식인 F3에 대해 분석하며, 기존 Parquet 형식이 가진 한계와 F3가 제시하는 Wasm 기반 디코딩 방식의 장단점을 다룹니다. 분석용 파일 형식의 핵심인 호환성과 성능 사이의 트레이드오프를 심도 있게 논의합니다.
에이전틱 AI(Agentic AI)가 전통적인 거버넌스 모델을 파괴하고 있다 - 향후 전망
자율 에이전트의 등장으로 기존 예측 모델 중심의 거버넌스 체계가 한계에 직면했습니다. 본 글은 에이전트 거버넌스 격차를 분석하고, 행동하는 AI를 관리하기 위한 '지속적 에이전트 거버넌스 모델'을 제안합니다.

당신이 훌륭한 개발자라면 아마도 형편없는 SRE일 것입니다: 엔지니어가 SRE처럼 생각하지 않아도 되도록 파이프라인에 SRE적 편집증을
개발자가 SRE(Site Reliability Engineering)처럼 사고하도록 강요하는 대신, 시스템과 파이프라인 자체에 SRE의 신뢰성 원칙을 자동화된 게이트로 인코딩해야 한다는 내용을 다룹니다. 문화적 변화에 의존하기보다 롤백 경로, 의존성 저하 대응 등 SRE적 편집증을 시스템 설계에 반영할 것을 제안합니다.
AI 에이전트가 API 비용을 자동으로 결제하는 Stripe 기반 마켓플레이스를 구축했습니다
Stripe의 Agent Toolkit을 활용하여 AI 에이전트가 API 비용을 자율적으로 결제할 수 있는 마켓플레이스 'run.pay' 구축 사례를 소개합니다. MCP(Model Context Protocol)를 통해 에이전트가 서비스를 발견하고, Stripe Connect를 통해 사용한 만큼만 결제하는 에이전트 네이티브 방식을 구현했습니다.
나의 AI 리드 생성(Lead Generation) 노력이 실제로 효과가 있는지 어떻게 측정할 수 있을까?
AI를 활용한 리드 생성 활동의 실질적인 효과를 측정하기 위해 허영 지표가 아닌 매출과 직결된 핵심 지표를 추적해야 합니다. 단순 리드 수보다는 적격 리드당 비용, 전환율, 영업 주기 단축 등을 통해 AI 도입의 ROI를 검증하는 것이 중요합니다.
AI 에이전트가 레거시 Angular 코드를 작성하지 못하게 하는 방법 (Angular 22 가드레일)
AI 코딩 에이전트가 Angular 22의 최신 문법 대신 레거시 코드를 작성하는 문제를 해결하기 위한 가드레일 도구를 소개합니다. 오픈 소스 리포지토리를 통해 AI가 Signals와 최신 제어 흐름을 사용하도록 강제할 수 있습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.