Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
프랑스 관료주의에 특화된 AI 에이전트 스킬 세트
이 기술 기사는 프랑스 관료주의 및 기업 회계/세무 분야의 복잡한 업무를 자동화하기 위해 설계된 'Paperasse'라는 AI 에이전트 스킬 세트를 소개합니다. 이 스킬들은 전문적인 부조종사 역할을 수행하며, 회계(PCG, TVA, IS), 청구서 발행, 공증법, 공동 주택 관리 등 프랑스 특유의 복잡한 법규와 절차를 완벽하게 처리할 수 있도록 설계되었습니다. 사용자는 이 스킬 세트를 자신의 AI 에이전트에 설치하고, 간단한 프롬프트만으로 연말 결산부터 세무 조사 시뮬레이션까지 전 과정을 워크플로우로 실행할 수 있습니다.
Merlin: 대규모 언어 모델 추론에서 손실 없는 컨텍스트 최적화를 위한 결정론적 바이트 단위 중복 제거
Merlin은 대규모 데이터셋에서 발생하는 고질적인 중복성 문제를 해결하기 위해 설계된 로컬 우선의 컨텍스트 최적화 엔진입니다. 이 시스템은 SIMD 친화적인 해시 세트와 xxHash3-64를 결합하여 텍스트 구절과 데이터 청크에 대해 빠르고 바이트 단위로 정확한 중복 제거를 수행합니다. 특히 RAG(검색 증강 생성)와 같은 LLM 생태계에서 입력 데이터를 크게 줄이면서도 정보의 충실도를 유지할 수 있어, 대규모 언어 모델 추론 효율성을 획기적으로 개선하는 데 기여합니다.
이전 세대 TPU 대비 TPU 8t의 주요 발전 사항:
TPU 8t는 이전 세대 TPU 대비 여러 면에서 상당한 발전을 이루었습니다. 주요 개선 사항으로는 SparseCore의 도입, VPU와 MXU의 중첩 및 균형 잡힌 스케일링이 가능해졌으며, 네이티브 4비트 FP4 지원을 통해 효율성이 높아졌습니다. 또한, Virgo 네트워크 토폴로지 채택과 향상된 스토리지를 통해 데이터 처리 능력과 확장성이 크게 증가했습니다.
Reinforcement Inference: 불확실성을 활용한...
본 기사는 대규모 언어 모델(LLMs)이 현재 주로 결정론적이고 탐욕적인 추론 방식으로 평가 및 배포되는 문제점을 지적합니다. '강화 추론(Reinforcement Inference)'이라는 새로운 접근 방식을 제안하며, LLM의 불확실성(uncertainty)을 적극적으로 활용하여 더 견고하고 효과적인 추론 방법을 모색합니다.
소프트웨어를 위한 YouTube 시대가 왔습니다.
최근 '소프트웨어를 위한 YouTube' 시대가 도래하며, 바이브 코딩(vibe coding)의 미래와 최신 AI Studio 업데이트를 통해 누구나 빌더로 변모할 수 있는 환경이 조성되고 있습니다. 이 변화는 기술 접근성을 높이고 창작 활동을 촉진하는 방향으로 진행되고 있음을 시사합니다.
속보: 연구원들이 인공지능 모델들이 더 이상 재교육 없이 추론 과정에서 스스로를 개선할 수 있다는 것을 발견했습니다.
연구원들이 인공지능 모델이 별도의 재교육 과정 없이도 추론(inference)하는 과정 자체에서 스스로를 개선하고 적응할 수 있다는 사실을 발견했습니다. 이 기술은 시스템이 작업을 해결하면서 실시간으로 불확실성을 활용하여 자기 교정(self-correction) 메커니즘을 작동하게 합니다. 이는 AI 모델의 효율성과 자율성을 크게 높일 잠재력을 가집니다.
어노테이션이 포스트 트레이닝 모드 붕괴를 완화한다
본 기사는 지도 미세 조정(Post-training) 과정에서 발생하는 의미론적 모드 붕괴 문제를 다루고 있습니다. 이 문제는 모델이 저엔트로피의 미세 조정 데이터에 편향되어 사전 학습 단계에서 얻은 풍부한 다양성을 잃는 현상입니다. 이를 해결하기 위해, 연구진은 '어노테이션 기반 학습(annotation-anchored training)'을 제안합니다. 이 방법은 의미론적 어노테이션과 쌍을 이루는 문서로 모델을 사전 학습시켜, 포스트 트레이닝 과정에서도 원래의 다양성을 유지하고 전이할 수 있도록 합니다.
멀티체인 및 DeFi 통합을 갖춘 엔터프라이즈급 암호화폐 지갑 구축
본 기사는 현대 디지털 금융 환경에서 필수적인 엔터프라이즈급 암호화폐 지갑의 개념과 중요성을 설명합니다. 이러한 고급 지갑은 단순한 자산 저장소를 넘어, 기관 수준의 보안, 멀티체인 상호 운용성, 그리고 DeFi 기능을 통합하여 기업 및 대규모 플랫폼이 복잡한 디지털 자산 생태계를 효율적으로 관리할 수 있도록 돕습니다. 특히 여러 블록체인 네트워크와 탈중앙 금융 서비스에 걸쳐 원활하게 작동하는 것이 핵심 경쟁력입니다.
코딩 에이전트 설정 파일의 지침 준수: 네 가지 파일 구조 변수에 대한 요인 설계 연구
본 연구는 최첨단 코딩 에이전트가 설정 파일의 지침을 얼마나 잘 따르는지(준수도)를 구조적 변수를 중심으로 요인 설계 방식으로 분석했습니다. 1,650회의 Claude Code CLI 세션 데이터를 사용하여 네 가지 구조적 변수(파일 크기, 지침 위치 등)와 코딩 작업 간의 상호작용 효과를 측정했으나, 이들 구조적 변수들이 준수도에 미치는 유의미한 영향은 발견하지 못했습니다. 대신, 가장 큰 효과는 세션 내에서 에이전트가 생성하는 함수 개수 증가에 따른 단계별 준수 확률 감소(비단조적 경향)였으며, 이는 코딩 작업과 함수 생성 순서에 따라 준수도가 체계적으로 변화함을 시사합니다.
Swarm Skills: 협업 엔지니어링을 위한 이식 가능하고 자체 진화하는 다중 에이전트 시스템 명세
본 논문은 인공지능 공학의 패러다임 변화에 맞춰, 단일 에이전트를 넘어선 다중 에이전트 시스템의 협업 능력을 체계적으로 개선하는 방법을 제시합니다. 핵심 개념인 'Swarm Skills'는 Anthropic Skills 표준을 확장한 이식 가능한 명세로, 역할, 워크플로우, 실행 경계를 포함하여 배포 가능한 1급 자산으로 다중 에이전트 워크플로우를 구조화합니다. 특히 Swarm Skills는 자체 진화 알고리즘을 통해 성공적인 실행 궤적을 자동으로 추출하고 성능 지표(효과성, 활용도, 신선도)에 기반하여 지속적으로 개선되어, 프레임워크 종속성 없이 에이전트 팀의 협력 전략이 자율적으로 발전할 수 있게 합니다.
이진 피드백을 이용한 LLM 개인화: 선호도 보정 최적화 프레임워크
본 논문은 LLM 개인화에 관한 새로운 프레임워크인 C-BPO를 제안합니다. C-BPO는 사용자의 명시적 선호도(긍정 피드백)와 다른 사용자 데이터를 암묵적인 부정 신호로 활용하여, 개별 사용자 간의 미묘한 차이점을 포착하는 데 중점을 둡니다. 특히 '선호도 중첩' 문제를 해결하기 위해 PU 이론에 기반한 목적 함수를 도입함으로써, 일반적인 유용성을 유지하면서도 고유한 개인화 특성을 효과적으로 반영합니다.
코딩 워크플로우의 80%를 AI로 대체하다 - 실제로 작동하는 것들
AI는 개발 프로세스의 모든 부분을 대체하는 것이 아니라, 반복적이고 지루한 작업(보일러플레이트 생성, 단위 테스트 작성, 문서화 등)을 자동화하여 개발자의 시간을 크게 절약해줍니다. AI를 활용하면 코드 스캐폴딩 속도를 높이고 테스트 커버리지를 획기적으로 개선하며 버그율을 낮출 수 있습니다. 하지만 시스템 아키텍처 설계, 모호한 비즈니스 요구사항 해석, 창의적 문제 해결 등은 여전히 인간의 고유 영역으로 남아있습니다.
NCO: 디코딩에서 부정적 제약 조건 처리를 위한 다용도 플러그인
본 논문은 대규모 언어 모델(LLM)의 출력에서 욕설이나 개인 식별 정보(PII)와 같은 원치 않는 콘텐츠를 효과적으로 제어하는 새로운 디코딩 전략인 NCO를 제안합니다. 기존 방식들이 가진 높은 계산 비용과 복잡한 다중 제약 조건 처리의 어려움을 해결하기 위해, NCO는 여러 하드 및 정규 표현식 제약을 온라인으로 효율적으로 매칭하고 추적하여 상태 폭발 없이 오버헤드를 줄입니다. NCO는 빔 서치나 소프트 마스킹 같은 표준 LLM 추론 기법과 완벽하게 호환되며, PII 및 욕설 필터링 등 실제 응용 분야에서 그 효과를 입증했습니다.
PHAGE: 표현 학습을 위한 특허 이질적 어텐션 가이드 그래프 인코더
PHAGE는 특허 청구항의 복잡하고 계층적인 종속 구조를 효과적으로 모델링하기 위해 설계된 새로운 그래프 인코더입니다. 기존 방식들이 청구항을 단순 텍스트로 선형화하여 구조적 정보를 손실하는 문제를 해결합니다. PHAGE는 결정론적 파이프라인으로 관계 유형을 이질적인 엣지로 분리하고, 연결성 마스크와 학습 가능한 바이어스를 통해 토폴로지 정보를 어텐션 메커니즘에 통합함으로써 청구항 수준의 구조를 유지하며 문맥적 이해도를 높입니다. 또한, 이중 그라뉼러리티 목적 함수를 사용하여 특허 내부 구조와 외부 분류학 모두에 대한 표현 학습을 최적화합니다.
이번 주 라이브 스트림에서 GPU 가속 멀티 에이전트 앱 구축 방법 소개
이번 라이브 스트림에서는 ADK를 활용하여 에이전트 팀을 오케스트레이션하고, NVIDIA RTX PRO 6000 GPU 가속 환경에서 Gemma 4 모델을 Cloud Run에 배포하는 방법을 다룹니다. 또한 Milvus 벡터 데이터베이스를 사용하여 이들 구성 요소를 연결함으로써 고성능 멀티 에이전트 애플리케이션 구축 과정을 소개할 예정입니다.
FERA: 대규모 언어 모델을 위한 불확실성 인식 연합 추론
본 논문은 중앙 집중화가 어려운 분산된 사적 데이터를 활용하여 대규모 언어 모델(LLMs)의 추론 능력을 향상시키는 '불확실성 인식 연합 추론(FERA)' 프레임워크를 제안합니다. FERA는 서버가 클라이언트의 원시 데이터에 접근할 수 없는 환경에서, 반복적인 서버-클라이언트 공동 정제 과정을 통해 다단계 추론을 개선합니다. 핵심은 불확실성을 측정하고 이를 기반으로 신뢰도를 가중치화하여 이질적인 클라이언트 간의 충돌을 해결하는 '불확실성 인식 자체 비판 집계(UA-SCA)' 메커니즘입니다.
SkillRAE: 검색 증강 실행을 위한 에이전트 스킬 기반 컨텍스트 컴파일
SkillRAE은 대규모 언어 모델(LLM) 기반 에이전트의 검색 증강 실행(RAE)을 개선하기 위해 제안된 2단계 접근 방식입니다. 이 방법은 스킬 라이브러리에서 선택된 여러 스킬과 지식 조각들을 단순히 모으는 것을 넘어, 이를 압축적이고 근거가 명확하며 즉시 사용 가능한 형태로 '컨텍스트 컴파일'하는 데 중점을 둡니다. SkillRAE는 오프라인 단계에서 다단계 스킬 그래프를 구축하고, 온라인 검색 및 구조 복구 인지 압축 컴파일을 통해 최종적으로 작업에 최적화된 고품질 컨텍스트를 생성하여 기존 RAE 방법론 대비 성능 향상을 입증했습니다.
GLiNER-Relex: 개체명 인식 및 관계 추출을 위한 통합 프레임워크
GLiNER-Relex는 개체명 인식(NER)과 관계 추출(RE)를 단일 통합 프레임워크에서 수행할 수 있도록 설계된 새로운 NLP 아키텍처입니다. 이 프레임워크는 공유 트랜스포머 인코더를 사용하여 텍스트, 개체 유형, 관계 유형을 공동으로 표현하며, 이를 통해 제로샷 추출이 가능합니다. GLiNER-Relex는 높은 성능과 계산 효율성을 유지하면서도 사용자가 임의의 개체 및 관계 유형에 대해 단일 호출로 트리플렛(triplets)을 얻을 수 있는 오픈 소스 API를 제공합니다.
합성 전(Pre)-사전 훈련이 언어 모델의 노이즈가 포함된 사전 훈련 데이터에 대한 강건성을 향상시킨다
본 연구는 대규모 언어 모델(LLMs)의 사전 훈련 데이터에 내재된 노이즈가 모델 성능을 저하시키는 문제를 다루며, 이를 해결하기 위해 합성 데이터를 기반으로 하는 경량의 전(Pre)-사전 훈련(PPT) 단계를 제안합니다. 다양한 손상 설정에서 PPT를 거친 모델은 후속 사전 훈련 단계에서 노이즈 데이터에 대한 강건성을 일관되게 향상시키는 것으로 나타났습니다. 특히, 이 방법은 적은 양의 합성 데이터를 사용하여 자연어 텍스트의 토큰 사용량을 크게 줄이면서도 높은 성능을 유지할 수 있음을 입증했습니다.
MolSight: 이미지를 이용한 분자 특성 예측
MolSight는 이미지를 활용하여 분자의 특성을 예측하는 체계적이고 대규모의 연구 프레임워크입니다. 이 연구는 10가지 비전 아키텍처와 7가지 사전 학습 전략을 사용하여 물리적 특성 회귀, 신약 발견 분류 등 10가지 다운스트림 태스크에 걸쳐 성능을 평가했습니다. 특히, 구조적 복잡성에 기반한 '화학 정보 기반 커리큘럼'을 제안하여 모델의 성능을 향상시켰으며, 오직 단일 본드 라인 이미지 시각 정보만으로도 경쟁력 있는 예측이 가능함을 입증했습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.