본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv논문

구조화된 개념 진화(Structured Concept Evolution)를 통한 대규모 언어 모델(LLM)의 양자 LDPC 코드 발견

LLM과 구조화된 대수적 변이 문법을 결합한 SCE 프레임워크를 통해 새로운 양자 LDPC 코드를 발견하는 연구를 소개합니다. LLM이 직접 코드를 설계하는 대신 계층적 변이를 통해 대수적 사양을 진화시킴으로써 비아벨 군 기반의 경쟁력 있는 코드 패밀리를 찾아냈습니다.

3일 전0
arXiv논문

채점자를 채점하기: 에이전트 기반 데이터 분석 시스템 평가로부터 얻은 교훈

에이전트 기반 데이터 분석 시스템의 복잡한 출력을 정확히 평가하기 위한 새로운 인간-AI 채점 캐스케이드 방법론을 제안합니다. LAMBDA 시스템을 통해 자동 채점기의 신뢰성을 검증하고, 채점 품질을 높이는 다양한 전략을 연구했습니다.

3일 전0
arXiv논문

비기능적 요구사항(NFR) 평가를 위한 멀티턴 LLM 대화의 정확도 및 만족도

LLM 기반 대화형 어시스턴트의 비기능적 요구사항(NFR) 평가 방법론을 다룬 연구입니다. HIPAA 규제 준수 도메인을 대상으로 멀티턴 대화의 정확도와 사용자 만족도를 분석하여, 단순 기능적 정확성을 넘어선 새로운 평가 지표의 필요성을 제시합니다.

3일 전0
arXiv논문

태스크와 목적의 매칭: 인코더-디코더 사전 학습 언어 모델을 위한 미세 조정(Fine-Tuning) 및 프롬프트

인코더-디코더 언어 모델의 성능을 극대화하기 위해 태스크와 사전 학습 목적 함수를 매칭하는 MTO 프레임워크를 제안합니다. 이 방식은 퓨샷 설정에서 기존 방식 대비 120% 이상의 성능 향상을 보이며, 프롬프트 튜닝 최적화에도 효과적입니다.

3일 전0
arXiv논문

조각난 세계 모델: 범용 에이전트를 위한 구조적 인증 (Structural Certification)

범용 에이전트가 직면하는 세계 모델의 파편화 문제를 해결하기 위해 '구조적 인증(Structural Certification)' 프레임워크를 제안합니다. 표준적인 최악의 경우 분석의 한계를 극복하고, 특정 전이를 국소화하여 에이전트의 성능을 보증하는 알고리즘을 제시합니다.

3일 전0
arXiv논문

IV-CoT: 구조 인지적 텍text-to-image 생성을 위한 암시적 시각적 사고 사슬 (Implicit Visual

IV-CoT는 텍스트-이미지 생성 시 객체 수, 공간 관계 등 구조적 프롬프트 준수 능력을 향상시키기 위한 새로운 프레임워크입니다. 구조적 계획과 외형 렌더링을 분리하여 암시적 시각적 사고 사슬을 통해 정교한 이미지 생성을 가능하게 합니다.

3일 전0
arXiv논문

복잡한 문제: AI 기반 AAC 인터페이스의 설계 및 평가에 대하여

AI 기반 보완 대체 의사소통(AAC) 인터페이스 설계 시 발생하는 복잡성과 평가의 어려움을 다룹니다. 사용자의 교차적 특성을 반영할 수 있는 새로운 평가 방법론을 제안하며, AI가 AAC 사용자에게 미치는 영향과 문제 해결 방안을 탐구합니다.

3일 전0
arXiv논문

FLUX3D: 확산 정렬 희소 표현(Diffusion-Aligned Sparse Representation)을 통한 고충실도 3D 가우시안 생성

FLUX3D는 이미지로부터 고충실도 3D 가우시안 스플래팅(3DGS)을 생성하는 새로운 프레임워크입니다. DA-SLAT와 SMDiT 기술을 통해 기존 방식의 표현 및 정렬 병목 현상을 해결하여 시각적 세부 사항을 획기적으로 개선했습니다.

3일 전0
arXiv논문

OpenThoughts-Agent: 에이전트 모델을 위한 데이터 레시피

OpenThoughts-Agent(OT-Agent)는 에이전트 모델 학습을 위한 완전 공개 데이터 큐레이션 파이프라인을 제안합니다. 10만 개의 학습 데이터로 Qwen3-32B를 미세 조정하여 기존 Nemotron-Terminal-32B보다 높은 벤치마크 성능을 달성했습니다.

3일 전0
arXiv논문

ESBMC-PLC+: PLCverif의 후속작으로서 통합된 IEC 61131-3 형식 검증 프레임워크

ESBMC-PLC+는 기존 PLCverif의 한계를 극복하기 위해 개발된 통합 IEC 61131-3 형식 검증 프레임워크입니다. ST/SCL 프런트엔드 지원과 기능 블록 상태 의미론 도입을 통해 유계가 없는 안전성 증명을 가능하게 합니다.

3일 전0
arXiv논문

InSight: 조종 가능한 VLA를 통한 자기 주도적 기술 습득

InSight는 VLA 모델이 원시 행동(primitive-action) 수준에서 조종 가능하도록 하여 자율적인 기술 습득을 지원하는 프레임워크입니다. VLM을 활용해 시연을 세분화하고, 누락된 기술을 스스로 학습하는 데이터 플라이휠 구조를 통해 인간의 추가 시연 없이도 새로운 과제를 수행합니다.

3일 전0
arXiv논문

태스크 가이드형 대화 그래프에서 목표 지향적 대화 런타임으로

멀티 에이전트 환경에서 대화의 연속성을 유지하기 위한 '목표 지향적 대화 런타임(GODR)' 디자인 패턴을 제안하는 논문입니다. 목표를 일급 객체로 취급하여 복잡한 상호작용 중에도 목표의 중단, 재개, 수정이 가능하도록 설계되었습니다.

3일 전0
arXiv논문

JupOtter: Jupyter Notebooks에서의 셀 단위 버그 탐지

Jupyter Notebooks의 복잡성 증가에 대응하기 위해 셀 단위로 버그를 탐지하는 시스템인 JupOtter를 제안합니다. 노트북 특화 토큰화 전략과 새로운 데이터셋인 OtterDataset을 통해 기존 정적 분석기 및 LLM보다 뛰어난 성능을 입증했습니다.

3일 전0
Qiita헤드라인

Samsung 사원에게 ChatGPT·Codex 허용! OpenAI와의 전략적 제휴 속보 해설

Samsung DX 부문이 사원들에게 ChatGPT와 Codex 사용을 허용하며 AI 도입 방침을 전환했습니다. 또한 Samsung 그룹 4개사가 OpenAI와 AI 데이터 센터 인프라 구축을 위한 전략적 제휴 의향서(LOI)를 체결했습니다.

3일 전0
arXiv논문

실무에서의 도메인 주도 설계 (Domain-Driven Design): 오픈 소스 저장소의 유지보수 및 진화에 관한 마이닝 연구

오픈 소스 프로젝트에서 도메인 주도 설계(DDD)의 실행 방식과 진화, 유지보수 품질 간의 관계를 분석한 실증적 연구입니다. GitHub 저장소를 대상으로 DDD 빌딩 블록의 분포와 경계 위반이 유지보수에 미치는 영향을 조사합니다.

3일 전0
arXiv논문

AutoSpec: 귀납 논리 프로그래밍 (ILP)을 통한 LLM 에이전트용 안전 규칙 진화

AutoSpec은 귀납 논리 프로그래밍(ILP)과 반례 유도 합성(CEGIS)을 결합하여 LLM 에이전트용 안전 규칙을 자동으로 생성하는 프레임워크입니다. 기존 수작업 규칙의 취약점과 신경망 분류기의 낮은 해석 가능성을 극복하여, 정밀도와 재현율이 높은 해석 가능한 규칙을 진화시킵니다.

3일 전0
arXiv논문

협업 및 AI 지원 요구사항 도출: 실증 연구

LLM을 활용한 요구사항 도출 과정이 산출물의 품질에 미치는 영향을 비교 분석한 실증 연구입니다. 실험 결과, 인간의 협업과 AI의 합성을 결합한 방식이 전통적인 방식보다 더 명확하고 실행 가능한 요구사항을 생성함을 확인했습니다.

3일 전0
arXiv논문

하이브리드 양자-고전 소프트웨어 시스템 설계: 정량적 보장을 통한 설계 트레이드오프 공간 탐색

양자-고전 하이브리드 소프트웨어 시스템을 설계하기 위해 서비스 지향 아키텍처(SOA) 원칙을 적용하는 연구를 다룹니다. NISQ 장치의 제약 사항을 고려하여 정량적 보장을 통해 최적의 시스템 구성을 탐색하는 방법론을 제안합니다.

3일 전0
arXiv논문

Agon: 프롬프트 경제 (Prompt Economy)를 기반으로 구축된 자율적 대규모 다학제적 연구 시스템

Agon은 프롬프트 경제를 기반으로 구축된 자율적 다학제 연구 오케스트레이터입니다. 인간의 개입을 최소화하고 기계가 연구를 확장하며 인간이 조종하는 새로운 연구 패러다임을 제시합니다.

3일 전0
arXiv논문

Breaking Update 수정을 위한 AST 변환 규칙의 에이전트 기반 생성

라이브러리 업데이트로 인한 Breaking API 변경 문제를 해결하기 위해 에이전트 기반 프레임워크인 BigBag을 제안합니다. LLM과 AST 변환 엔진을 결합하여 재사용 가능한 수정 프로그램을 생성함으로써, 여러 프로젝트에 걸쳐 효율적이고 확장 가능한 코드 복구를 가능하게 합니다.

3일 전0

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.