© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

Pull Request 이전 단계: 멀티 에이전트 협업(Multi-Agent Coordination) 마이닝

자율 코딩 에이전트 간의 협업 문제를 해결하기 위해 PR 이전 단계의 상호작용을 분석하는 연구를 소개합니다. 오픈 소스 협업 기질인 'grite'를 통해 에이전트 간 작업 충돌과 중복을 줄이고 처리량을 3배 이상 높이는 방법을 제시합니다.

프롬프트 품질과 풀 리퀘스트(Pull Request) 결과: LLM 지원 개발에 대한 단계별 실증 연구

LLM 기반 도구가 소프트웨어 엔지니어링 워크플로, 특히 풀 리퀘스트(PR) 결과에 미치는 프롬프트 구조의 영향을 분석한 연구입니다. 프롬프트의 문맥, 구체성, 검증이라는 세 가지 차원이 코드 생성 및 채택에 미치는 상관관계를 실증적으로 규명했습니다.

OpenSIL 펌웨어 내 LLM 생성 유닛 테스트를 위한 라이브러리 인식 Doubles 및 반복적 수정 (Iterative Repair) 연구

AMD의 openSIL 펌웨어 환경에서 LLM 기반 멀티 에이전트 파이프라인을 활용해 유닛 테스트를 자동 생성하는 연구를 소개합니다. 라이브러리 인식 더블(Doubles) 생성과 반복적 수정 루프를 통해 컴파일 실패를 줄이고 높은 라인 커버리지를 달성했습니다.

PUFFERDOS: 정규 표현식 서비스 거부(ReDoS) 취약점을 위한 효율적이고 효과적인 공격 문자열 생성

ReDoS(정규 표현식 서비스 거부) 공격을 위해 실제 프로그램 환경에서 실행 가능한 공격 문자열을 생성하는 PUFFERDOS를 제안합니다. 기존 기술의 비현실적인 입력 길이를 극복하고, 형식 검증과 합성적 콘콜릭 실행을 통해 실질적인 취약점 악용 가능성을 보장합니다.

에이전트 기반 전자 설계 자동화 (Agentic EDA): 핸드오프 관점

LLM 기반 에이전트를 활용한 전자 설계 자동화(EDA) 과정에서 발생하는 핸드오프(handoff) 문제를 분석합니다. 에이전트 간의 데이터 전달 시 유효성을 보장하기 위한 조건과 세 가지 경계 클래스를 정의합니다.

TensorFlow 및 Keras 애플리케이션의 잘못된 코딩 관행이 초래하는 숨겨진 환경적 비용: 리소스 누수 및 탄소 배출에 관한 연구

TensorFlow 및 Keras 애플리케이션에서 발생하는 리소스 누수(IMR, UTR)가 에너지 소비와 탄소 배출에 미치는 영향을 분석한 연구입니다. 실험 결과, 리소스 누수가 전력 사용량을 최대 46%까지 증가시켜 환경적 지속 가능성을 저해함을 입증했습니다.

근거 있는 추론 (Grounded Inference): 확률적 모델의 결정론적 캡슐화를 위한 원칙

생성 모델을 전통적인 컴퓨팅 시스템에 안전하게 통합하기 위한 '근거 있는 추론(Grounded Inference)' 프레임워크를 제안합니다. 확률적 모델을 결정론적으로 캡슐화하는 4가지 프리미티브와 주의해야 할 2가지 안티 패턴을 정의합니다.

CoRaCommit: 예시 검색을 통한 커밋 메시지 생성을 위한 VS Code 확장 프로그램

CoRaCommit은 유사한 커밋 예시를 검색하여 프롬프트 컨텍스트로 활용하는 VS Code 확장 프로그램입니다. 여러 LLM을 병렬 호출하고 사용자 피드백을 반영하여 기존 방식보다 고품질의 커밋 메시지를 생성합니다.

대규모 언어 모델(LLMs)을 활용한 저장소 수준의 Solidity 코드 생성: 프롬프팅에서 미세 조정(Fine-Tuning)까지

Solidity 스마트 컨트랙트의 저장소 수준 코드 생성을 위한 새로운 벤치마크인 SolidityBench와 평가 지표인 SolidityScore를 제안합니다. 다양한 LLM을 대상으로 프롬프팅부터 미세 조정까지의 성능을 비교 분석하여, 지도 미세 조정이 도메인 특화 코드 생성에 가장 효과적임을 입증했습니다.

정적인 엔드포인트를 넘어: 유연한 에이전트형 웹 서비스를 위한 인터페이스로서의 도구 프로그램

LLM 에이전트가 복잡한 워크플로우를 효율적으로 수행할 수 있도록 돕는 실행 가능한 도구 프로그램인 ToolPro를 제안합니다. 정적인 엔드포인트의 한계를 넘어 다단계 상호작용을 압축적으로 인코딩하여 지연 시간과 트래픽을 획기적으로 줄입니다.

낮은 권한으로도 충분할 때: LLM 에이전트의 과도한 권한 도구 선택 조사

LLM 에이전트가 낮은 권한의 대안이 있음에도 높은 권한의 도구를 선택하는 '과도한 권한 도구 선택' 문제를 연구합니다. 새로운 벤치마크인 ToolPrivBench를 통해 에이전트의 위험한 도구 선택 패턴을 분석하고, 이를 완화하기 위한 권한 인식 사후 학습 방어 기법을 제안합니다.

LLM이 생성한 GPU 커널에서의 정확성 착각 (The Correctness Illusion in LLM-Generated GPU

LLM이 생성한 GPU 커널의 정확성을 검증하는 기존 벤치마크들의 한계를 지적합니다. 고정된 형태와 소규모 샘플을 사용하는 기존 방식이 실제 버그를 놓칠 수 있음을 실험적으로 증명했습니다.

퍼즐을 통한 비판적 테스트 리터러시 (CTL) 학습: 경험 보고서

소프트웨어 테스트 역량인 비판적 테스트 리터러시(CTL)를 향상시키기 위해 퍼즐 기반 학습 프레임워크인 P4TEST를 제안합니다. 다양한 워크숍을 통해 퍼즐 기반 교육이 학습자의 인지 모델과 성찰 과정에 미치는 영향을 분석했습니다.

코딩 에이전트를 활용한 N-버전 프로그래밍 (N-Version Programming)

AI 코딩 에이전트 환경에서 N-버전 프로그래밍의 효용성을 검증한 연구입니다. Knight-Leveson 실험을 재검토하여 에이전트 간 공통 모드 실패를 분석하고, 다수결 투표를 통한 오류 감소 효과를 입증했습니다.

LLM을 활용한 Qiskit 코드 마이그레이션

양자 소프트웨어 공학(QSE)의 기술 부채를 해결하기 위해 LLM과 RAG를 결합하여 Qiskit 코드를 자동 마이그레이션하는 하이브리드 접근 방식을 제안합니다. 분류 체계 기반의 RAG 아키텍처를 통해 LLM의 환각을 줄이고 코드 리팩토링의 정밀도를 높이는 연구 결과를 제시합니다.

QMFOL: 정량화 가능한 단항 1차 논리 (Monadic First-Order Logic) 테스트 케이스 생성을 통한 대규모 언어 모델 추론

LLM의 연역적 추론 능력을 정밀하게 평가하기 위해 단항 1차 논리(QMFOL) 기반의 자동화된 벤치마크 생성 프레임워크를 제안합니다. 논리적 복잡성을 정밀하게 제어하며, 외부 증명기를 통해 논리적 일관성을 보장하는 QMFOLBench를 구축했습니다.

Phoenix: 멀티 에이전트 LLM을 통한 안전한 GitHub 이슈 해결

Phoenix는 GitHub 이슈 해결을 위해 6개의 전문 에이전트로 구성된 멀티 에이전트 LLM 시스템입니다. 7단계의 안전 제어 메커니즘을 통해 코드 수정부터 PR 생성까지의 과정을 자동화하며, 높은 정확도와 회귀 방지 성능을 보여줍니다.

AutoPass: 컴파일러 성능 튜닝을 위한 증거 기반 LLM 에이전트

AutoPass는 컴파일러 내부 상태와 런타임 피드백을 분석하여 최적의 컴파일 옵션을 찾아내는 멀티 에이전트 프레임워크입니다. LLM이 컴파일러의 중간 표현을 직접 분석함으로써 기존 블랙박스 방식의 한계를 극복하고 성능을 최적화합니다.

재생 에너지 커뮤니티를 위한 디지털 트윈의 SysML 모델링

재생 에너지 커뮤니티(REC)의 디지털 트윈 구축을 위한 MBSE 워크플로우를 제안합니다. SysML과 Modelio를 사용하여 장치 분류 및 조직 뷰를 모델링하고, SysML의 의미론적 격차를 해결하기 위해 SAREF4ENER 온톨로지를 결합하는 방안을 탐구합니다.

강화학습 (RL) 환경 제품군 개발을 위한 모델 주도 접근 방식

강화학습(RL) 에이전트의 학습을 위해 다양한 환경 변형 제품군을 효율적으로 생성하는 모델 주도 접근 방식을 제안합니다. 하이브리드 유전 알고리즘과 모델 변환 엔진을 활용하여 기존의 수동적이고 노동 집약적인 환경 개발 프로세스를 자동화합니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.