본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv논문

TestMap: 파운데이션 모델 지원 테스트 생성을 위한 증거 인프라

파운데이션 모델이 생성한 단위 테스트의 정확성과 유용성을 검증하기 위한 증거 기반 인프라인 TestMap을 제안합니다. C#/.NET 환경에서 테스트 생성의 전 과정을 자동화하고, 생성된 테스트의 라이프사이클을 기록하여 모델의 한계와 품질을 분석합니다.

4일 전0
arXiv논문

Linux IOCTL Census: Linux 커널 제어 코드 표면(Control-Code Surface)에 대한 소스 기반 데이터베이스

Linux 커널의 ioctl 시스템 호출을 통한 공격 표면을 분석하기 위해 소스 기반 데이터베이스인 Linux IOCTL Census를 제안합니다. libclang을 사용하여 명령 코드, 입력 싱크, 권한 게이트 등을 체계적으로 복구하고 구조화된 데이터를 제공합니다.

4일 전0
arXiv논문

RECON: LLM 기반의 역방향 제약 조건 분석 프레임워크

RECON은 정적 프로그램 분석과 LLM을 결합하여 Android 바이트코드로부터 정밀한 실행 제약 조건을 추출하는 프레임워크입니다. 기존 심볼릭 실행의 한계인 경로 폭발 문제를 해결하며, 전통적 방식보다 5.8배 빠른 속도와 100%의 성공률을 기록했습니다.

4일 전0
arXiv논문

MASTOR: RESTful API를 위한 시맨틱 테스트 오라클 생성을 위한 멀티 에이전트 접근 방식

MASTOR는 RESTful API의 시맨틱 결함을 탐지하기 위해 소스 코드를 분석하여 테스트 오라클을 생성하는 멀티 에이전트 프레임워크입니다. 소스 추출과 병렬 오라클 생성 단계를 거치며, 챌린저 에이전트 리뷰를 통해 생성된 오라클의 품질을 높입니다.

4일 전0
arXiv논문

인식에서 행동으로: LLM 지원 개발 환경에서 개발자들이 접근성 혁신에 참여하는 방식

LLM 기반 개발 환경에서 접근성 혁신을 달성하기 위한 연구 결과를 다룹니다. 장애인 주도 이니셔티브와 참여형 접근 방식이 포용적 혁신을 이끄는 핵심 동력임을 강조합니다.

4일 전0
arXiv논문

커버리지와 Kill Score를 넘어: 테스트 스위트의 행동 격차(Behavioural Gaps)에 대한 실증적 측정

기존의 코드 커버리지와 변이 테스트가 포착하지 못하는 '행동 격차(Behavioural Gaps)'를 측정하는 새로운 접근 방식을 제안합니다. 자연어 문서와 소스 코드에서 기대 동작을 추출하여 테스트 스위트의 품질을 평가하며, 기존 지표가 높은 경우에도 동작 검증이 누락될 수 있음을 입증했습니다.

4일 전0
arXiv논문

에이전트 프레임워크의 전력 소모와 부채: 실증적 연구 (등록 보고서)

에이전트 AI 시스템의 기술 부채(SATD)와 런타임 에너지 소비 사이의 상관관계를 분석하는 실증적 연구를 제안합니다. 5개의 오픈 소스 프레임워크를 대상으로 코드 품질이 에너지 효율적 설계에 미치는 영향을 조사합니다.

4일 전0
arXiv논문

IoT 기반 시스템에서 엔드 유저의 요구사항 탐색 및 보완

IoT 자동화 규칙의 파편화와 안전성 문제를 해결하기 위해 의도 기반 요구사항 완성(intent driven requirements completion) 접근 방식을 제안합니다. LLM과 멀티 에이전트 프레임워크를 활용하여 규칙을 의도로 재구성하고 다시 생성하는 이중 프로세스를 통해 시스템의 신뢰성을 높입니다.

4일 전0
arXiv논문

DeNovoSWE: 전체 저장소 생성을 위한 장기적 관점(Long-Horizon) 환경의 확장

DeNovoSWE는 고수준 사양으로부터 전체 소프트웨어 저장소를 생성하기 위한 대규모 데이터셋을 제안합니다. 샌드박스 에이전트 워크플로우를 통해 구축된 4,818개의 고품질 인스턴스를 포함하며, 이를 통해 모델의 장기적 소프트웨어 엔지니어링 능력을 크게 향상시킵니다.

4일 전0
arXiv논문

코드 언어 모델의 보안 강화: 코드 언어 모델에서의 자연적 백도어 취약점 탐지

CodeLMs에서 데이터 포이즈닝 없이도 발생하는 '자연적 백도어' 취약성을 실증적으로 연구한 논문입니다. 44가지 시나리오를 통해 취약성의 만연함과 전이성을 분석하고, 이를 탐지하기 위한 새로운 방법론인 ScanNBT를 제안합니다.

4일 전0
arXiv논문

GapFuzz: 분산 SDN 컨트롤러를 위한 교차 평면 발산 퍼징 (Cross-Plane Divergence Fuzzing)

분산 SDN 클러스터의 제어 평면과 데이터 평면 간의 상태 불일치를 탐지하는 새로운 퍼징 기법인 GapFuzz를 제안합니다. 제어된 지연 시간 주입과 2단계 타이밍 탐색을 통해 복제 레이스 상황에서 발생하는 교차 평면 발산 결함을 효과적으로 찾아냅니다.

4일 전0
arXiv논문

더 나은 소프트웨어 설명 작성하기: 가이드라인 기반 접근 방식

LLM의 생성 결과물에 대한 신뢰성과 제어 가능성을 높이기 위해 가이드라인 기반의 소프트웨어 설명 작성 도구를 제안합니다. 연구 결과, 이 도구는 수동 작성 방식보다 사용자 만족도를 유의미하게 높였으며 작성 효율성 향상의 가능성을 보여주었습니다.

4일 전0
arXiv논문

품질 속성에서 실무로: 설명 가능성 요구사항을 위한 가이드라인 및 워크플로우

AI 시스템의 설명 가능성(Explainability) 요구사항을 체계적으로 공식화하기 위한 가이드라인과 워크플로우를 제안합니다. 연구 결과, LLM 지원 도구를 활용할 경우 요구사항 작성 시간을 약 23.5% 단축하면서도 높은 품질을 유지할 수 있음을 입증했습니다.

4일 전0
arXiv논문

데이터 집약적 확장 가능 컴퓨팅 시스템을 위한 속성 기반 테스트의 운영화

데이터 집약적 확장 가능 컴퓨팅(DISC) 시스템의 의미론적 오류를 탐지하기 위한 속성 기반 테스트(PBT) 엔진인 DiscPBT를 제안합니다. Apache Spark를 대상으로 8가지 메타 속성을 도입하여 기존 퍼징 방식보다 높은 커버리지와 실행 계획 다양성을 달성했습니다.

4일 전0
arXiv논문

AI 코드 생성기에 대한 문맥 기반 적대적 공격: 취약성 분석 및 시사점

AI 코드 생성 시스템을 대상으로 주석이나 변수명을 이용한 문맥 기반 적대적 공격의 취약성을 분석한 연구입니다. 실험 결과 GPT-3.5-Turbo 등 주요 모델에서 취약성 생성률이 급증했으며, 이를 방어하기 위한 이중 계층 방어 프레임워크의 실효성을 입증했습니다.

4일 전0
arXiv논문

다국어 소프트웨어 취약점 탐지를 위한 Transformer 모델의 초기 비교 평가

본 논문은 HTML, Python, JavaScript, PHP 등 다양한 언어 환경에서 Transformer 기반 모델의 소프트웨어 취약점 탐지 성능을 비교 평가합니다. BERT, RoBERTa, CodeBERT를 활용하여 다국어 환경에서의 이진 취약점 탐지 능력을 분석했습니다.

4일 전0
Dev.to헤드라인

거짓말을 하지 않는 명세 (The Spec That Doesn't Lie)

에이전트에게 전달하는 명세(spec)의 품질이 구현 결과에 미치는 영향을 분석합니다. 모호하거나 내부 구현 세부 사항을 포함한 잘못된 명세가 어떻게 에이전트의 부정확한 구현을 유도하는지 사례를 통해 설명합니다.

4일 전0
Dev.to헤드라인

인간의 글쓰기에서 사고 루프(Thought Loops)를 감지하는 시스템을 구축했습니다

과도한 생각을 종료 조건이 없는 재귀적 연산 루프로 정의하고, 이를 감지하기 위한 시스템적 접근법을 제시합니다. NexoMind 구축 과정에서 발견한 5가지 사고 루프 유형과 의미론적 유사성을 통한 감지 원리를 설명합니다.

4일 전0
Dev.to헤드라인

클라우드 없이, 비용 없이: Gemma 4로 오프라인 시각 AI 에이전트 구축하기

Gemma 4 12B를 활용하여 클라우드 연결 없이 노트북에서 실행 가능한 로컬 시각 AI 에이전트를 구축하는 방법을 소개합니다. QAT와 인코더 프리 설계를 통해 메모리 효율성을 극대화하여 일반적인 환경에서도 멀티모달 추론이 가능함을 보여줍니다.

4일 전0
Dev.to헤드라인

Gumroad에서 AI 개발자 도구를 판매하여 부수입 창출하기 (2개월 차 업데이트: $382)

Manus AI 사용자용 도구를 Gumroad에서 판매하며 얻은 2개월간의 수익과 마케팅 전략을 공유합니다. 번들 판매, 콘텐츠 마케팅, 제휴 프로그램을 통해 매출을 151% 성장시킨 실질적인 데이터 기반의 사례 연구입니다.

4일 전0

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.