본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv논문

커버리지와 Kill Score를 넘어: 테스트 스위트의 행동 격차(Behavioural Gaps)에 대한 실증적 측정

기존의 코드 커버리지와 변이 테스트가 포착하지 못하는 '행동 격차(Behavioural Gaps)'를 측정하는 새로운 접근 방식을 제안합니다. 자연어 문서와 소스 코드에서 기대 동작을 추출하여 테스트 스위트의 품질을 평가하며, 기존 지표가 높은 경우에도 동작 검증이 누락될 수 있음을 입증했습니다.

4일 전0
arXiv논문

에이전트 프레임워크의 전력 소모와 부채: 실증적 연구 (등록 보고서)

에이전트 AI 시스템의 기술 부채(SATD)와 런타임 에너지 소비 사이의 상관관계를 분석하는 실증적 연구를 제안합니다. 5개의 오픈 소스 프레임워크를 대상으로 코드 품질이 에너지 효율적 설계에 미치는 영향을 조사합니다.

4일 전0
arXiv논문

IoT 기반 시스템에서 엔드 유저의 요구사항 탐색 및 보완

IoT 자동화 규칙의 파편화와 안전성 문제를 해결하기 위해 의도 기반 요구사항 완성(intent driven requirements completion) 접근 방식을 제안합니다. LLM과 멀티 에이전트 프레임워크를 활용하여 규칙을 의도로 재구성하고 다시 생성하는 이중 프로세스를 통해 시스템의 신뢰성을 높입니다.

4일 전0
arXiv논문

DeNovoSWE: 전체 저장소 생성을 위한 장기적 관점(Long-Horizon) 환경의 확장

DeNovoSWE는 고수준 사양으로부터 전체 소프트웨어 저장소를 생성하기 위한 대규모 데이터셋을 제안합니다. 샌드박스 에이전트 워크플로우를 통해 구축된 4,818개의 고품질 인스턴스를 포함하며, 이를 통해 모델의 장기적 소프트웨어 엔지니어링 능력을 크게 향상시킵니다.

4일 전0
arXiv논문

코드 언어 모델의 보안 강화: 코드 언어 모델에서의 자연적 백도어 취약점 탐지

CodeLMs에서 데이터 포이즈닝 없이도 발생하는 '자연적 백도어' 취약성을 실증적으로 연구한 논문입니다. 44가지 시나리오를 통해 취약성의 만연함과 전이성을 분석하고, 이를 탐지하기 위한 새로운 방법론인 ScanNBT를 제안합니다.

4일 전0
arXiv논문

GapFuzz: 분산 SDN 컨트롤러를 위한 교차 평면 발산 퍼징 (Cross-Plane Divergence Fuzzing)

분산 SDN 클러스터의 제어 평면과 데이터 평면 간의 상태 불일치를 탐지하는 새로운 퍼징 기법인 GapFuzz를 제안합니다. 제어된 지연 시간 주입과 2단계 타이밍 탐색을 통해 복제 레이스 상황에서 발생하는 교차 평면 발산 결함을 효과적으로 찾아냅니다.

4일 전0
arXiv논문

더 나은 소프트웨어 설명 작성하기: 가이드라인 기반 접근 방식

LLM의 생성 결과물에 대한 신뢰성과 제어 가능성을 높이기 위해 가이드라인 기반의 소프트웨어 설명 작성 도구를 제안합니다. 연구 결과, 이 도구는 수동 작성 방식보다 사용자 만족도를 유의미하게 높였으며 작성 효율성 향상의 가능성을 보여주었습니다.

4일 전0
arXiv논문

품질 속성에서 실무로: 설명 가능성 요구사항을 위한 가이드라인 및 워크플로우

AI 시스템의 설명 가능성(Explainability) 요구사항을 체계적으로 공식화하기 위한 가이드라인과 워크플로우를 제안합니다. 연구 결과, LLM 지원 도구를 활용할 경우 요구사항 작성 시간을 약 23.5% 단축하면서도 높은 품질을 유지할 수 있음을 입증했습니다.

4일 전0
arXiv논문

데이터 집약적 확장 가능 컴퓨팅 시스템을 위한 속성 기반 테스트의 운영화

데이터 집약적 확장 가능 컴퓨팅(DISC) 시스템의 의미론적 오류를 탐지하기 위한 속성 기반 테스트(PBT) 엔진인 DiscPBT를 제안합니다. Apache Spark를 대상으로 8가지 메타 속성을 도입하여 기존 퍼징 방식보다 높은 커버리지와 실행 계획 다양성을 달성했습니다.

4일 전0
arXiv논문

AI 코드 생성기에 대한 문맥 기반 적대적 공격: 취약성 분석 및 시사점

AI 코드 생성 시스템을 대상으로 주석이나 변수명을 이용한 문맥 기반 적대적 공격의 취약성을 분석한 연구입니다. 실험 결과 GPT-3.5-Turbo 등 주요 모델에서 취약성 생성률이 급증했으며, 이를 방어하기 위한 이중 계층 방어 프레임워크의 실효성을 입증했습니다.

4일 전0
arXiv논문

다국어 소프트웨어 취약점 탐지를 위한 Transformer 모델의 초기 비교 평가

본 논문은 HTML, Python, JavaScript, PHP 등 다양한 언어 환경에서 Transformer 기반 모델의 소프트웨어 취약점 탐지 성능을 비교 평가합니다. BERT, RoBERTa, CodeBERT를 활용하여 다국어 환경에서의 이진 취약점 탐지 능력을 분석했습니다.

4일 전0
Dev.to헤드라인

거짓말을 하지 않는 명세 (The Spec That Doesn't Lie)

에이전트에게 전달하는 명세(spec)의 품질이 구현 결과에 미치는 영향을 분석합니다. 모호하거나 내부 구현 세부 사항을 포함한 잘못된 명세가 어떻게 에이전트의 부정확한 구현을 유도하는지 사례를 통해 설명합니다.

4일 전0
Dev.to헤드라인

인간의 글쓰기에서 사고 루프(Thought Loops)를 감지하는 시스템을 구축했습니다

과도한 생각을 종료 조건이 없는 재귀적 연산 루프로 정의하고, 이를 감지하기 위한 시스템적 접근법을 제시합니다. NexoMind 구축 과정에서 발견한 5가지 사고 루프 유형과 의미론적 유사성을 통한 감지 원리를 설명합니다.

4일 전0
Dev.to헤드라인

클라우드 없이, 비용 없이: Gemma 4로 오프라인 시각 AI 에이전트 구축하기

Gemma 4 12B를 활용하여 클라우드 연결 없이 노트북에서 실행 가능한 로컬 시각 AI 에이전트를 구축하는 방법을 소개합니다. QAT와 인코더 프리 설계를 통해 메모리 효율성을 극대화하여 일반적인 환경에서도 멀티모달 추론이 가능함을 보여줍니다.

4일 전0
Dev.to헤드라인

Gumroad에서 AI 개발자 도구를 판매하여 부수입 창출하기 (2개월 차 업데이트: $382)

Manus AI 사용자용 도구를 Gumroad에서 판매하며 얻은 2개월간의 수익과 마케팅 전략을 공유합니다. 번들 판매, 콘텐츠 마케팅, 제휴 프로그램을 통해 매출을 151% 성장시킨 실질적인 데이터 기반의 사례 연구입니다.

4일 전0
Dev.to헤드라인

예측 및 이상 탐지를 위한 대규모 언어 모델 (LLM): 체계적 문헌 고찰

예측 및 이상 탐지 분야에서 대규모 언어 모델(LLM)의 활용을 다룬 체계적 문헌 고찰 논문입니다. LLM이 시계열 데이터 분석 및 이상 징후 포착에 어떻게 적용되는지 연구 동향을 분석합니다.

4일 전0
arXiv논문

AnimaSpark: 임의의 3D 객체를 애니메이션화하기 위한 피드포워드 (Feed-Forward) 방식

AnimaSpark는 카테고리에 구애받지 않는 3D 애니메이션 생성을 위한 새로운 피드포워드 파이프라인을 제안합니다. 비디오 생성 모델과 키포인트 추적을 결합하여 2D 도메인의 움직임을 3D 공간으로 리프트하는 방식을 사용합니다.

4일 전0
GeekNews헤드라인

Show GN: 빅브라더 - 한국의 포럼/커뮤니티 사업자를 위한 이미지 AI 검열 도구

국내 전기통신사업법 개정에 따라 커뮤니티 사업자에게 요구되는 이미지 필터링 의무를 지원하기 위한 오픈소스 도구입니다. NVIDIA GPU를 활용한 AI 모델 서빙과 Hash bank 기술을 결합하여 효율적인 유해 이미지 검열을 지원합니다.

4일 전0
Dev.to헤드라인

라이덴 선언 (The Leiden Declaration)

OpenAI의 추론 모델이 80년 된 수학 난제를 해결하며 AI의 연구 역량을 입증한 가운데, 수학계는 '라이덴 선언'을 통해 AI 연구의 윤리적 기준과 공공성을 촉구하고 있습니다. 이 선언은 AI가 생성한 증명의 검증 문제와 기업 중심의 연구 편향성에 대한 우려를 담고 있습니다.

4일 전0
Dev.to헤드라인

운영 중인 기관용 트레이딩 플랫폼을 망가뜨리지 않고 확장하는 방법

기존 운영 중인 기관용 트레이딩 플랫폼을 안정적으로 확장하기 위한 엔지니어링 원칙을 다룹니다. 시스템 아키텍처에 대한 철저한 이해, 엄격한 워크플로우 준수, 그리고 AI를 코드 생성보다는 시스템 이해와 테스트 보완에 활용하는 전략을 제시합니다.

4일 전0

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.