우연한 소프트웨어 에이전트 방지: 인간 코드 엔트로피 감소를 위한 최초의 정준 코드(Canonical Code) 및 프런티어 모델 요구 사항의
요약
프런티어 코딩 모델이 인간 저장소의 불필요한 엔트로피를 학습하는 문제를 해결하기 위해 '정준 코드(Canonical Code)' 개념을 제안합니다. 이는 소프트웨어를 증명 가능한 구조로 재작성하여 에이전트의 학습 효율을 높이고 비용을 절감하는 것을 목표로 합니다.
핵심 포인트
- 인간 코드의 우연한 엔트로피(변동성, 모호성 등)가 모델 학습에 미치는 부정적 영향 분석
- 에이전트 친화적인 '정준 코드'를 위한 증명 전달 기질(proof-carrying substrate) 제안
- 소프트웨어를 동작 등가성을 기반으로 통제된 대표값으로 인코딩하는 방법론
- Qwen2.5-Coder-14B를 활용한 예비 실험을 통해 정준 궤적의 학습 가능성 확인
프런티어 코딩 모델(Frontier coding models)은 프로그램의 동작뿐만 아니라, 인간의 저장소(repositories)에 존재하는 우연한 엔트로피(accidental entropy)를 학습하는 데 상당한 용량을 소비할 수 있습니다. 이러한 저장소에는 테스트, 인시던트(incidents), 마이그레이션(migrations), 에지 케이스(edge cases), 제품 판단, 운영 이력과 같은 가치 있는 신호들이 포함되어 있습니다. 이러한 신호들은 프레임워크의 변동(framework churn), 명명 드리프트(naming drift), 생성된 소스의 모호성(generated-source ambiguity), 의존성 의례(dependency rituals), CI 방언(CI dialects), 취약한 증명 경로(weak proof routes), 그리고 인간 중심의 리뷰 관습과 얽혀 있습니다.
우리는 에이전트 우선 정준 코드(agent-first canonical code)를 제안합니다. 이는 일상적인 제품 소프트웨어를 정준 동작 프로필(canonical behavior profiles), 타입화된 변경 대수(typed change algebra), 증명 경로(proof lanes), 제약된 편집 문법(constrained edit grammars), 의미론적 패치 셀(semantic patch cells), 런타임 부정 메모리(runtime negative memory), 그리고 증명을 포함하는 변경 객체(proof-carrying change objects)로 재작성하는 증명 전달 기질(proof-carrying substrate)입니다. 핵심 가설은 선언된 오라클(oracle) 하에서 동작 등가성(behavior equivalence)을 통해 소프트웨어를 몫(quotienting)으로 나누면, 명시적인 증거와 증명 의무를 가진 통제된 대표값으로 등가 인코딩들을 붕괴시킬 수 있다는 것입니다.
최종 목표는 소스, 컨텍스트(context), 추론(reasoning), 도구, 검증, 보안, 출처(provenance), 리뷰, 실패 루프, 결함, 그리고 공통 오라클 하에서의 파운드리 비용(foundry cost)을 포함하여, 검증된 올바른 변경당 분할 상환 비용(amortized cost)을 산출하는 것입니다. 보고된 감소 범위는 가설일 뿐, 측정된 프런티어 결과는 아닙니다. 제안된 한계점은 '무사고 지평선(No-Accident Horizon)'입니다. 이는 잔여 신규성(residual novelty), 증거, 거버넌스(governance), 리스크, 그리고 미래의 선택권이 지배하기 전까지 제거 가능한 사고(accident)가 감소하는 지점을 의미합니다. 지원되는 일상적 제품 분포의 경우, 이는 모든 소프트웨어에 대한 보장이 아니라, 전체 비용을 약 100배 절감할 수 있는 방어 가능한 계획 목표를 제시합니다.
Qwen2.5-Coder-14B에 대한 예비 QLoRA 실험 결과, 64,088개의 정준 궤적(canonical trajectories)이 학습 가능하며 테스트된 금지 언어 마커(forbidden-language markers)를 억제함을 보여주었으나, 동작 보존(behavior preservation), 스케일링 경제성(scaling economics), 또는 검증된 변경 비용을 확립하지는 못했습니다. 본 연구의 기여는 최소 기능 설명 길이(minimum functional description length)와 검증된 변경 비용에 초점을 맞춘 반증 가능한 프로그램입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기