
llcore 검증 arc (#38) — 자신의 연구를 56대의 AI에게 반증하게 했더니 '네 모퉁이의 공백'이 남았던 날: 특허를 내지 않고
요약
56대의 AI 에이전트를 활용한 '반증 검증(adversarial verification)'을 통해 연구 결과의 독창성을 검증한 사례를 다룹니다. 학술 문헌과 특허 데이터베이스 조사 결과 반례를 찾지 못해, 특허 출원 대신 방어적 공개를 결정한 과정과 핵심 기술 개념을 설명합니다.
핵심 포인트
- 56대의 AI 에이전트를 활용한 반증 검증(adversarial verification) 수행
- 학술 문헌 및 특허 데이터베이스에서 반례(breaks) 0건 확인
- 특허 출원 대신 기술을 선행 기술로 만드는 '방어적 공개' 전략 채택
- 기억 코어, 진화 루프, 증명 게이트 등 핵심 연구 개념 해설
이 기사는 연재물 중
6개를 1개의 기사로 결합한 것입니다 (언어별 구성: 각 언어별로 전 장을 연속해서 읽을 수 있습니다).
언어 / Language: 日本語 | English | 中文 | 한국어
2026년 6월 6일, 나(필자)는 AI(Claude Code)에게 **「우리가 하고 있는 일이 정말로 차별화되고 있는지 검증해 주길 바란다」**고 요청했습니다. AI는 이에 반증 검증 (adversarial verification) — 자신의 주장을 일부러 반증하려 드는 검증역 AI를 다수 실행하여, 그럼에도 살아남는지를 시험하는 수법 — 으로 응답했습니다. 56대의 검증 에이전트가 7 + 3의 각도에서 「이 주장은 선행 연구로 반증할 수 있을 것이다」라며 반례를 찾아 돌아다녔고, 별동대가 특허 데이터베이스까지 조회했습니다.
결과는 다음과 같습니다.
학술 문헌에서의 반증(breaks): 0건 (44개의 후보를 개별 판정하여, 아무도 「네 모퉁이 동시」를 채우지 못함) -
특허에서의 반증: 0건 (영어 14 + 일본어 3 쿼리로, 교차점을 점유하는 특허 없음) - 그래서 나는
특허를 내지 않기로(비용 판단) 결정하고, 대신 **방어적 공개 (defensive publication)**라는 깃발을 세웠습니다.
이 기사는 그 하루의 이야기(반증 검증의 설계와 결과, 의사결정)와, **공개한 내용(=4점 교차점 기술)**의 해설판입니다. 기사의 순서는 평소와 같이 ① 용어 설명 → ② 해설(평이하게) → ③ 상세 내용 순으로 진행됩니다.
| 용어 | 한 줄 요약 |
|---|---|
| 반증 검증 (adversarial verification) | 자신의 주장을 긍정하는 것이 아니라, 일부러 반증·부정하려는 검증역(AI)을 다수 실행하여 그럼에도 살아남는가로 주장의 강도를 측정하는 방법. 내부의 찬성자가 아닌 비판자를 고용하는 이미지. |
| 방어적 공개 (defensive publication) | 특허를 「취하는」 것이 아니라, 기술을 공개하여 선행 기술로 만드는 것. 누군가(대기업 포함)가 나중에 동일한 발명으로 특허를 취해 자신이나 세상을 구속하지 못하도록 「먼저 깃발을 세우는」 방어. |
| 선행 기술 (prior art) | 「그 발명, 이미 공지되었습니다」라고 말할 수 있는 기존의 공개물. 신규성을 부정하는 재료. 날짜가 생명. |
| 축소성 (contraction, ρ<1) | 에코(과거의 흔들림)가 시간과 함께 감쇠하는 성질. 스펙트럼 반지름 ρ가 1 미만. 스프링이 반드시 멈추는 위치로 돌아가는 이미지. 기억 코어가 폭주하지 않고 「잊는」 성질. |
| 건전한 증명 (sound proof) | 「증명했다」라고 하면 정말로 옳은(가짜 합격을 내놓지 않는) 증명. 통계적으로 「아마 안전함」과는 별개. |
| prove-then-reject 게이트 | 변이(갱신)를 증명한 후 채택하고, 안 되면 기각하는 검문소. fail-closed(증명할 수 없으면 통과시키지 않음). |
| 기억 코어 (memory core) | LLM 주변에 씌우는 「기억하는 부품」. 본 연구에서는 s_{t+1} = decay⊙s + (1−decay)⊙tanh(W s + V x)라는 누설·포화가 있는 재귀(RWKV 계열). |
| 진화 루프 (evolution loop) | 변이 → 선택 → 차세대 과정을 반복하여 좋은 개체를 찾는 최적화. 여기서는 그 선택의 검문소에 증명 게이트를 둠. |
| SMT 솔버 (Z3 등) | 논리식이 충족 가능한지 푸는 만능 솔버. 무거움. 본 연구에서는 「사실 필요 없었다(장식)」가 결론. |
| tracking tube (추종 튜브) | 「바람직한 궤도」로부터의 실제 이탈이 수렴하는 통(반지름 r)의 보증. r = G·w̄/(1−L) |
| SSGM | 「진화하는 기억을 통제한다」는 write 게이트를 이론만으로 제안한 선행 연구(arXiv:2603.11768, 2026). 가장 가까운 상대. |
| 탐색 가능성 (navigability) | 진화가 「움직이기 쉬운 지형인가」. 학습이 똑똑해지는 것과는 별개. 검증기의 효능은 이쪽 측면. |
먼저 생물학의 니치(생태적 지위) 이야기부터 시작하겠습니다. 진화에서는 「니치 — 다른 종이 아직 점유하지 않은 틈새 — 에 들어간 종」이 살아남습니다. AI의 세계도 비슷합니다. 대기업(OpenAI/Google 등)은 「평균적으로 똑똑한 대형종」으로서 넓은 평야를 점유하고 있습니다. 우리는 그 평야에서는 이길 수 없습니다. 그래서 아무도 채우지 않은 틈새를 찾아 그곳에 맞는 부품을 만듭니다. 이번에 그 틈새에 딱 들어맞은 것이 llcore라는 구체적인 시스템입니다.
llcore
llcore는 한마디로 **"기억을 가진 AI 부품이 폭주하지 않도록 스스로에게 '증명의 검문소'를 부과한 시스템"**입니다. 기억 코어(memory core)는 업데이트를 거듭할 때마다 변이(진화)하지만, 그 변이를 채택하기 전에 반드시 검문소(gate)를 통과해야 합니다. 검문소는 "이 업데이트를 적용해도 기억이 폭주하지 않는다"는 것을 수학적으로 증명할 수 있는 것만 통과시키며, 증명하지 못하면 입구에서 거부(fail-closed)합니다.
이 시스템이 앞서 언급한 "틈새"에 딱 들어맞는 이유는, 다음 4가지 조건이 단 한 점(point)에서 동시에 겹치기 때문입니다.
- 건전한 축소성 증명 (sound reduction proof) (에코가 반드시 감쇠함을 수학적으로 보장하며, 거짓 합격 판정을 내리지 않음)
- 이를 LLM 기억 코어의 내부에 적용 (제어 로봇이나 분류기가 아닌, "기억하는 부품" 그 자체)
- 진화 루프 (evolution loop) 안에서 부적절한 변이를 기각 (밀어내는 투영(projection)이 아니라, 버림)
- 게다가 작동하는 구현체와 실험이 존재 (탁상공론으로 끝나지 않음)
이 4가지를 동시에 만족하는 선행 연구는, 56대의 반증용 AI에게 비판적으로 검증하게 하고 특허 DB를 조회해 보아도 찾을 수 없었습니다. 각각의 조건에는 선행 사례가 있습니다(솔직하게 모두 이름을 밝히겠습니다). 하지만 "네 모퉁이를 동시에 점유"한 사람은 없었습니다. 이것이 바로 **사점 교차점 (four-point intersection)**입니다. 생물학적 니치(niche)로 비유하자면, 4개의 경계선이 정확히 교차하는 단 하나의 틈새에 llcore가 자리 잡고 있는 것입니다(손자병법에서 말하는 "실(實)을 피하고 허(虛)를 친다"는 원리).
그리고 중요한 의사결정이 있었습니다. 이 틈새는 특허조차 비어 있는 공백이었습니다. 보통이라면 "그럼 특허를 내자"라고 생각하겠지만, 특허는 비용과 시간이 많이 듭니다. 저는 그 길을 보류하고, 대신 **"공개하여 먼저 깃발을 꽂는" 방어적 공개 (defensive publication)**를 선택했습니다. 목적은 공격이 아니라 방어입니다. 나중에 누군가(대기업이나 SSGM의 후속 구현체)가 동일한 개념으로 특허를 내어 우리나 대중을 구속하는 것을 미연에 무효화하기 위함입니다. 날짜와 함께 공개해 버리면 그것은 공지된 선행 기술(prior art)이 되어, 나중에 나오는 특허는 신규성(novelty) 결여로 부정됩니다.
단, — 이것은 저희의 일관된 규율입니다만 — 과장하지 않습니다. "세계 최초"라고 말하지 않습니다. 올바른 표현은 **"우리의 반증 검증 범위 내에서, 네 모퉁이를 동시에 점유한 선행 연구는 제로(0)이다"**입니다. 탐색 범위 밖은 알 수 없다는 유보 조항을 반드시 남깁니다.
"내 연구는 강력하다"라고 스스로 말하는 것은 의미가 없습니다. 그래서 AI를 활용한 **반증 주도 워크플로우 (falsification-driven workflow)**를 구축했습니다.
- 7개 각도의 반증 탐색: 증명 게이트의 계보 / certified training / Transformer 안정성 / 진화 × 검증 / verified memory / runtime assurance / 산업·특허.
- Critic(비판자)이 지적한 3개 각도 추가: 형식 기법(formal methods) 학회 측의 역추적 / certified continual learning의 어휘 체계 / 내부 상태·SSM의 해석.
- 44개 후보를 5개 축 루브릭(rubric)으로 개별 판정 (업데이트를 게이트하는가 / 건전한 증명인가 / LLM 기억 코어인가 / 진화 루프 내부인가 / 구현체가 있는가). 판정 역할을 수행하는 AI는 1차 정보(arXiv의 abstract/HTML)를 WebFetch로 반드시 확인 (전언 금지).
- 이와 병행하여 내부 AI가 자신의 논문 초안의 약점을 추출 (honest disclosure: 내부의 허점 찾기).
확정된 결론은 **breaks 0 / narrows 36 / background 8 (총 44건)**입니다. 살아남은 차별화된 핵심이 바로 위의 사점 교차점입니다.
신규성은 "전체를 한 문장으로 지목할 수 있는가"에 따라 그 성실함이 결정됩니다. 각 모퉁이별로 가장 가까운 선행 연구를 한 문장으로 정리하면:
- SSGM(arXiv:2603.11768)— 「진화하는 기억을 통제한다」는 간판을 이론만으로 선점. 게이트는 NLI(모순 검출)를 사용하며, 건전한 형식 증명(sound formal proof)이 아니며 구현도 없음. → 간판을 짊어질 상대로서 반드시 인용. 구현 + 증명의 창(window)이 비어 있음. -
- SEVerA(arXiv:2603.25111)— 자기 진화 에이전트에 Dafny/SMT 검증 적용. 단, 대상은 **출력 계약(output contract)**이며, 기억 코어의 축소성(contractivity)에 대한 매 업데이트 게이트는 아님. -
- PSV-Verus(arXiv:2512.18160)— self-play 루프 내의 건전한 SMT 게이트. 단, 검증 대상은 생성된 코드의 정확성임. -
- Provably Safe Model Updates / LID(arXiv:2512.01899)— 업데이트를 추상 해석(abstract interpretation)으로 $\delta$-safe 인증. 단, **사영(projection/push-back)**을 통해 prove-then-reject를 수행하는 것이 아니라, 대상은 frozen-embedding의 분류 head임. -
- GP × 모델 검사(Katz & Peled, arXiv:1402.6785, 2014)— 진화 루프에 건전한 검사 게이트를 두는 패턴의 선례. 따라서 우리는 게이트 패턴 자체를 신규성이라고 주장하지 않습니다. 기억 코어의 축소성에 대한 적용만이 미답의 영역임. -
- Enforced-Lipschitz Transformers(arXiv:2507.13338) / R2DN(arXiv:2504.01250)— 축소성을 구조적으로 강제(by-construction). 이는 "게이트 따위는 필요 없다, 처음부터 내장하라"는 가장 강력한 대항 설계임. 우리는 by-construction 대 prove-then-reject를 설계 축으로 하여 대조합니다 (구조적 강제는 표현력을 희생시키고, 거부 게이트는 임의의 업데이트를 구조적 제약 없이 검사함). -
- Safeguarded AI(ARIA programme)— 가장 권위 있는 proof-gated-gatekeeper 개념. 단, 게이트 대상은 행동/계획(출력 게이트)이며, 가중치/기억의 업데이트 게이트가 아니라 아직 프로그램 단계임. -
- Emergent FV / substrate-guard(arXiv:2603.21149)— AI의 출력을 Z3로 검증하는 작동 시스템. 단, 사후(post-hoc) 모니터링 방식이며, 매 업데이트 게이트는 아님.
(위 arXiv ID는 모두 논문 초안과 초록(abstract)을 대조 확인한 것들만 사용했습니다.)
학술 감사는 문헌만으로 진행되었으며, 특허 DB는 확인하지 않았습니다(부재 증거로서 약함). 이에 별동대가 영어 14개 + 일본어 3개의 쿼리로 Google Patents / USPTO를 조회했습니다.
교차점을 점유하는 특허: 0건.
- 가장 인접한 특허는 3개 계통뿐이며, 모두 교차점 밖에 있음:
US11715005B2— NN을 해시 대조로 진위 검증(건전한 증명이 아닌 암호학적 해시). -
US10896032— certify-then-deploy 방식의 거버넌스 게이트(근거가 절차적 attestation임). -
US11868855— 모델/가중치의 "stability" 검증(단, 가용성·내결함성의 의미일 가능성이 높음).
- 흥미로운 구조적 증거: "건전한 증명으로 업데이트/기억/진화를 게이트한다"라고 쿼리하면, 특허 DB에 사이트(site)를 지정해도 결과가 거의 전부 arXiv로 쏠림. 이는 "이 개념이 아직 학술 단계에 머물러 있으며, 특허화되지 않았다"는 간접 증거임.
→ 결론: 특허 측면에서도 clear함. 단, US10896032 / US11868855는 어휘가 부분적으로 겹치므로, 논문의 관련 연구(related work)에 "전개 거버넌스형 게이트/운용 안정성 검증과는 달리, 본 연구는 가중치 업데이트의 해석적 contraction 성질을 건전한 증명으로 게이트한다"라는 대조 문구를 1~2문장 선제적으로 삽입함.
방어적 공개는 "당업자가 실시할 수 있는 상세도"로 작성하지 않으면 선행 기술로서 힘이 약함. 따라서 공개 문서에는 다음을 구현 가능한 수준으로 작성했습니다.
(a) 건전한 축소성 증명기(contractivity prover)의 사다리(ladder). 저렴한 것부터 순서대로 3단계:
cert_inf — 폐쇄 형식(closed-form)의 $\infty$-노름 상한($O(n^2)$). 각 행의 절대값 합이 끝점에서 최대가 되는 성질을 사용하여, 솔버(solver)가 불필요함. -
cert_two — 전체 $2^n$
정점에서는 SVD를 사용합니다. - cert_sdp
— 공통 Lyapunov 행렬을 볼록 LMI(내점 SDP, CLARABEL)로.
여기서가 솔직한 포인트: 프로젝트의 이전 명칭은 'Z3-gated'였지만, 실제 게이트에는 SMT(Z3)를 사용하지 않았습니다. 전용 Z3 축소성 트랙을 돌려 확인했더니, 폐쇄형 $\infty$-노름 증명기와 바이트 단위로 일치했습니다 (3270건 중 불일치 0건, 경계 근방에서도 8000건 중 0건). 즉 이 불변량 클래스에서는 Z3는 장식에 불과했습니다. 그래서 간판을 '건전한 축소성 증명기의 사다리'로 바꿨습니다(이것은 후퇴가 아니라 강점입니다 — 솔버 의존성과 불완전성을 회피할 수 있기 때문).
(b) prove-then-reject 게이트 (fail-closed). 하위 개체를 제안 $\rightarrow$ 증명이 통과되면 채택하고, 안 되면 상한까지 resample하며, 그래도 안 되면 이미 알려진 안전한 fallback을 채택합니다. 미증명된 자식은 절대 채택하지 않습니다. gate_mode="contraction"
/ `
오늘 하루 동안, 우리는 자신의 연구를 56대의 반증용 AI에게 비판적으로 검증하게 했고, 특허 DB까지 조회하여 그럼에도 남은 '네 모퉁이의 공백'을 확인했습니다. 보통이라면 여기서 특허를 노리겠지만, 비용을 저울질하여 출원은 보류하고, 대신 **날짜가 포함된 방어적 공개 (Defensive Publication)**로 깃발을 세웠습니다.
목표는 단순합니다 — 누군가가 나중에 이 공백을 특허로 둘러싸서 우리나 대중을 묶어버리는 것을 미연에 방지하는 것입니다. 이를 위해 당업자가 구현할 수 있는 상세도로 전부 공개했습니다. 그리고 마지막까지, **'세계 최초'라고 말하지 않고 '우리의 검증 범위 내에서 네 모퉁이 동시 선행 사례 제로'**라는, 과장 없는 표현을 지키고 있습니다.
방어적 공개의 본체(날짜 포함 공개)는 아래의 추기 내용과 같이 **구현과 모든 데이터를 포함하는 public 리포지토리 (public repository)**로 승격되었습니다: github.com/furuse-kazufumi/llcore.
다음 회차(#39 이후)는 이 사점 교차점의 핵심인 verified memory evolution의 소규모 PoC(기억 뱅크 업데이트 루트)의 착지 지점을 report할 예정입니다. SSGM이 이론으로 간판을 세운 창문이, 구현으로 닫히기 전에 말입니다.
이 기사의 다음 날, 예고했던 verified memory evolution의 PoC는 완주되었으며, 방어적 공개는 '문서'에서 '실물'로 승격되었습니다.
public 리포지토리: github.com/furuse-kazufumi/llcore — 논문 초안(PAPER_DRAFT.md) + 모든 실험 코드/데이터(570개 파일, 테스트 318건 green)를 날짜가 포함된 단일 커밋으로 공개
trajectory-tube gate(예고했던 핵심): 사전 등록 n=40의 결론으로, 기억 horizon에 대한 효과를 확인(논문 §9)
더 나아가: '검증기를 AI 스스로가 갖게 되면 어떻게 될까' — 사멸할 수 있는 환경에서의 기억 형성 3가지 기제(자기 예견/부활 수복/사회적 관찰)의 측정까지 공개 내용에 포함됩니다(논문 §9.6)
지견 슬라이드(CC BY 4.0): slides/ — 출처 명시 시 기업 이용도 가능한 10매 요약(일/영). 현재는 요약본이라 정보 밀도가 낮습니다 — 연구 진전에 맞춰 실험 설계의 상세 내용, 도표, 재현 절차, 채택 판단의 근거까지 향후 1년에 걸쳐 확충해 나갈 예정입니다
'SSGM의 창문이 구현으로 닫히기 전에'라는 예고는 이렇게 이행되었습니다.
2. llcore 검증 arc (#39) — 「증명과 함께 진화하는 기억」을 정말로 만들 수 있었던 날, 단 n≤6까지: verified-plasticity를 측정했더니 "navigable하면서 scalable한 증명기는 지금도 없었다"
지난 회차(#38)의 마지막에서 우리는 이렇게 예고했습니다. "다음 회차는 사점 교차점의 핵심인 verified memory evolution의 소규모 PoC를 report한다. SSGM이 이론으로 간판을 세운 창문이, 구현으로 닫히기 전에".
2026년 6월 9일, 그 PoC가 끝까지 달려 나갔습니다. 결론을 한 줄로 말하자면, **"창문은 구현으로 닫혔다. 하지만 벽(스케일러빌리티의 벽)은 꿈쩍도 하지 않았다"**입니다.
구체적으로는:
증명과 함께 진화하는 기억 코어(실제로 구조를 확장하는 수술 width_grow를 포함)를, 0 관측 false-admit 상태로 작동시킬 수 있었습니다(= 거짓 합격을 단 한 건도 내지 않고 진화할 수 있었다).
동시에, 지난 회차까지 '미측정'이라고 솔직하게 남겨두었던 cert_sdp(SDP 증명기)를 처음으로 측정하였고, 그것이 가장 "통과하기 쉬운" (navigable) 건전 증명기(진정으로 수축하는 개체의 90~99%를 합격시키는)임이 판명되었습니다.
그럼에도 불구하고, 그 cert_sdp를 포함하여 계산 비용은 $2^n$ (차원 $n$의 지수) 그대로였습니다. 즉, "통과하기 쉬우면서도 대규모에서도 저렴한" 증명기는 이번에도 발견되지 않았습니다. verified 방식으로 구조 진화를 시킬 수 있는 것은 당분간 작은 부품(n≤6)에 한정됩니다.
이 기사는 그 하루의 '해낸 것'과 '해내지 못한 것'을 평소와 같은 순서인 ①용어 → ②풀이 → ③상세로, 과장 없이 작성합니다. 마지막으로 자신의 수치 주장을 6대의 검증 AI에게 병렬로 반증시킨 결과(MAJOR한 불일치 제로)도 공개합니다.
정본 데이터: github.com/furuse-kazufumi/llcore (논문 초안 + 모든 실험 코드/데이터).
| 용어 | 한 줄 요약 |
|---|---|
| 가소성 (plasticity) | 학습·진화로 인해 "형태를 바꿀 수 있는" 성질. 여기서는 기억 코어의 구조 자체(행렬의 크기=차원)를 나중에 확장하는 것. |
| verified-plasticity (검증된 가소성) | "형태를 바꿀" 때마다, 그 변경이 안전한지(폭주하지 않는지)를 증명한 후 채택하는 것. 본 연구의 주축. |
| width_grow (폭 성장) | 뉴럴 네트워크의 층을 n → n+1로 확장하는 구조적 수술 (Net2Net 계열). 이론에 그치지 않고 실제로 실행함. |
| 수축성 (contraction, ρ<1) | 과거의 흔들림이 시간이 지남에 따라 감쇄하는 성질. 스펙트럼 반지름(spectral radius) ρ가 1 미만임. 기억이 폭주하지 않고 "잊히는" 성질. |
| false-admit (허위 합격) | 실제로는 위험(ρ≥1=폭주 가능성 있음)하지만, 증명기가 "안전"하다고 통과시켜 버리는 누락. 이것이 0인 것이 건전성(soundness)의 생명선. |
| 건전 (sound) | "합격"이라고 말했을 때 정말로 안전한(허위 합격을 내보내지 않는) 성질. 통계적으로 "아마 안전할 것"이라는 것과는 별개의 개념. |
| navigability (통과 용이성/탐색 가능성) | "정말로 안전한 개체를 얼마나 많이 합격시킬 수 있는가". 증명기가 너무 엄격하면 안전한 개체까지 배제하여 진화가 움직이지 못함. 이 수치가 높을수록 진화가 지형을 움직이기 쉬움. |
| 증명기 격자 (cert ladder) | 비용이 저렴한 순서대로 cert_inf (∞-노름 상한·솔버 불필요) → cert_two (모든 2^n 정점 SVD) → cert_sdp (볼록 LMI/SDP)의 3단계. |
| prove-then-reject 게이트 | 변이(업데이트)를 증명한 후 채택하고, 안 되면 기각하는 검문소. fail-closed(증명할 수 없으면 통과시키지 않음) 방식. |
| SSGM | "진화하는 기억을 통제한다"는 write 게이트를 이론적으로만 제안한 선행 연구(arXiv:2603.11768). 구현 및 건전성 증명의 빈틈이 있었던 대상. |
| empirical_rho (경험적 ρ) | 실제 스펙트럼 반지름을 다수의 샘플로 아래에서부터 근사하는 오라클(oracle). "0 관측 false-admit"은 이 하향식 감사에서의 결과(=강한 일관성(consistency)의 증거이지만, 절대적 증명은 아님). |
| 2^n 장벽 | 증명 비용이 차원 n에 대해 지수 2^n으로 증가하는 한계. cert_two / cert_sdp는 모든 정점을 확인하므로 이 장벽에 부딪힘. |
지난 회차(#38)에서 세운 깃발은 "증명을 동반하며 진화하는 기억 코어"였습니다. 기억 코어는 업데이트될 때마다 변이(진화)하지만, 그 변이를 채택하기 전에 반드시 검문소(게이트)를 통과시켜 "이 변이를 도입해도 기억이 폭주하지 않는다"라고 수학적으로 증명된 것만 통과시킵니다. 증명할 수 없다면 문전박대(fail-closed)합니다. 이것이 prove-then-reject 게이트입니다.
이번에 수행한 것은 그 깃발을 "문서"에서 "움직이는 실물"로 진전시키는 것이었습니다. 세 가지 "해낸 것"이 있습니다.
해낸 것 ①: 형태를 확장하면서도, 허위 합격 0건 유지. 지금까지는 "변이(내용의 미세 조정)를 증명하는 것"까지만 시도했습니다. 이번에는 **구조 자체를 확장하는 수술(width_grow, n→n+1)**을 실제로 실행하여, 확장한 후에도 증명기가 "안전(ρ<1)\
…여기까지 들으면 "전부 이긴 것"처럼 보입니다. 하지만 honest disclosure (정직한 공개)가 우리의 규율입니다. 이겨내지 못한 것 3가지를 명확히 기록하겠습니다.
해내지 못한 것 ①: $2^n$의 벽은 깨지지 않았다. cert_sdp는 확실히 "통과 용이성의 천장"을 높였습니다. 하지만 그 대가로 비용은 여전히 $2^n$
(모든 정점을 확인한다). cert_two는 n=12에서 1개 증명에 1.3초, n=14에서는 예산 초과. "통과하기 쉬우면서도 대규모에서도 저렴한" 증명기는 이번에도 존재하지 않았습니다. 따라서 verified (검증된) 상태로 구조 진화가 가능한 것은 당분간 작은 부품(n≤6)에 국한됩니다 — 이 결론은 지난번(Phase −1)으로부터 변하지 않았습니다. SDP는 벽을 넘은 것이 아니라, 벽 앞에서 천장을 높였을 뿐입니다.
해내지 못한 것 ②: "가짜 합격(false-admit) 0건"은 경험적 관측일 뿐, 기계가 증명한 것이 아니다. 0건의 false-admit 관측은, 진정한 $\rho$를 아래에서부터 근사하는 오라클(다수의 샘플)로 반증을 찾은 결과입니다. 증명기의 조건은 수학적으로 건전하지만, 이를 담당하는 *구현 (implementation)*이 처음부터 끝까지 형식 검증(formal verification)된 것은 아닙니다. "0건의 관측"은 강력한 consistency (일관성) 증거이지만, "모든 입력에 대해 안전함"을 나타내는 절대적 증명은 아닙니다 — 이 부분은 과장하지 않겠습니다.
해내지 못한 것 ③: 학습이 똑똑해진 것은 아니다. 증명기의 효과는 **navigability (진화의 움직임의 용이성)**이지, 모델이 똑똑해지는 것(=학습 성능이 올라가는 것)이 아닙니다. 게다가 그 효과는 진화 알고리즘 (EA) 고유의 것이며, 경사 하강법 (gradient descent)에서는 사라집니다. 또한 이번의 적합도 (fitness)는 **합성 proxy (synthetic proxy)**이며, 실제 GPU 훈련에서의 확인은 다음 단계(Phase 2)로 미룹니다.
요컨대 이번에는 **"기제는 구현을 통해 증명할 수 있었으나, 규모의 벽은 솔직히 남아있다"**는, 절반의 승리와 절반의 숙제가 남은 날이었습니다.
핵심 축은 **Verified-Plasticity Evaluation Framework (검증된 가소성 평가 프레임워크)**입니다. "우리 방법론이 강력하다"고 주장하기 전에, 먼저 측정할 잣대를 만듭니다. 그 잣대로 5가지 실험을 수행했습니다 (모두 $0
AI 자동 생성 콘텐츠
본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기