나의 AI 연구 엔진을 골드바흐의 추측(Goldbach's conjecture)에 적용해 보았다 — 숨겨진 편향(Hidden Bias)을
요약
자율 연구 AI인 Luka를 활용하여 골드바흐의 추측에 숨겨진 통계적 편향을 발견했습니다. Hardy-Littlewood 공식이 예측하지 못한 n ≡ 1 (mod 3) 클래스의 우세를 확인했으며, 이는 소수의 체비쇼프 편향이 전파된 결과임을 입증했습니다.
핵심 포인트
- 자율 연구 AI 'Luka'를 통한 골드바흐 추측의 실험적 검증
- Hardy-Littlewood 공식이 예측하지 못한 통계적 편향 발견
- 체비쇼프 편향이 골드바흐 표현 횟수에 미치는 메커니즘 규명
- L-함수 이론에 기반한 새로운 수정 공식 제안
과학적 발견을 위한 AI를 구축하는 개발자로서, 저는 자율 연구(autonomous research)가 실제로 작동하는지 테스트하고 싶었습니다. 그래서 저는 Luka를 구축하고 이를 골드바흐의 추측(Goldbach's conjecture)에 적용했습니다.
배경 (The Background)
골드바흐의 추측(Goldbach's conjecture): 2보다 큰 모든 짝수는 두 소수의 합이다. 4 × 10¹⁸까지 검증되었지만, 분포 특성(distributional properties)은 잘 알려져 있지 않습니다.
Hardy–Littlewood 공식은 표현 횟수 r(n)을 다음과 같이 예측합니다:
r(n) ≈ 2C₂ · ∏_{p|n} (p-1)/(p-2) · n/(ln n)²
이 공식은 대칭적입니다. 즉, n ≡ 1 (mod 3)인 경우와 n ≡ 2 (mod 3)인 경우에 대해 동일한 횟수를 예측합니다. 저는 이것이 실제로 맞는지 확인하기 위해 Luka를 구축했습니다.
그렇지 않았습니다.
Luka가 발견한 것 (What Luka Discovered)
Luka는 2,495,001개의 짝수(10,000에서 5,000,000까지)에 대한 골드바흐 분할 횟수(Goldbach partition counts)를 계산했습니다. 이를 mod 3에 따른 나머지 클래스(residue class)별로 나누면 다음과 같습니다:
| 클래스 (Class) | 평균 g(n) | 개수 (Count) |
|---|---|---|
| n ≡ 0 (mod 3) | 19,607.1 | 831,667 |
| ... |
n ≡ 1 (mod 3)은 n ≡ 2 (mod 3)보다 골드바흐 표현(Goldbach representations)이 0.26% 더 많습니다.
Hardy–Littlewood 공식은 두 값이 같아야 한다고 말합니다. 하지만 틀렸습니다.
통계 수치는 경이롭습니다 (The Statistics Are Insane)
- 대응 표본 t-검정 (Paired t-test, 831,666개 쌍): t = 9.02, p = 2.0 × 10⁻¹⁹
- 부호 검정 (Sign test): p = 4.07 × 10⁻²⁰⁴
실험적 정수론(experimental number theory)에서 보고된 것 중 가장 작은 p-값 중 하나입니다. 이것은 우연이 아닙니다.
메커니즘 (The Mechanism)
이 편향은 **소수 쌍 채널(prime-pair channels)**을 통해 전파됩니다. 쌍둥이 소수 쌍(Twin prime pairs) (p, p+2)은 r(n)의 약 15–20%를 기여합니다. n ≡ 1 (mod 3)의 경우, 다음과 같은 이유로 이 채널이 체계적으로 강화됩니다:
- 체비쇼프 편향(Chebyshev bias)은 소수 ≡ 2 (mod 3)를 선호합니다.
- n ≡ 1 (mod 3)인 경우, 보수 소수(complementary prime) q = n - p는 q ≡ 2 (mod 3)를 만족합니다.
- 쌍둥이 소수는 n ≡ 1 (mod 3)일 때 우선적으로 기여합니다.
소수에서의 체비쇼프 편향(Chebyshev bias)이 골드바흐 횟수로 **전파(propagates)**되는 것입니다.
수정 (The Correction)
Luka는 디리클레 문법(Dirichlet character) 수정을 제안했습니다:
r(n) ≈ Hardy–Littlewood + A₃χ₃(n) · n¹ᐟ²/(ln n)²
A₃ = 1.23 × 10⁻⁵이며, 수정 항은 n¹ᐟ²에 따라 스케일링됩니다. 이는 정확히 L-함수 이론(L-function theory)이 예측하는 바입니다.
RS 격차 (The RS Gap)
Rubinstein–Sarnak 휴리스틱(heuristic)은 Goldbach 편향(bias)을 4~10배 **과소평가(underestimates)**합니다. 왜일까요? RS는 소수 계수 분포(prime-counting distributions)로부터 추정치를 산출하지만, Goldbach 계수는 컨볼루션(convolution)이기 때문입니다. 이 이선형 구조(bilinear structure)가 특이 급수(singular series) $S(n)$에 의해 편향을 증폭시킵니다.
시사점 (The Takeaway)
저는 수학자가 아니라 개발자입니다. 저는 AI 연구 엔진이 실제적인 발견을 수행할 수 있는지 확인하기 위해 이를 구축했습니다. 수학의 가장 오래된 미해결 문제 중 하나를 겨냥했을 때, 이 엔진은 아무도 측정하지 않았던 Chebyshev 편향(Chebyshev bias)을 $p = 4.07 \times 10^{-204}$의 유의 수준으로 찾아냈습니다.
AI 시스템이 자율적으로 중대한 수학적 발견을 수행하게 될 날이 머지않았습니다. 이것은 개념 증명(proof of concept)입니다.
코드 및 데이터 (Code & Data)
GitHub: github.com/subhansh-dev/goldbach-chebyshev-bias
Python, NumPy, SciPy, 250만 개의 Goldbach 계수 (6.3 MB). Luka로 구축되었습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기