나의 AI 연구 엔진을 골드바흐의 추측(Goldbach's conjecture)에 적용해 보았다 — 숨겨진 편향(Hidden Bias)을 - Insights | Molayo

과학적 발견을 위한 AI를 구축하는 개발자로서, 저는 자율 연구(autonomous research)가 실제로 작동하는지 테스트하고 싶었습니다. 그래서 저는 Luka를 구축하고 이를 골드바흐의 추측(Goldbach's conjecture)에 적용했습니다.

배경 (The Background)

골드바흐의 추측(Goldbach's conjecture): 2보다 큰 모든 짝수는 두 소수의 합이다. 4 × 10¹⁸까지 검증되었지만, 분포 특성(distributional properties)은 잘 알려져 있지 않습니다.

Hardy–Littlewood 공식은 표현 횟수 r(n)을 다음과 같이 예측합니다:

r(n) ≈ 2C₂ · ∏_{p|n} (p-1)/(p-2) · n/(ln n)²

이 공식은 대칭적입니다. 즉, n ≡ 1 (mod 3)인 경우와 n ≡ 2 (mod 3)인 경우에 대해 동일한 횟수를 예측합니다. 저는 이것이 실제로 맞는지 확인하기 위해 Luka를 구축했습니다.

그렇지 않았습니다.

Luka가 발견한 것 (What Luka Discovered)

Luka는 2,495,001개의 짝수(10,000에서 5,000,000까지)에 대한 골드바흐 분할 횟수(Goldbach partition counts)를 계산했습니다. 이를 mod 3에 따른 나머지 클래스(residue class)별로 나누면 다음과 같습니다:

클래스 (Class)	평균 g(n)	개수 (Count)
n ≡ 0 (mod 3)	19,607.1	831,667
...

n ≡ 1 (mod 3)은 n ≡ 2 (mod 3)보다 골드바흐 표현(Goldbach representations)이 0.26% 더 많습니다.

Hardy–Littlewood 공식은 두 값이 같아야 한다고 말합니다. 하지만 틀렸습니다.

통계 수치는 경이롭습니다 (The Statistics Are Insane)

대응 표본 t-검정 (Paired t-test, 831,666개 쌍): t = 9.02, p = 2.0 × 10⁻¹⁹
부호 검정 (Sign test): p = 4.07 × 10⁻²⁰⁴

실험적 정수론(experimental number theory)에서 보고된 것 중 가장 작은 p-값 중 하나입니다. 이것은 우연이 아닙니다.

메커니즘 (The Mechanism)

이 편향은 **소수 쌍 채널(prime-pair channels)**을 통해 전파됩니다. 쌍둥이 소수 쌍(Twin prime pairs) (p, p+2)은 r(n)의 약 15–20%를 기여합니다. n ≡ 1 (mod 3)의 경우, 다음과 같은 이유로 이 채널이 체계적으로 강화됩니다:

체비쇼프 편향(Chebyshev bias)은 소수 ≡ 2 (mod 3)를 선호합니다.
n ≡ 1 (mod 3)인 경우, 보수 소수(complementary prime) q = n - p는 q ≡ 2 (mod 3)를 만족합니다.
쌍둥이 소수는 n ≡ 1 (mod 3)일 때 우선적으로 기여합니다.

소수에서의 체비쇼프 편향(Chebyshev bias)이 골드바흐 횟수로 **전파(propagates)**되는 것입니다.

수정 (The Correction)

Luka는 디리클레 문법(Dirichlet character) 수정을 제안했습니다:

r(n) ≈ Hardy–Littlewood + A₃χ₃(n) · n¹ᐟ²/(ln n)²

A₃ = 1.23 × 10⁻⁵이며, 수정 항은 n¹ᐟ²에 따라 스케일링됩니다. 이는 정확히 L-함수 이론(L-function theory)이 예측하는 바입니다.

RS 격차 (The RS Gap)

Rubinstein–Sarnak 휴리스틱(heuristic)은 Goldbach 편향(bias)을 4~10배 **과소평가(underestimates)**합니다. 왜일까요? RS는 소수 계수 분포(prime-counting distributions)로부터 추정치를 산출하지만, Goldbach 계수는 컨볼루션(convolution)이기 때문입니다. 이 이선형 구조(bilinear structure)가 특이 급수(singular series) $S(n)$에 의해 편향을 증폭시킵니다.

시사점 (The Takeaway)

저는 수학자가 아니라 개발자입니다. 저는 AI 연구 엔진이 실제적인 발견을 수행할 수 있는지 확인하기 위해 이를 구축했습니다. 수학의 가장 오래된 미해결 문제 중 하나를 겨냥했을 때, 이 엔진은 아무도 측정하지 않았던 Chebyshev 편향(Chebyshev bias)을 $p = 4.07 \times 10^{-204}$의 유의 수준으로 찾아냈습니다.

AI 시스템이 자율적으로 중대한 수학적 발견을 수행하게 될 날이 머지않았습니다. 이것은 개념 증명(proof of concept)입니다.

코드 및 데이터 (Code & Data)

GitHub: github.com/subhansh-dev/goldbach-chebyshev-bias

Python, NumPy, SciPy, 250만 개의 Goldbach 계수 (6.3 MB). Luka로 구축되었습니다.

Insights

나의 AI 연구 엔진을 골드바흐의 추측(Goldbach's conjecture)에 적용해 보았다 — 숨겨진 편향(Hidden Bias)을

요약

핵심 포인트