Cognizant AI Labs 부사장 Risto Miikkulainen이 말하는 신경 진화 (Neuroevolution) 및 진화 AI

이번 Eye on AI 팟캐스트에서 진행자 Craig Smith는 텍사스 대학교 오스틴 캠퍼스 교수이자 Cognizant AI Labs 부사장인 Risto Miikkulainen을 인터뷰했습니다. 인터뷰는 신경 진화 (Neuroevolution) 및 진화 AI (Evolutionary AI)를 중심으로 진행되었으며, 그 핵심 원리, 장점, 응용 시나리오, 그리고 왜 이것이 AI 미래의 중요한 방향인지에 대해 심도 있게 다루었습니다.

다음은 인터뷰 내용의 상세 요약입니다:

1. 진화 AI 및 신경 진화란 무엇인가?

전통적 AI (경사 하강법)와의 차이점 oxed{03:55}:
- 전통적 AI: 현재 주류인 대규모 모델(Large Models) 및 딥러닝 (Deep Learning)과 같이, 일반적으로 **경사 하강법 (Gradient Descent)**에 기반합니다. 이는 단일 에이전트 (Agent)에 의존하여, 그래디언트 (Gradient)를 계산함으로써 알려진 목표를 향해 단계적으로, 그리고 매끄럽게 최적화해 나갑니다. 강화 학습 (Reinforcement Learning)에서도 탐색 (Exploration)은 그래디언트의 방향을 찾기 위한 것입니다.
- 진화 AI: 집단 기반 (Population-based) 방식의 방법론입니다 oxed{04:27}. 단 하나의 에이전트가 아니라, 30개, 100개, 심지어 수천 개의 에이전트를 동시에 파견하여 솔루션 공간에 가능한 한 넓게 퍼뜨립니다.
변이 및 재조합 (Recombination) oxed{04:54}: 진화 AI는 단순히 미세한 그래디언트 조정을 수행하는 것에 그치지 않고, 서로 다른 공간에서 서로 다른 능력을 갖춘 두 우수한 에이전트를 '재조합/교차'시킵니다. 이를 통해 솔루션 공간에서 **도약적인 '큰 점프'**를 실현합니다. 이러한 메커니즘은 탐색 범위를 더 넓게 만들며 매우 강력한 탐색성 (Exploration)을 갖게 합니다.
핵심 특성: 창의성과 놀라움 oxed{02:32}: Risto는 진화 AI의 가장 매력적인 점이 '놀라움'을 줄 수 있다는 것이라고 지적했습니다. 인간이 전혀 입력하지 않은, 예상치 못한 똑똑한 솔루션을 발견할 수 있습니다. 진화 계산 (Evolutionary Computation) 컨퍼런스에서는 진화 AI가 인간 설계자를 능가하는 성과를 거두는 모습을 자주 볼 수 있습니다 oxed{05:41}.

2. 진화 알고리즘의 분류와 규모화 (Scale) 돌파

인터뷰에서는 진화 계산의 몇 가지 서로 다른 학파와 아키텍처가 언급되었습니다:

NEAT 알고리즘 [01:15]：Risto가 초기에 학생 Ken Stanley와 함께 개발한 고전적인 알고리즘입니다. 매우 견고(Robust)하고 실행하기 쉽다는 특징이 있으며, 가중치(Weight)를 최적화할 뿐만 아니라 신경망의 토폴로지/아키텍처(Topology/Architecture)를 자동으로 진화시킵니다 [07:21]. 하지만 일반적으로 수천 개에서 수만 개의 파라미터를 가진 상대적으로 작은 네트워크에 적합합니다.
신경 구조 탐색 (Neural Architecture Search, NAS) [07:43]：진화와 딥러닝(Deep Learning)을 결합한 방식입니다. 진화 알고리즘을 사용하여 최상위 아키텍처(예: Transformer, 합성곱 신경망(CNN)의 레이어 수, 활성화 함수, 손실 함수 등)를 찾고, 하위 가중치는 여전히 경사 하강법(Gradient Descent)을 통해 훈련합니다.
수십억 파라미터의 돌파구: 진화 전략 (Evolution Strategy, ES) [10:21]:
- 전통적으로 사람들은 무작위 변이(Random Mutation)가 우연히 맞아떨어지기 너무 어렵기 때문에, 진화 알고리즘이 오늘날 대규모 모델의 수억 개에 달하는 파라미터를 처리할 수 없다고 생각했습니다.
- 하지만 Cognizant AI Labs, 옥스퍼드 대학교, NVIDIA 등의 기관이 최근 돌파구를 마련했습니다. **진화 전략 (ES)**을 활용하여 (행동 공간(Action Space)이 아닌) **파라미터 공간(Parameter Space)**에서 직접 최적화를 수행합니다 [10:36].
- 작동 원리 [11:52]：이는 "재조합/교차(Recombination/Crossover)"를 수행하는 대신, 현재의 최적해를 중심으로 국소적인 에이전트 "클라우드/군집(Cloud/Swarm)"을 구축하여 그 성능을 평가한 뒤, 가장 성능이 좋은 방향(또는 평균적으로 좋은 방향)으로 전체를 이동시킵니다. Risto의 팀은 이 방법을 사용하여 오픈 소스 대규모 모델(예: Qwen, Llama)을 미세 조정 (Fine-tuning) 하는 데 성공했으며 [12:42], 현재는 진화를 통해 완전히 "처음부터(from scratch)" 사전 학습(Pre-training)을 수행하는 방안을 탐색하고 있습니다 [13:24].

3. 왜 주식 거래에서 뛰어난 성능을 보이는가? (AlphaArena 사례)

다양성과 독특함 [20:43]：진행자는 금융 거래 경진대회인 AlphaArena에서 (신경 진화 기술을 사용한 것으로 추정되는) 정체불명의 모델이 모든 참가자를 물리쳤다고 언급했습니다. Risto는 주식 시장에서 만약 모두가 동일한 데이터를 사용하고 동일한 경사 최적화(Gradient Optimization)를 수행한다면, 학습된 전략이 모두 같아져 돈을 벌기가 매우 어렵다고 설명했습니다.
"디딤돌" 찾기 [21:54]：진화 알고리즘은 "신규성 탐색 (Novelty Search)"과 "품질 다양성 (Quality Diversity)" 메커니즘을 통해 "남들과 다른" 방안에 의도적으로 보상을 줍니다. 이를 통해 인간이 예측할 수 없는 독특한 거래 전략을 발견할 수 있습니다.

4. 신경 진화의 미래: 신경과학과의 결합을 통한 산업 난제 극복

Risto는 현재의 LLM 아키텍처가 몇 가지 근본적인 문제에서 병목 현상에 직면해 있으며, 이를 해결하기 위해서는 진화 AI를 활용하고 신경과학(Neuroscience)을 참고할 필요가 있다고 생각합니다:

지속 학습 (Continual Learning) 및 메타인지 (Metacognition) [25:22]: 현재의 AI는 "파괴적 망각 (Catastrophic Forgetting)"을 일으키기 쉬우며, "자신이 무엇을 모르는지 모르는" (횡설수설하는) 문제가 있습니다.
"해마"에서 시작하는 실험 설계 [29:51]: Risto는 AI에게 처음부터 인간의 가장 고차원적인 "언어" 기능을 맡기기보다는, 신경과학 연구가 가장 철저히 이루어진 해마 (Hippocampus) 및 **기억/공간 탐색 시스템 (Memory/Spatial Navigation System)**부터 시작할 것을 제안합니다.
- 단순한 동물의 탐색 및 물체 기억 환경을 설계하고, 진화 알고리즘 (Evolutionary Algorithm)을 사용하여 "기억이 해마에서 대뇌 피질로 전이되는" [30:28] 현상을 구현하며, 지속 학습과 자기 성찰 능력을 갖춘 복잡한 신경 회로 (Neural Circuit)를 찾아내야 합니다.
언어의 진화 [32:44]: 더 먼 미래에는 연산 능력 (Computing Power)의 향상에 따라, 복잡한 가상 세계에 대량의 에이전트 (Agent)를 투입하여 이들이 진화를 통해 의사소통, 문법, 언어를 자발적으로 생성하게 할 수 있습니다.

5. 현실 세계의 의사결정 적용: 팬데믹에서 비즈니스까지

진화 AI는 가중치(Weight)와 구조(Architecture)뿐만 아니라, 코드 (유전 프로그래밍, Genetic Programming) 및 비즈니스 의사결정 전략도 진화시킬 수 있습니다 [20:16].

코로나19 의사결정 시스템 [51:04]: Risto의 팀은 "비약물적 개입" (예: 학교 폐쇄 여부, 마스크 착용, 접촉자 추적 등)을 위한 의사결정 시스템을 개발한 적이 있습니다. 이들은 전 세계 다양한 정부의 다각화된 데이터를 활용하여 학습했습니다.
성공 사례: 이 시스템은 아이슬란드에서 적용되었습니다. 학술적 연락책을 통해 모델의 예측과 시나리오 시뮬레이션을 아이슬란드 보건부와 총리에게 제출하였고, 실제로 채택되었습니다 [52:32].
CEO 의사결정 코파일럿 (Copilot) [54:59]:
Cognizant AI Labs는 현재 멀티 에이전트 시스템 (Multi-Agent Systems) [43:57]을 강력하게 추진하고 있습니다.
이들은 기업용 의사결정 프로토타입을 구축하고 있습니다. AI가 마케팅 예산 배분, 물류 계획, 또는 임상 시험 설계와 같은 제안을 할 때, 해당 결정이 가져올 결과(예: 경제적 비용 및 수익)를 즉각적으로 예측할 수 있습니다.
의사결정자(예: CEO)는 AI의 결정을 수동으로 수정할 수 있으며, 그 변화를 실시간으로 확인하여 직관적인 비교를 통해 AI의 최적안에 대한 신뢰를 구축할 수 있습니다 [56:19].

6. 산업 관찰 및 신간 소개

학계와 산업계의 협력 [46:17]: Risto는 현재의 AI 발전이 산업계와 학계의 개방적인 융합 덕분에 가능했다고 생각합니다. 산업계는 강력한 자금과 컴퓨팅 자원 (Computing Resources)을 보유하여 시스템을 실제로 구현해낼 수 있으며, 학계 (Academia)는 비록 엔지니어가 부족할지라도 현재 기술로는 불가능하지만 미래를 향한 최첨단 아키텍처 (Frontier Architectures)를 더욱 자유롭고 창의적으로 탐구할 수 있습니다 [47:08].
신간 및 커뮤니티 구축 [37:31]: Risto는 Sakana AI 등 여러 기관의 업계 동료들과 함께 신경 진화 (Neuroevolution)에 관한 권위 있는 교과서를 공동 집필했습니다 (강화학습 (RL) 분야의 Sutton & Barto 고전 교재와 유사한 성격). 이 책은 역사적 개요와 최첨단 발전 사항(예: 신경 진화와 LLM, 생성형 AI (Generative AI), 생물학의 결합)을 다루는 것 외에도, 해당 분야의 공통 기반을 구축하고 더 많은 인재를 유치하기 위해 GitHub 커뮤니티, 디지털 리소스 및 코드 데모 (Code Demo)를 동시에 출시했습니다.