Claude에게 ADHD를 주었더니... 이제 사고 능력이 2배 더 좋아졌습니다
요약
기존 LLM의 선형적인 사고 방식(CoT)을 넘어, ADHD의 발산적 사고 패턴을 모방한 새로운 에이전트 프레임워크를 제안합니다. Tree-of-thoughts(ToT)와 비판 계층을 결합하여 브레인스토밍과 계획 수립 능력을 극대화했습니다.
핵심 포인트
- 기존 CoT의 선형적 한계를 극복하기 위한 발산적 사고 도입
- ADHD의 사고 패턴을 모방한 병렬 발산적 아이디어 구상 방식
- 비판 계층(Critic layer)을 통한 사고 결과의 평가 및 점수화
- 비용과 시간은 증가하나 창의적 계획 수립에 탁월한 성능
안녕하세요 여러분,
저는 헬스케어 및 생명 과학 분야의 AI 안전성 (AI safety) 연구를 수행하고 있습니다. Claude Code를 사용하여 몇 가지 사항을 추론하던 중, 한 가지 패턴을 발견했습니다. Claude나 다른 어떤 AI 에이전트(AI agent)라도 매우 선형적(linear)이라는 점입니다.
여기에는 강력한 이유가 있습니다. 2024년의 거의 모든 대규모 언어 모델(LLM)의 사고 패턴은 AI가 일방적으로 깊게 파고들도록 프로그래밍된 사고의 사슬 (Chain-of-thoughts, CoT)을 따르기 때문입니다.
하지만 연구자나 창의성이 집중적으로 요구되는 작업은 일방향적(unilateral)인 방식이 아니라 발산적(divergent)인 방식이 필요합니다.
이것이 제 논문의 핵심 기반인 ADHD - 코딩 에이전트를 위한 병렬 발산적 아이디어 구상 (Parallel Divergent Ideation for Coding Agents)입니다.
제 논지는 기본값인 사고의 사슬 (Chain-of-thoughts)을 무시하고 사고의 나무 (Tree-of-thoughts, ToT)를 고려한다면, 우리 모델에 발산적 사고 (divergent thinking)를 배치할 수 있다는 것입니다. 이를 통해 서로 다른 사고 지점들로부터 점들을 연결하는 데 꼭 필요한 범위를 확보할 수 있습니다.
이는 ADHD를 가진 사람의 정신이 작동하는 방식에서 많은 영감을 받았습니다. 많은 방향으로 생각하고, 그중 몇 가지에 대해서는 깊게 파고드는 방식입니다. 그리고 여기에 이 모든 사고를 판단하고 점수를 매기는 비판 계층 (critic layer)을 추가합니다.
한계점: 비용은 약 5배, 출력 시간은 약 10배 증가하지만, 즉각적인 새로운 사고를 가능하게 합니다. 브레인스토밍과 계획 수립에는 좋지만, 코딩용으로는 적합하지 않습니다.
논문 주소: https://adhdstack.github.io
저장소 (코드, 평가, 결과 증거 등): https://github.com/UditAkhourii/adhd
여기에는 모든 발견 내용과 증거, 모든 코드 평가, 그리고 로컬에서 실행하는 방법에 대한 지침이 포함되어 있습니다. 모든 것이 여기에 있으니 바로 사용하실 수 있습니다.
여러분의 피드백을 주세요. 여러분이 어떻게 느끼시는지, 그리고 개선할 여지가 무엇인지 배우고 싶습니다.
또한, 이것은 완전히 오픈 소스 (opensource)이므로 바로 클론(clone)하거나 기여(contribute)하실 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기