LLM 위키(Wikis)가 과소평가되고 있습니다

요약

LLM과 코딩 에이전트를 활용하여 지식 베이스인 'LLM 위키'를 구축하고 자동 유지 관리하는 방법론을 소개합니다. 에이전트가 논문을 수집, 인덱싱, 업데이트하는 루프를 통해 연구 워크플로우를 혁신할 수 있음을 강조합니다.

핵심 포인트

LLM 위키는 에이전트가 접근하기 쉬운 구조로 지식 스택을 확장함
자동화와 Human-in-the-loop를 결합해 고품질 지식 큐레이션 가능
시맨틱 검색과 메타데이터를 통해 연구 노이즈를 효과적으로 제거
프론티어 모델과 오픈 웨이트 모델을 혼합하여 효율적 운영 가능

LLM 위키(Wikis)가 과소평가되고 있습니다.

저는 LLM(Large Language Models)이나 코딩 에이전트(coding agents)를 사용하여 지식 베이스(knowledge bases)를 구축하는 것이 오늘날 AI의 가장 가치 있는 응용 분야 중 하나라고 주장합니다.

이는 당신의 인텔리전스 스택(intelligence stack)을 구축하고 확장하는 데 있어 의도적인 접근을 하는 것에 관한 것입니다.

이를 보여드리기 위해, 지난 몇 달 동안 제가 구축한 LLM 위키를 공유하고자 합니다.

이것의 이름은 PaperWiki이며, 저는 제 연구 에이전트(research agents)와 함께 모든 연구 워크플로우(workflows) 전반에 걸쳐 이를 사용합니다.

PaperWiki는 자동화(automations)를 통해 정기적으로 업데이트되므로, 기본적으로 에이전트들이 루프(loop) 상에서 이를 유지 관리하고 있습니다. 모든 항목은 다양한 소스로부터 수집되어 볼트(vault, Obsidian)에 저장되며, qmd를 사용하여 추가로 인덱싱(indexed)됩니다. 그런 다음 HTML 아티팩트(artifact)를 통해 제시됩니다. 따라서 이 모든 것은 제 모든 에이전트가 쉽게 접근할 수 있으며, 전체 텍스트 검색(full-text search) 및 풍부한 시맨틱 검색(semantic search)을 통해 쉽게 검색할 수 있습니다. 위키의 구조는 제 연구 에이전트와 함께 흥미롭고 짜릿한 최첨단 연구 프로젝트를 시작하는 데(작고 더 효율적인 gpt/diffusion llms 구축부터 SoTA 하네스(harnesses) 및 메모리 시스템 구축까지) 매우 유용하다는 것이 증명되었습니다. 에이전트들은 마크다운(markdown) 파일을 좋아하며, 위키의 풍부한 메타데이터(metadata) 구조 덕분에 논문들을 더 쉽게 탐색할 수 있다는 것이 밝혀졌습니다.

저는 이제 막 시작했을 뿐이지만, 우리 모두가 LLM 위키를 실험해 보아야 한다는 점은 분명합니다.

그 이유는 다음과 같습니다:

LLM 지식 베이스를 구축하는 것은 AI 출력물을 온갖 창의적인 방식으로 활용하는 습관을 길러줍니다. 이것은 우리 모두가 추진해야 할 긍정적인 의미의 토큰맥싱(tokenmaxxing)입니다.

LLM 위키는 루프(loop) 내에서 자동으로 유지 관리될 수 있습니다. 저는 제가 큐레이션(curate)한 논문들을 바탕으로 매일 위키를 업데이트하는 자동화를 사용합니다. 큐레이션 또한 제가 루프 내에서 실행하는 또 다른 자동화(인간이 개입하는 human-in-the-loop 방식 포함)이므로, 저는 이전의 모든 지식과 전문성을 바탕으로 구축할 수 있으며, 통합/계층이 깊어질수록 이 모든 것이 복리로 쌓이게 됩니다.

이 과정의 한 가지 흥미로운 결과는 제가 고품질의 논문을 더 잘 식별하고 노이즈 (noise)를 더 쉽게 제거할 수 있다고 느낀다는 점입니다. 소셜 미디어는 결코 이를 해결할 수 없습니다. 그리고 대부분의 논문 애그리게이터 (aggregators)들은 제가 전혀 신뢰하지 않는 지표들을 사용합니다. 저는 에이전트 (agents)가 노이즈 대 신호 (noise vs. signal) 문제를 해결하는 데 도움을 줄 수 있다는 점이 마음에 듭니다. 이는 연구에 있어 매우 중요합니다. 많은 사람들이 에이전트가 주로 슬롭 (slop, 저품질 콘텐츠)을 생성한다고 생각합니다. 하지만 반드시 그럴 필요는 없습니다. 세심한 큐레이션 (curations), 프롬프트 (prompts), 자동화 (automations), 검증기 (verifiers), 그리고 인간 참여형 (human-in-the-loop) 방식이 결합되면 놀라운 결과를 만들어낼 수 있습니다.

그리고 이를 위해 반드시 프론티어 모델 (frontier models)이 필요한 것도 아닙니다. 저는 이를 유지하기 위해 프론티어 모델 (opus-4.8)과 오픈 웨이트 모델 (open-weight models, deepseek-v4-flash)을 조합하여 사용합니다. 흥미로운 향후 연구 과제(저희는 @dair_ai에서 이 작업을 진행 중입니다)는 이 위에 특화된 모델들을 튜닝하여, LLM이 최첨단 연구 아이디어를 빠르게 이해하고 과학 연구 에이전트 (scientific research agents)를 더욱 가속화할 수 있는 연구 전략을 더 잘 개념화할 수 있도록 하는 것입니다.

저는 결과물 (artifact)을 포함하여 이 작업의 많은 부분을 오픈 소스로 공개할 계획이지만, 현재는 진행 중인 작업이며, 작업을 계속하면서 몇 가지 생각을 공유하게 되어 기쁩니다. 진행하면서 더 많은 내용을 공유하겠습니다. 계속 지켜봐 주세요!

AI 자동 생성 콘텐츠

원문 바로가기

Insights

LLM 위키(Wikis)가 과소평가되고 있습니다

요약

핵심 포인트

댓글

Claude Code의 스테가노그래피(Steganography)가 중국 사용자들을 식별하여 Anthropic이 기능을 롤백함

실시간 음성 에이전트 구축하기: 800ms 미만의 지연 시간 예산과 끼어들기 (Barge-In)

Long-Context vs RAG: 1M 토큰이 검색 파이프라인을 대체할 때

Claude Code의 스테가노그래피(Steganography)가 중국 사용자들을 식별하여 Anthropic이 기능을 롤백함

실시간 음성 에이전트 구축하기: 800ms 미만의 지연 시간 예산과 끼어들기 (Barge-In)

Long-Context vs RAG: 1M 토큰이 검색 파이프라인을 대체할 때