DAAF-Contribution-Community/daaf

LLM (Large Language Model) 기반 AI 어시스턴트들은 점점 더 유능해지고 있지만, 환각 (hallucination), 아첨 (sycophancy), 과잉 확신 (over-confidence), 그리고 게으름 (laziness)의 위험에 항상 노출되어 있습니다. 그렇다면 이렇게 결함이 있고 비결정론적인 (non-deterministic) 도구들이 엄격한 데이터 분석을 수행하는 데 정말 유용할 수 있을까요?

네 -- 하지만 적절한 가이드라인과 가드레일 (guardrails)이 갖춰져야 하며, 모든 핵심 결정을 내리고 모든 주요 출력을 검증할 수 있는 전문가의 손에 맡겨졌을 때만 가능합니다.

**DAAF, 데이터 분석가 증강 프레임워크 (Data Analyst Augmentation Framework)**를 소개합니다. DAAF는 Claude Code를 위한 무료 오픈 소스 지침 프레임워크로, 숙련된 연구자들이 AI의 도움을 받아 투명성, 엄격함, 또는 재현성 (reproducibility)을 희생하지 않으면서도 자신의 전문성을 빠르게 확장하고 모든 도메인에서 데이터 분석을 가속화할 수 있도록 돕습니다. DAAF는 사용자와 Claude Code 사이에서 다음과 같은 역할을 수행함으로써 Claude가 책임감 있고 엄격한 연구자처럼 생각할 수 있도록 자동적이고 일관되게 지원합니다:

모든 작업에 대해 엄격한 감사 가능성 (auditability) 및 재현성 (reproducibility) 표준을 강제하여, Claude가 사용자를 대신해 수행하는 모든 것을 검증할 수 있도록 합니다. 또한, 엄격한 보호 조치와 로그 추적 (logging traces)을 통해 Claude를 샌드박스 (sandboxing) 처리함으로써 잠재적으로 위험한 의도치 않은 파일 접근 및 편집을 방지합니다.
사용자가 분석 코드를 보기 전에 Claude가 모든 분석 코드를 주석 달고, 검증하고, 검토하도록 강제함으로써 모든 데이터 분석에서 높은 수준의 주의, 엄격함, 철저함을 설정합니다.
인과 추론 (causal inference) 및 지리 공간 분석 (geospatial analysis)과 같은 다양한 연구 방법론에 대한 베스트 프랙티스 (best practices)를 내장하여, 실제 연구 및 리소스로 Claude의 기본 능력을 확장하는 풍부한 기술 (Skills)을 제공합니다.
모든 핵심 결정에 대해 인간 전문가인 사용자와 직접 협업함으로써, 사용자가 확실하게 주도권을 유지할 수 있도록 합니다.

이것을 인간 연구자를 위한 **전투력 증강 외골격 (force-multiplying exoskeleton)**이라고 생각하십시오. 즉, 여러분이 어렵게 쌓아온 전문 지식을 대체하는 것이 아니라, 명시적으로 **증강 (augment)**하기 위해 설계된 도구입니다. 목표는 연구자들이 Claude Code를 효과적이면서도 동시에 책임감 있게 사용할 수 있도록 만드는 것입니다. 중요한 점은, DAAF가 완벽하지 않으며 앞으로도 결코 완벽해지지 않을 것이라는 사실입니다. 하지만 DAAF는 이미 엄청나게 유용하며, 더 넓은 연구 커뮤니티의 도움과 지원을 통해 앞으로 DAAF와 같은 도구는 지금보다 훨씬 더 발전할 것입니다.

사용량이 많은 Anthropic 계정을 갖춘 상태에서 새로 설치한다면, 단 10분 만에 설치하여 사용을 시작할 수 있습니다.

아래의 4분 분량 v2.0.0 쇼케이스 영상을 시청하거나, 더 자세한 정보를 위해 계속 읽어보세요!

이미 터미널 (Terminal)과 Claude Code에 익숙하다면, 아래의 빠른 시작 (Quick Start) 지침을 사용하여 거의 즉시 시작할 수 있습니다. 그렇지 않다면, 초보자 친화적인 세부 사항, 필수 요구 사항 및 문제 해결 방법을 안내하는 전체 설치 가이드부터 시작하는 것을 권장합니다.

요구 사항: Docker Desktop (실행 중), Anthropic Max 구독 (월 $100-200), API 키 또는 OpenRouter 계정 (토큰당 과금, 구독 불필요). 원하는 설치 디렉토리에서 터미널을 엽니다.

macOS / Linux (Terminal):

# DAAF 설치 (Docker 빌드 파일을 다운로드하고, 이미지를 빌드하며, 컨테이너로 리포지토리를 클론합니다)
curl -fsSL https://raw.githubusercontent.com/DAAF-Contribution-Community/daaf/main/scripts/host/install.sh | bash
# 설치 폴더로 이동하여 헬퍼 스크립트로 Claude Code를 실행합니다
...

Windows (PowerShell):

# DAAF 설치 (Docker 빌드 파일 다운로드, 이미지 빌드, 컨테이너 내로 리포지토리 클론 수행)
irm https://raw.githubusercontent.com/DAAF-Contribution-Community/daaf/main/scripts/host/install.ps1 | iex
# 설치 폴더로 이동하여 헬퍼 스크립트로 Claude Code를 실행합니다
...

처음 실행 시, Claude Code가 인증을 요청할 것입니다. /model 명령어를 통해 모델을 Opus 4.6 (또는 Opus 4.5)로 설정하세요.

그 다음 /config를 통해, 모델이 선택된 상태에서 방향키를 사용하여 사고 수준(thinking level)을 High로 설정하고, Auto-compact는 False로 설정하며 (DAAF의 내장 컨텍스트 창 관리 기능과의 충돌을 방지하기 위함), Verbose output은 True로 설정하세요 (DAAF의 사고 과정과 작업 내용을 정확하게 모니터링하기 위함). 이제 모든 준비가 완료되었습니다. DAAF를 사용하여 점진적으로 더 복잡한 작업을 시작하는 방법에 대한 몇 가지 제안은 'Understanding DAAF'를 참조하세요!

DAAF는 LLM 연구 보조 도구가 결코 완벽할 수 없으며, 당연하게 신뢰할 수 없다는 사실을 명시적으로 수용합니다. 하지만 적절한 가드레일(guardrails)이 있다면, 비판적 사고를 가진 연구자들에게 여전히 엄청난 가치를 제공할 수 있습니다. 모든 설계 결정은 다음 다섯 가지 핵심 요구 사항을 충족하기 위해 이루어집니다:

투명성 (Transparent). LLM (Large Language Models)은 항상 거짓말을 하거나, 환각 (hallucinating)을 일으키고, 지름길을 택하려는 경향이 있기 때문에, DAAF는 Claude Code가 파일 우선 원칙 (file-first principles)에 따라 작동하도록 강제합니다. 즉, 모든 데이터 작업은 실제 Python 파일로 초안을 작성하고 실행되며, 모든 추론 과정은 상세한 주석 (verbose comments), 계획 문서 (plan documents), 그리고 사용자가 언제든 검토하고 개입할 수 있는 구조화된 코드 출력 (structured code output) 형태로 저장됩니다.

확장성 (Scalable). 대부분의 LLM은 아첨 (sycophancy)과 과잉 확신에 취약한 범용 전문가 (generalists)로 학습되기 때문에, DAAF는 매우 주관적인 최선의 관행 (best practices)을 강제하는 포괄적이고 확장 가능한 명시적 지침 및 표준 세트(에이전트 및 기술 문서(skill documents)를 통해 제공)를 제공합니다. 이를 통해 특정 작업에 필요한 적절한 정보를 적시에 주입함으로써, 사용자가 좋은 결과물을 얻기 위해 매번 일일이 가이드할 필요가 없도록 합니다.

엄격함 (Rigorous). LLM은 인간보다 수십 배 빠른 속도로 작업할 수 있기 때문에, DAAF의 워크플로 (workflows)는 Claude가 세심하고, 신중하며, 스스로 점검하고, 극도로 철저하게 작업하도록 강제합니다. 코드는 초원자적 단계 (hyper-atomic steps)로 분해되어 적대적 검토 (adversarially reviewed)를 거칩니다. 계획과 보고서는 실제 데이터 문서 및 실제 탐색적 분석 (exploratory analyses)에 대한 심층 조사 내용을 바탕으로 작성되며, 이후 동일한 수준의 지식을 갖춘 상대방에 의해 검토됩니다.

재현성 (Reproducible). 훌륭한 과학은 재현 가능해야 하므로, 모든 개별 데이터 파일, 스크립트 및 출력물은 전체 과정 동안 자동으로 저장됩니다. 사용자는 단순히 DAAF나 Claude Code를 신뢰할 필요가 없습니다. 사용자는 모든 것을 직접 검증할 수 있으며, 또 검증해야 합니다.

책임감 (Responsible). AI 지원 연구는 책임감을 요구하기 때문에, DAAF는 데이터 출처가 적절히 인용되고, GUIDE-LLM 보고 표준을 통해 AI 지원 사실이 투명하게 공개되며, 데이터 사용 약관이 준수되고, 한계점이 정직하게 인정되며, 모든 분석 결정에 대해 인간 연구자의 판단이 최종 권한을 유지하도록 보장합니다.

DAAF를 열면, 어떤 질문이든 던지거나 어떤 유형의 작업이든 지원을 요청하는 것으로 바로 시작할 수 있습니다. DAAF는 9가지 가능한 연구 워크플로 모드 (Research Workflow Modes) 중 하나를 자동으로 선택하여 안내함으로써 사용자의 요구에 지능적으로 응답하며 (만약 DAAF가 잘못 판단한다면 자유롭게 방향을 수정할 수 있습니다!), 필요에 따라 지원되는 워크플로 간에 쉽게 전환할 수 있는 기회를 제공합니다.

데이터 온보딩 (Data Onboarding): Claude를 당신만의 데이터 전문가로 만드세요

사용자가 하는 일: DAAF에 데이터(로컬 파일, 웹 다운로드 또는 API)와 관련된 모든 문서를 지정합니다. DAAF가 하는 일: 완전히 재현 가능한 코드 (Reproducible Code)와 함께 데이터의 모든 세부 사항을 학습하기 위해 다단계 데이터 프로파일링 (Data Profiling) 프로세스를 실행합니다. 사용자가 얻는 것: 향후 해당 데이터와 관련된 모든 작업에서 DAAF가 참조할 심층적인 데이터 문서화 스킬 (Data Documentation Skill) — 완전히 휴대 가능하며 동료들과 공유할 수 있습니다. 예시:

Ad Hoc Collaboration (임시 협업): 더 똑똑하고 근거 있는 연구 파트너

사용자가 하는 일: 코드 리뷰 (Code review), 디버깅 (Debugging), 브레인스토밍 (Brainstorming), 스크립트 작성 등 연구와 관련된 어떤 것이든 DAAF에게 함께 아이디어를 내달라고 요청합니다.
DAAF가 하는 일: 내재된 도메인 지식과 방법론적 전문성 (Methodological expertise)을 바탕으로 가이드를 제공하며 협업자로서 참여합니다.
사용자가 얻는 것: 유연한 다회차 대화 세션 (Multi-turn working sessions)을 위한 훨씬 더 해박하고 세심한 Claude 어시스턴트
예시: "Python으로 이중차분법 (Diff-in-diff) 설계를 어떻게 구현할 수 있을까요? R에서는 어떻게 하는지 알지만, Python의 대응 방식은 모르겠습니다."

Full Pipeline (전체 파이프라인): 연구 질문부터 결과 도출까지, 모든 단계에서 사용자의 가이드와 함께합니다.

사용자가 하는 일: 사용자의 데이터를 활용하여 임의로 복잡한 연구 질문에 답할 수 있도록 DAAF에게 지원을 요청합니다.
DAAF가 하는 일: 데이터 범위 설정 (Data scoping), 분석 계획 (Analytic planning), 데이터 수집 및 정제 (Data acquisition and cleaning), 심층적인 코드 리뷰 (Code review), 분석, 시각화 (Visualization), 그리고 보고서 작성까지 — 모든 과정을 수행합니다.
사용자가 얻는 것: 사전 분석 계획 (Pre-analysis plan), 면밀한 검토를 위한 완전한 재현 가능 엔드-투-엔드 분석 (Reproducible end-to-end analysis), 그리고 주요 결과, 데이터 시각화, 한계점 및 인용 문헌이 포함된 요약 보고서
예시: "Pell share, 학생 인구 통계 및 기타 관련 요인들을 더 잘 고려하면서, 졸업률이 입학 선발도와 어떤 관계가 있는지 분석하고 싶습니다."

Revision and Extension (수정 및 확장): 초안을 개선하고 그 너머로 확장합니다.

사용자가 하는 일: 이전 분석에 대한 수정이나 새로운 결과물을 요청합니다.
DAAF가 하는 일: 이전 분석을 검토하고, 타겟팅된 수정을 실행하며, 필요에 따라 분석을 재실행하고, 모든 후속 작업 (Downstream work)을 업데이트합니다.
사용자가 얻는 것: 정교해진 분석, 새로운 대시보드 (Dashboards), 추가 시각화, 이해관계자 보고서 등 — 사용자가 필요로 하는 무엇이든 제공합니다.
예시: "어제 만든 산점도 (Scatter plots)가 너무 뭉쳐 보입니다. 크기를 조정하고 그 변경 사항을 후속 작업에 반영해 주세요."

Reproducibility Verification (재현성 검증): 믿지 말고 검증하십시오. 이전 작업이 완전히 재현 가능한지 확인하십시오.

사용자가 하는 일: DAAF를 완료된 전체 파이프라인 (Full Pipeline) 분석(본인 또는 타인의 것)으로 지정합니다.
DAAF가 하는 일: 최종 보고서를 바탕으로 모든 스크립트를 다시 실행하고 재검증하며, 그 과정에서 비판적 검토와 탐색을 수행합니다.
사용자가 얻는 것: 문제점, 우려 사항 및 요약된 시사점이 포함된 심층적인 재현성 보고서 (reproducibility report)
예시: 협력자들과 공유하기 전에, 졸업률 분석이 복제 노트북 (replication notebook)으로부터 올바르게 재현되는지 확인하고 싶습니다.

프레임워크 개발 (Framework Development): DAAF를 당신을 위해 작동하게 만드십시오

사용자가 하는 일: DAAF에게 새로운 방법론 (methodologies), 새로운 Python 라이브러리, 새로운 도메인 전문 지식 또는 완전히 새로운 모드 등 자체 기능을 개선하도록 요청합니다.
DAAF가 하는 일: 자체 아키텍처 (architecture)를 검토하고, 심층적인 연구를 수행하며, 기능을 세심하게 업데이트합니다.
사용자가 얻는 것: 동료나 커뮤니티와 공유할 수 있는 모듈형 기술 (modular skills)과 에이전트 (agents)를 갖춘 더 나은 DAAF
예시: 개방형 응답 텍스트 (open-response text)를 분류할 수 있도록 더 정교한 자연어 처리 (natural language processing) 기술에 대한 지원을 더 많이 구축하는 것을 탐색하고 싶습니다.

사용자 지원 (User Support): DAAF 자체와 그 기반 도구들 (Docker, Git, Claude Code)을 이해하고 사용하는 데 필요한 도움을 받으십시오

사용자가 하는 일: DAAF가 무엇인지, 어떻게 작동하는지, 설정이나 도구 문제를 어떻게 해결하는지, 또는 무엇을 기대할 수 있는지에 대해 DAAF에게 어떤 질문이든 던지십시오.
DAAF가 하는 일: 자체 문서 (documentation)를 불러와 명확하고 교육적인 안내와 함께 직접 응답합니다. 필요할 경우 온라인에서 공식 Docker, Git, Claude Code 문서를 찾아볼 수도 있습니다.
사용자가 얻는 것: DAAF 또는 그 기술 스택 (technology stack)에 관한 무엇이든 대화하듯 인내심 있게 설명해 주는 답변과 더불어, 특정 작업을 수행할 준비가 되었을 때 적절한 모드로 안내하는 힌트
예시: 제가 여기 처음인데, DAAF가 실제로 무엇을 하는지 단계별로 설명해 줄 수 있나요? 또한, Docker에 더 많은 메모리를 할당하려면 어떻게 해야 하나요?

Insights

DAAF-Contribution-Community/daaf

요약

핵심 포인트

댓글

연구실 AI 기반 구축 (제1회)

나이키(Nike)의 자업자득인 실수들이 Elliott Hill CEO의 초기 회복세를 위협하고 있다

$10,000의 교훈: Function Calling과 Caching을 활용한 비용 효율적인 AI 기능 구축

AI 컨텍스트 윈도우(Context Windows)와 싸우는 것을 멈추고 대신 아키텍처를 변경했습니다.

나이키(Nike)의 자업자득인 실수들이 Elliott Hill CEO의 초기 회복세를 위협하고 있다

$10,000의 교훈: Function Calling과 Caching을 활용한 비용 효율적인 AI 기능 구축

AI 컨텍스트 윈도우(Context Windows)와 싸우는 것을 멈추고 대신 아키텍처를 변경했습니다.