
연구용 Agent를 위한 워크플로우 프레임워크: Science Superpowers 발견
요약
Science Superpowers는 연구용 Agent가 연구 규범을 준수하도록 설계된 워크플로우 프레임워크입니다. 가설 사전 등록과 재현 가능한 환경 구축을 통해 p-hacking과 같은 통계적 오류를 방지하며 체계적인 연구 프로세스를 강제합니다.
핵심 포인트
- 연구 규범(Research Norms)에 기반한 Agent 행동 설계
- 가설 사전 등록 및 반증 가능한 질문 생성 기능
- p-hacking 및 사후 가설 설정(HARKing) 방지
- Cursor, Claude Code 등 주요 Agent 도구 지원
- 10개 이상의 전문 연구 스킬 자동 트리거
연구용 Agent (Research Agent)를 위한 워크플로우 프레임워크인 Science Superpowers를 발견했습니다. 이는 소프트웨어 개발 방법론인 Superpowers의 연구 버전으로, 핵심 아이디어는 Agent가 연구 규범(Research Norms)에 따라 행동하도록 만드는 것입니다. 즉, 가설 사전 등록(Pre-registration of hypotheses), 검증적/탐색적 분석(Confirmatory/Exploratory analysis)의 구분, 재현 가능한 환경(Reproducible environment), 증거 우선(Evidence-first) 원칙을 따르게 합니다.
GitHub: https://t.co/ZzDnp5WlOd
이 프레임워크는 Agent가 시작될 때 일련의 스킬(Skill)을 자동으로 트리거하여 연구 프로세스를 강제합니다. 예를 들어, 데이터 분석을 수행하려 할 때 Agent는 즉시 코드를 실행하는 대신, 먼저 모호한 아이디어를 반증 가능한 질문(Falsifiable questions)으로 변환하고, 문헌을 조사하여 표준적인 방법을 찾으며, 분석 단계를 설계한 뒤, 가설과 예측을 사전 등록합니다. 즉, 의사결정 규칙을 확정한 후에야 결과를 확인하게 됩니다. 이러한 프로세스는 p-hacking 및 사후 가설 설정(HARKing, Hypothesizing After the Results are Known)을 방지합니다.
10개 이상의 연구 스킬(Research Skills)을 포함하고 있습니다: 연구 질문 제기, 문헌 조사, 분석 설계, 분석 사전 등록, 재현 가능한 작업 공간 구축, 분석 실행, 이상 결과 조사, 결과 검증, 레드팀 리뷰(Red teaming), 보고서 아카이빙. 각 스킬은 적절한 시점에 자동으로 트리거되며, Agent는 임의로 행동하는 대신 정해진 프로세스에 따라 움직입니다.
Cursor, Claude Code, Codex, Gemini CLI, OpenCode, Google Antigravity 등 주요 Agent 도구를 지원하며, 세션 시작 훅(session-start hook)을 통해 자동으로 로드됩니다.
AI Agent를 활용해 연구 보조, 논문 읽기, 데이터 정리, 실험 설계가 필요한 연구자; Agent가 재현 가능하고 연구 규범에 부합하는 분석 결과를 출력하기를 원하는 팀; Agent에 연구 방법론적 제약을 추가하여 통계적 오류를 피하고자 하는 데이터 분석 시나리오에 적합합니다.
Agent가 연구 규범에 따라 분석을 수행하도록 만들고 싶다면, 이 프레임워크를 시도해 보세요.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @wsl8297 (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기