DSPy를 사용하여 Datasette Agent의 SQL 시스템 프롬프트 평가 및 개선하기

2026년 7월 2일

오늘 아침 AIE 기조연설 중 하나에서 dspy가 다뤄졌는데, 이를 통해 Datasette Agent에서 사용하는 시스템 프롬프트(system prompt)를 개선하는 데 dspy가 도움이 될 수 있을지 확인해보고 싶다는 생각이 들었습니다. 그래서 Claude Fable 5를 사용하여 웹용 Claude Code에서 비동기 연구 작업(asynchronous research task)을 실행했습니다:

최신 버전의 Datasette alpha, datasette-agent, dspy를 pip install 하세요. 그런 다음, Datasette Agent가 데이터에 대한 사용자 질문에 답하기 위해 읽기 전용 SQL 쿼리를 실행할 수 있는 기능에서 사용되는 주요 시스템 프롬프트를 dspy를 사용하여 어떻게 평가하고 개선할 수 있는지 파악하세요.

Fable은 GPT 4.1 mini와 nano를 사용하여 테스트하는 방식을 선택했으며, 개선을 위한 몇 가지 유망한 방향을 식별했습니다. 저는 특히 이 부분이 마음에 들었습니다:

스키마 목록(schema listing)이 테이블 이름만 제공합니다. "이미 정보를 가지고 있다면 describe_table을 호출하지 마세요"라는 조언이 컬럼 이름 추측(page_count, o.order_id, first_name)과 베이스라인 트레이스(baseline traces)에서의 오류-재시도 루프를 유발했습니다. 프롬프트의 스키마 목록에 컬럼 이름을 포함하거나, 해당 조언을 완화해야 합니다.

Insights

DSPy를 사용하여 Datasette Agent의 SQL 시스템 프롬프트 평가 및 개선하기

요약

핵심 포인트

댓글

스웨덴 법원, Google에 Klarna 소유 PriceRunner에 대한 반독점 손해배상금 15억 달러 지급 명령

AI 메모리는 개방형 엔그램(Engrams)으로 저장되어야 하는가, 아니면 모델 가중치(Weights)에 내재되어야 하는가?

기업용 RAG: AI를 비즈니스 데이터에 연결하기 (실무 가이드)

AI 에이전트 메모리 엔그램(Engrams)을 위한 오픈 표준이 존재하는가?

AI 메모리는 개방형 엔그램(Engrams)으로 저장되어야 하는가, 아니면 모델 가중치(Weights)에 내재되어야 하는가?

기업용 RAG: AI를 비즈니스 데이터에 연결하기 (실무 가이드)

AI 에이전트 메모리 엔그램(Engrams)을 위한 오픈 표준이 존재하는가?