공공재의 안정적 메뉴: AI 기반의 진보
요약
EC 2025 논문의 미해결 문제를 활용하여 AI-for-EconCS 연구 워크플로우의 효과를 실험했습니다. 프롬프팅과 다회차 상호작용이 연구 성능에 미치는 영향을 분석하고, LLM의 성능을 박사과정 1년 차 학생과 비교했습니다.
핵심 포인트
- 인간의 직관을 포함한 프롬프팅이 LLM의 성능 향상에 도움을 줌
- 다회차 워크플로우가 연구의 '야심 찬' 단계를 장려하는 데 효과적임
- LLM의 연구 수행 능력은 박사과정 1년 차 학생보다 약간 낮은 것으로 나타남
EC 2025 논문인 "Stable Menus of Public Goods"의 미해결 문제를 테스트베드로 사용하여, 우리는 다양한 AI-for-EconCS(경제학 및 컴퓨터 과학을 위한 AI) 연구 워크플로우의 효과를 이해하기 위한 실험을 수행합니다. 구체적으로, 우리는 세 가지 질문을 연구합니다: 프롬프트에 인간의 직관을 제공하는 것이 도움이 되는가? 자동화된 다회차 상호작용(multi-turn interaction)이 도움이 되는가? 그리고, LLM(대규모 언어 모델)이 박사과정 1년 차 학생보다 뛰어난 성능을 보이는가? 앞의 두 질문과 관련하여, 우리는 다음과 같은 워크플로우 제안에 대한 증거를 제공합니다: (1) 인간의 직관을 포함한 프롬프팅은 LLM이 더 나은 "취향(taste)"을 갖도록 장려할 수 있다, (2) 파이프라인이 "야심 찬(ambitious)" 단계를 장려할 때 다회차 워크플로우가 도움이 된다. 세 번째 질문과 관련하여, 해당 논문의 시니어 저자들이 박사과정 1년 차 학생과 협업하기 전에 작성한 미발표 원고를 사용하여, LLM의 효과를 박사과정 1년 차 학생의 효과와 비교하였으며, LLM이 약간 덜 효과적이라는 것을 발견했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기