ODTQA-FoRe: 미래 데이터 예측 및 추론을 위한 오픈 도메인 표 형식 질의응답 데이터셋
요약
LLM의 한계인 미래 수치 예측 및 추론 능력을 강화하기 위한 새로운 데이터셋 ODTQA-FoRe를 제안합니다. 부동산 데이터를 활용한 시계열 예측과 추론을 위해 SQL 생성, 외부 모델 호출, 결과 합성을 수행하는 에이전트 프레임워크 TimeFore를 함께 선보입니다.
핵심 포인트
- 미래 데이터 예측 및 추론을 위한 신규 데이터셋 ODTQA-FoRe 제안
- 시계열 예측과 예측 기반 추론을 결합한 새로운 태스크 도입
- 에이전트 기반 프레임워크 TimeFore를 통한 문제 해결
- Retriever, Forecaster, Analyzer의 협력적 역할 분담
LLM (Large Language Models)의 급격한 발전은 표 형식 질의응답 (Tabular Question Answering) 기술을 크게 진보시켰으나, 대부분의 시스템은 미래 지향적인 수치 예측을 수행하지 못합니다. 이러한 격차를 해소하기 위해, 우리는 '미래 데이터 예측 및 추론을 위한 오픈 도메인 표 형식 질의응답 (Open-Domain Tabular Question Answering for Future Data Forecasting and Reasoning)'이라는 새로운 태스크를 도입하며, 부동산 데이터를 사용하여 시계열 예측 (Time-series Forecasting) 및 예측 기반 추론 (Forecast-based Reasoning) 시나리오를 다루는 최초의 데이터셋을 제안합니다. 이 태스크는 정확한 과거 데이터를 검색하고, LLM의 예측 한계를 극복하며, 다양한 질의에 대해 응답을 표준화해야 하는 과제를 안고 있습니다. 이러한 과제들을 해결하기 위해, 우리는 문제를 세 가지 협력적 역할로 분해하는 LLM 에이전트 기반 프레임워크인 TimeFore를 제안합니다. Retriever는 데이터를 가져오기 위해 SQL을 자율적으로 생성하고, Forecaster는 더 높은 정확도를 위해 외부 시계열 모델을 호출하며, Analyzer는 결과를 합성하여 정확하고 일관된 최종 답변을 구성합니다. 광범위한 실험을 통해 TimeFore의 효과를 입증하였습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기