누구를 신뢰할 것인가를 학습하기: 이벤트 기반 금융 RAG를 위한 Frozen LLM의 시장 피드백 적응형 검색
요약
금융 RAG 시스템에서 LLM을 동결한 상태로 외부 베이지안 소스 메모리를 활용해 검색 성능을 최적화하는 연구를 소개합니다. 시장 피드백을 통해 검색 계층을 적응시킴으로써 뉴스 및 공시 데이터 기반의 수익률 예측 성능과 샤프 지수를 크게 향상시켰습니다.
핵심 포인트
- LLM을 동결하고 외부 베이지안 메모리로 검색 계층을 적응시킴
- 시장 피드백을 통해 이벤트 유형 및 맥락에 따른 검색 최적화
- 포트폴리오 샤프 지수를 0.52에서 0.84로 대폭 향상
- 금융 RAG에서는 '무엇을 읽을지'보다 '어디서 검색할지'가 중요함
금융 검색 증강 생성 (RAG) 시스템은 일반적으로 텍스트 관련성에 따라 증거의 순위를 매기지만, 금융 시장에서는 유용한 증거 출처가 이벤트 유형, 예측 기간(forecast horizon), 그리고 시장 맥락(market context)에 따라 달라집니다. 본 연구에서는 뉴스에 의해 트리거되는 이벤트 영향 예측을 특정 시점(point-in-time) 금융 RAG 문제로 연구합니다. 각 기업-뉴스 앵커(anchor)에 대해, 시스템은 관련 금융 뉴스 및 SEC 공시(SEC filing) 구절을 검색하고, 의사결정 전 시장 맥락 카드(market-context card)를 추가하며, 다중 기간 잔여 수익률(multi-horizon residual-return) 신호를 예측합니다. 우리의 방법론은 거대 언어 모델 (LLM) 리더(reader)를 동결(frozen) 상태로 유지하면서, 성숙한 잔여 수익률 피드백으로부터 업데이트되는 외부 베이지안 소스 메모리(Bayesian source memory)를 통해 검색 계층을 적응시킵니다. FinRL-DeepSeek/FNSPID 태스크에서 파생된 89개 나스닥(Nasdaq) 지향 종목 유니버스를 대상으로, 원본 FNSPID 뉴스 및 시점별 EDGAR 공시 구절을 사용하여 실험한 결과, 소스 메모리를 가진 Frozen Reader는 메모리가 없는 Frozen Reader에 비해 held-out macro-F1을 0.438에서 0.471로, 다운스트림 포트폴리오 샤프 지수(Sharpe ratio)를 0.52에서 0.84로 향상시켰습니다. 지도 학습 기반의 LoRA 리더는 정적 RAG를 약간 개선하지만, 동결된 소스 메모리 리더보다 성능이 뛰어나지는 않았습니다. 이러한 결과는 금융 RAG의 경우, 어디에서 검색할지를 학습하는 것이 어떻게 읽을지를 학습하는 것만큼 중요할 수 있음을 시사하며, 시장 피드백 적응을 위한 단순하고 모듈화된 경로를 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기