아랍어 기반 LLM 금융 감성 분석: 사우디 시장의 증거
요약
사우디 시장의 언어적 특성을 반영하여 아랍어 금융 뉴스 및 소셜 미디어를 분석하는 새로운 NLP 프레임워크를 제안합니다. Transformer 기반 NER과 기업 사전을 결합한 다단계 파이프라인을 통해 84K 규모의 고품질 아랍어 금융 데이터셋을 구축하였습니다. 이를 통해 기업별 감성 집계와 사우디 거래소 주식 시장의 움직임 간의 상관관계를 분석할 수 있음을 입증했습니다.
핵심 포인트
- 아랍어 금융 맥락의 복잡성을 해결하기 위한 다단계 데이터 파이프라인 구축
- Transformer 기반 NER과 기업 사전(Lexicon)을 결합한 개체 연결(Entity linking) 기술 적용
- 5단계 분류 체계를 통한 정교한 감성 주석(Sentiment annotation) 수행
- 84K 샘플 데이터셋을 활용한 사우디 주식 시장의 감성 역학 분석 가능성 확인
투자자 감성 (Investor sentiment)은 금융 시장을 형성하지만, 아랍어 금융 맥락에서의 감성 모델링은 언어적 복잡성과 제한된 자원으로 인해 여전히 어려운 과제로 남아 있습니다. 본 연구에서는 사우디 시장에 맞춤화된 대규모 금융 감성 분석을 위한 아랍어 자연어 처리 (NLP) 프레임워크를 제시하며, 기관 및 대중 투자자의 감성을 포착하기 위해 공식 금융 뉴스 및 소셜 미디어를 통합합니다. 이 프레임워크는 데이터 수집, 정제, 중복 제거, 개체 연결 (Entity linking), 감성 주석 (Sentiment annotation)을 포함하는 다단계 파이프라인을 통해 대규모 아랍어 금융 코퍼스 (Corpus)를 구축합니다. Transformer 기반의 개체명 인식 (NER)을 선별된 기업 사전 (Lexicon)과 결합하여 텍스트 언급을 표준 기업 식별자로 연결하며, 5단계 분류 체계를 사용하여 감성 레이블을 할당합니다. 그 결과 생성된 84K 개의 샘플 데이터셋은 기업 수준의 감성 집계와 사우디 거래소 (Saudi Exchange)의 주식 시장 움직임에 따른 감성 역학 분석을 지원합니다. 실험 결과는 신뢰할 수 있고 확장 가능한 아랍어 금융 감성 분석 성능을 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기