겉으로는 예의 바르지만 실제로는 틀린: 다국어 뱅골어 생성에서의 경어법 오류 수정을 위한 큐레이션된 데이터셋

다국어 거대 언어 모델 (Multilingual Large Language Models, MLLMs)의 최근 발전은 교차 언어 대화 능력을 크게 향상시켰으나, 문화적으로 미묘하고 문맥에 의존적인 의사소통을 모델링하는 것은 여전히 중요한 병목 현상으로 남아 있습니다. 구체적으로, 기존의 최첨단 모델들은 뱅골어 (Bangla)와 같은 저자원 (low-resource) 문맥에서 구조적 변이, 지역 관용구, 그리고 경어법 (honorifics)의 일관성을 처리할 때 심각한 화용론적 격차 (pragmatic gap)를 보입니다. 이러한 한계를 해결하기 위해, 우리는 $4,196$개의 세심하게 큐레이션된 상호작용 쌍으로 구성된 extbf{BangLa Application and DialoguE generation - BLADE}를 위한 새로운 문화적 정렬 인스트럭션 튜닝 (instruction-tuning) 데이터셋 및 벤치마킹 프레임워크를 소개합니다. 우리는 이 자원을 활용하여 4-bit NormalFloat (NF4) 양자화 (quantization) 프레임워크 내에서 LoRA 어댑터를 통한 매개변수 효율적 미세 조정 (parameter-efficient fine-tuning)을 사용하여 DeepSeek-8B 및 LLaMA-3.2-3B를 포함한 주요 오픈 웨이트 (open-weight) 아키텍처를 체계적으로 미세 조정하고 평가합니다. 우리의 실증적 평가에 따르면, 우리 데이터셋으로 미세 조정된 모델은 구조적 충실도 (structural fidelity)와 경어법 정렬 (honorific alignment) 측면에서 상당한 개선을 보여주며, 저자원 다국어 텍스트 생성에서 화용론적 격차를 해소하기 위한 엄격한 벤치마크를 제공합니다. 코드 및 데이터셋: https://github.com/ashuvo25/Bangla_Application_LLM/tree/main

Insights

겉으로는 예의 바르지만 실제로는 틀린: 다국어 뱅골어 생성에서의 경어법 오류 수정을 위한 큐레이션된 데이터셋

요약

핵심 포인트

댓글

자기 진화 AI 에이전트에 대한 종합 조사: 파운데이션 모델과 평생 에이전트 시스템을 연결하는 새로운 패러다임

Apple이 Hugging Face에 HAT을 공개하다

Grok 4.5의 실제 사용 비용은 Opus 4.8의 1/17 수준입니다.

Grok 4.5가 Cursor에서 공식 출시되었습니다.

자기 진화 AI 에이전트에 대한 종합 조사: 파운데이션 모델과 평생 에이전트 시스템을 연결하는 새로운 패러다임

Apple이 Hugging Face에 HAT을 공개하다

Grok 4.5의 실제 사용 비용은 Opus 4.8의 1/17 수준입니다.

Grok 4.5가 Cursor에서 공식 출시되었습니다.