arXiv논문2026. 05. 25. 16:47

SemEval-2026 TASK 7에서의 DFKI-MLT: 다국어 모델을 문화적 지식으로 유도하기

요약

SemEval-2026 Task 7에 참여한 DFKI-MLT 시스템은 다국어 LLM의 문화적 지식을 강화하기 위해 활성화 유도(activation steering) 기법을 사용합니다. 파라미터 업데이트 없이 언어 벡터를 잔차 스트림에 추가하여 추론 시점 적응을 수행하며, MCQ 트랙에서 86.96%의 정확도를 기록했습니다.

핵심 포인트

언어 벡터를 활용한 추론 시점 적응(Inference-time adaptation) 적용
파라미터 업데이트 없는 활성화 유도(Activation steering) 방식 사용
MCQ 트랙에서 17개 팀 중 7위(정확도 86.96%) 달성
프롬프트 설계와 활성화 유도의 공동 최적화 필요성 확인

대규모 언어 모델 (LLMs)은 다양한 언어적 및 문화적 맥락에서 점점 더 많이 사용되고 있지만, 이들의 문화적 지식은 지역과 언어에 따라 여전히 불균형한 상태로 남아 있습니다. 우리는 문화적 인식 (cultural awareness)에 관한 SemEval-2026 Task 7을 위한 DFKI-MLT 시스템을 선보이며, 여기서 우리는 병렬 FLORES 데이터에서 추출한 언어 벡터 (language vectors)를 사용하여 다국어 LLMs에 활성화 유도 (activation steering)를 적용합니다. 우리의 방법은 어떠한 파라미터 업데이트 없이도, 선택된 트랜스포머 레이어 (transformer layer)의 잔차 스트림 (residual stream)에 언어별 유도 벡터를 추가함으로써 추론 시점 적응 (inference-time adaptation)을 수행합니다. 우리는 단답형 (SAQ) 및 객관식 (MCQ) 트랙 모두에 참여했으나, 우리의 MCQ 제출물만이 공식 점수를 받았습니다. 공식 MCQ 트랙에서 우리는 86.96%의 정확도를 달성하여 17개 팀 중 7위를 기록했습니다. 시스템 동작을 더 잘 이해하기 위해, 우리는 공유 태스크의 MCQ 및 SAQ 설정에 대해 사후 분석 (post-hoc analyses)을 수행합니다. 이러한 분석은 활성화 유도가 문화적 추론 (cultural reasoning)에 있어 완만하고 이질적인 개선을 가져온다는 것을 보여줍니다. 즉, 성능 향상은 레이어에 매우 민감하며, 언어-지역 쌍에 따라 크게 달라지고, 일부 구성에서는 성능이 오히려 저하되기도 하며, 일반적인 프롬프트와 문화적으로 조건화된 프롬프트를 비교했을 때 프롬프트 구성 (prompt formulation)과 상호작용합니다. 우리의 연구 결과는 문화적으로 인식된 다국어 추론을 위해 프롬프트 설계 (prompt design)와 활성화 유도가 공동으로 최적화되어야 함을 시사합니다.

AI 자동 생성 콘텐츠

원문 바로가기

SemEval-2026 TASK 7에서의 DFKI-MLT: 다국어 모델을 문화적 지식으로 유도하기

요약

핵심 포인트

댓글