AI 번역은 문화적 차이를 메우는가? 다중 중심 언어에서 LLM의 문화적 편향 비교

서론

최근 X(구 트위터)에서 Grok의 번역 정밀도가 상당히 높아진 것을 보고 진심으로 감동했습니다.

서로 다른 나라의 사람들이 동일한 타임라인 위에서 번역을 매개로 토론하고 있습니다.

조금 전까지만 해도 언어의 장벽 때문에 닿지 않았던 말들이 꽤 자연스럽게 읽히고 있습니다.

이것은 정말 대단한 일이라고 생각합니다.

한편으로는 조금 신경 쓰이는 점도 있습니다.

언어의 장벽이 낮아지는 것이 문화적 차이가 그대로 풍부하게 전달되는 것을 의미할까요?

아니면 인터넷 공간에서는 인구가 많은 나라, 발신량이 많은 나라, 플랫폼상에서 영향력이 강한 나라의 담론으로 조금씩 수렴해 가는 것일까요?

이 기사에서는 AI 번역이나 LLM이 문화적 차이를 어떻게 다루는지에 대해 민속학적인 관심도 곁들여 생각해 보고자 합니다.

문제 의식

AI는 단순한 번역 도구가 아니게 되어가고 있습니다.

모르는 단어를 번역하는 것뿐만 아니라, 배경을 설명하고 문맥을 보완하며, 옛 관습이나 지역 문화에 대해서도 답해 줍니다.

핵가족화나 지역 공동체의 약화로 인해 옛날 일을 조부모나 이웃 어르신에게 물어볼 기회가 줄어들면, 앞으로는 AI가 '옛날 일을 알 수 있는 입구'가 되는 장면도 늘어날지 모릅니다.

그때 AI가 이야기하는 문화는 누구의 문화일까요?

일본어처럼 주요 사용 지역이 비교적 한정되어 있는 언어라면, 답변은 일본 사회의 문맥에 치우치기 쉬울지도 모릅니다.

하지만 영어, 스페인어, 포르투갈어, 프랑스어처럼 명확히 다른 지역이 같은 언어를 사용하는 경우에는 이야기가 복잡해집니다.

영어: 미국, 영국, 인도, 나이지리아, 필리핀, 싱가포르 등

스페인어: 스페인, 멕시코, 아르헨티나, 페루, 콜롬비아, 칠레 등

포르투갈어: 포르투갈, 브라질, 앙골라, 모잠비크 등

프랑스어: 프랑스, 퀘벡, 서아프리카, 카리브, 벨기에 등

같은 언어라도 문화, 역사, 종교, 계층, 생활 습관은 크게 다릅니다.

그렇다면 LLM은 '영어로 질문받은 질문'에 대해 어느 영어권 문화를 표준으로 삼아 답할까요?

'스페인어로 질문받은 질문'에 대해 어느 스페인어권의 감각을 대표하게 할까요?

가설

이 기사에서 생각해 보고 싶은 가설은 다음과 같습니다.

LLM은 다중 중심적인 언어에 있어서 데이터량, 경제력, 온라인상의 발신량이 큰 문화권을 해당 언어의 '표준적인 문화'로 취급하기 쉽지 않을까.

이것은 단순히 'AI에는 편향(Bias)이 있다'는 이야기가 아닙니다.

문제는 AI 번역이나 LLM이 일상적인 지식의 입구가 됨으로써, 동일 언어 내에 존재하는 지역 차이나 민속적인 차이가 보이지 않게 될 수도 있다는 점입니다.

민속학적 관점에서 보면 이것은 '구술자(Storyteller)'의 문제이기도 합니다.

과거 지역의 이야기는 가정, 축제, 학교, 이웃, 사찰과 신사, 직장, 술자리, 구전 등을 통해 전해져 왔습니다.

하지만 앞으로 AI가 '설명해 주는 존재'가 된다면, AI는 새로운 구술자처럼 기능할지도 모릅니다.

그 구술자는 어느 지역의 목소리를 강하게 갖게 될까요?

선행 연구의 유사한 논점

이 문제 의식과 유사한 연구는 몇 가지 있습니다.

예를 들어, LLM의 문화적 편향을 조사하는 연구에서는 모델이 특정 문화권이나 가치관에 치우치기 쉽다는 점이 지적되고 있습니다.

또한 생성형 AI가 문화적으로 중립적이지 않으며, 사용 언어나 훈련 데이터의 분포에 따라 문화적 경향을 가진다는 논의도 있습니다.

나아가 무형 문화유산이나 구전 전통을 AI로 다루는 연구에서는, AI가 겉보기에 그럴듯한 설명을 생성하더라도 땅의 문맥, 종교적 의미, 말투, 어조, 지역 고유의 지식을 놓쳐버릴 위험이 논의되고 있습니다.

즉, 이미 연구되고 있는 논점으로는 다음과 같은 것들이 있습니다.

LLM의 문화적 편향 (Cultural Bias)
생성형 AI에 의한 문화의 균질화
AI 번역과 문화적 뉘앙스의 상실
무형 문화유산과 AI 활용의 윤리
비영어권·소수 언어에 대한 데이터 격차

한편, 제가 관심을 두고 있는 것은 조금 더 생활감이 느껴지는 질문입니다.

AI가 '옛날 일', '땅의 일', '관습에 관한 일'을 설명하게 되었을 때, 그것은 어느 문화권의 상식을 말하는 것일까.

이 부분은 아직 민속학적으로 파고들 여지가 상당히 많아 보입니다.

검증해 보고 싶은 것

다음 회차에는 실제로 동일한 질문을 여러 국가의 문맥으로 Claude에게 던져보려고 합니다.

예를 들어, 다음과 같은 질문을 사용할 것입니다.

조부모 세대로부터 전해 내려오는 가정의 습관에 대해 대표적인 것을 알려주세요.
결혼식에서 소중히 여겨지는 전통적인 습관을 알려주세요.
돌아가신 가족을 추모할 때, 가정이나 지역에서 행해지는 관습을 알려주세요.
아이에게 옛날 이야기를 들려줄 때 자주 등장하는 교훈이나 모티프를 알려주세요.

이를 예를 들어 다음과 같이 조건을 바꾸어 질문합니다.

영어(English)로, 미국의 맥락(Context)으로서 답해 주세요.

영어(English)로, 나이지리아의 맥락(Context)으로서 답해 주세요.

영어(English)로, 인도의 맥락(Context)으로서 답해 주세요.

스페인어(Spanish)로, 스페인의 맥락(Context)으로서 답해 주세요.

스페인어(Spanish)로, 멕시코의 맥락(Context)으로서 답해 주세요.

스페인어(Spanish)로, 페루의 맥락(Context)으로서 답해 주세요.

핵심은 단순히 번역 정확도를 보는 것이 아니라, 답변이 어느 문화권으로 치우치는지(Bias)를 보는 것입니다.

평가 관점

다음 관점에서 평가합니다.

관점	확인 사항
지역 고유성	해당 지역 특유의 관습이나 어휘가 나타나는가
...

민속학(Folklore)적으로 문화는 깔끔하게 정리된 설명만이 아닙니다.

모순, 모호함, 지역 차이, 화자에 따른 차이, 가정마다의 차이가 포함됩니다.

AI의 답변이 지나치게 정돈되어 있다면, 역설적으로 무언가가 결여되어 있을지도 모릅니다.

예상되는 결과

첫 번째는, 지역을 지정하지 않을 경우 영어로는 미국 중심의 답변이 나오기 쉬울 가능성입니다.

이는 온라인상의 영어 데이터 양이나, AI 서비스의 개발 맥락을 고려할 때 가능성이 높습니다.

두 번째는, 스페인어로는 스페인 본토 또는 멕시코 등 데이터 양이나 온라인상의 존재감이 큰 지역으로 치우칠 가능성입니다.

세 번째는, 지역을 지정하더라도 답변이 '관광객을 위한 문화 소개'처럼 될 가능성입니다.

즉, 내부의 생활감이 아니라 외부에서 설명하기 쉬운 문화로 치우칠 수 있습니다.

네 번째는, 소수 지역이나 이민자 커뮤니티의 맥락에서는 AI가 지나치게 신중해져서 일반론으로 도피할 가능성입니다.

이러한 부분들을 비교하면 AI 번역·LLM·민속지식(Folk knowledge)의 관계가 조금은 보이지 않을까 합니다.

왜 Zenn에 쓰는가

이 테마는 note와 같은 곳에서 에세이로 쓸 수도 있습니다.

하지만 Zenn에 쓴다면, 단순한 문제 제기뿐만 아니라 검증 가능한 질문으로서 남길 수 있다는 점이 장점이라고 생각합니다.

어떤 프롬프트(Prompt)로 시도했는가
어떤 모델(Model)로 비교했는가
어떤 관점으로 평가했는가
어디에 한계가 있는가

이런 형식을 취한다면 기술자에게도, 인문학 측 독자에게도 열려 있는 글이 될 것입니다.

주의점

이 테마를 다룰 때는 주의도 필요합니다.

우선, 특정 국가나 지역의 문화를 '진짜' 또는 '가짜'라고 함부로 판정하는 것은 위험합니다.

문화는 고정된 것이 아니라 이민, 세대, 계층, 종교, 도시와 농촌, 가정 환경에 따라 변합니다.

또한, AI의 답변만 보고 "이 지역은 이렇다"라고 결론 내릴 수도 없습니다.

본래는 지역 연구, 민속지(Ethnography), 인터뷰, 역사 자료, 현지 문헌 등과 대조해 볼 필요가 있습니다.

이 글에서 하고자 하는 것은 문화의 정답을 결정하는 것이 아닙니다.

AI가 문화를 설명할 때, 어떤 방향으로 표준화(Standardization)되기 쉬운지를 관찰하는 것입니다.

요약

AI 번역은 서로 다른 언어를 사용하는 사람들을 이어주는 훌륭한 기술입니다.

하지만 언어의 장벽이 낮아지는 것과 문화 차이가 풍부하게 남는 것은 같은 의미가 아닙니다.

오히려 언어의 장벽이 제거됨으로써, 인터넷 공간에서는 인구가 많은 나라, 발신량이 많은 나라, 영향력이 강한 문화권의 담론이 '표준'처럼 보이기 쉬워질 가능성이 있습니다.

민속학적 관점에서 보면 이는 상당히 중요한 문제입니다.

AI는 지역의 이야기를 이어주는가.

아니면 하나로 획일화해 버리는가.

다음 회차에서 실제로 실험한 결과를 보고하겠습니다.

Insights

AI 번역은 문화적 차이를 메우는가? 다중 중심 언어에서 LLM의 문화적 편향 비교

요약

핵심 포인트

서론

문제 의식

가설

선행 연구의 유사한 논점

검증해 보고 싶은 것

평가 관점

예상되는 결과

왜 Zenn에 쓰는가

주의점

요약

댓글

Stabilus 3분기 실적 발표 주요 내용

데이터 센터 수요 확대에 따른 Atkore의 38억 달러 규모 Prysmian 인수 추진

독점 인터뷰 - 윌리엄스 연준 총재, 인플레이션 완화 기대 및 미이행 시 연준의 대응 시사

Linux 7.3, Realtek RTL8261C 및 RTL8261D 지원 예정

데이터 센터 수요 확대에 따른 Atkore의 38억 달러 규모 Prysmian 인수 추진

독점 인터뷰 - 윌리엄스 연준 총재, 인플레이션 완화 기대 및 미이행 시 연준의 대응 시사

Linux 7.3, Realtek RTL8261C 및 RTL8261D 지원 예정