AI의 일본어가 '너무 정돈되어 부자연스러운' 정체는 '칼크(번역투)'였다 — 고품질 일본어 문장을 생성하는 스킬을 만들었다 - Insights | Molayo

AI가 쓴 일본어를 읽으면서, "정돈되어 있는데 어딘가 부자연스럽다"라고 느낀 적은 없는가.

오타는 없다. 문법도 맞다. 그런데도 문장이 매끄럽게 읽히지 않고 머릿속에 들어오지 않는다. "AI가 쓴 문장이다"라고 한눈에 알 수 있는, 바로 그 느낌.

이 "너무 정돈되어 부자연스러운" 현상에는 정체가 있다. 이름도 붙어 있다. 칼크(calque=번역 차용) —— 영어를 그대로 직역하여 일본어에 받아들이는 현상이다.

그리고 까다로운 점은, 이것은 정돈되어 보이는 문장일수록 찾아내기 어렵다는 것이다. 본 기사의 후반부에서는, 내가 AI에게 쓰게 하여 공개한 자신의 기술 블로그 기사를 소재로, 직접 만든 스킬로 실제로 검출한 결과를 전부 공개한다. 한 번 읽어보면 파탄이 없는 AI 문장에서 5건의 결함이 나왔다.

칼크(번역 차용)란 무엇인가

칼크(calque)란 외국어의 단어나 관용구를 구성 요소별로 직역하여 일본어에 받아들이는 것이다. 일본어로는 **번역 차용 (翻訳借用)**이라고 한다. skyscraper → 「摩天楼(마천루)」, honeymoon → 「蜜月(밀월)」, iron curtain → 「鉄のカーテン(철의 장막)」. 이것들은 정착된 정식 일본어로, 그 자체로는 결함이 아니다.

문제가 되는 것은 관용구나 구문을 직역한 결과, 부자연스러운 일본어 = 번역투(訳語臭, 번역 조)가 될 때다. 단어가 틀린 것이 아니다. 구조가 영어 그대로 —— 그것이 바로 그 "너무 정돈되어 부자연스러운" 것의 정체이다.

구별 방법은 하나, 역번역 테스트(Back-translation test). 의심스러운 부분을 영어로 되돌렸을 때, 영어의 관용구나 유표한(marked) 구문에 그대로 쏙 들어간다면 직역 칼크를 의심한다.

「같은 페이지에 있다」 → "on the same page" → 일본어라면 「인식이 일치하다(認識が揃っている)」
「테이블 위에 있다」 → "on the table" → 일본어라면 「검토 중이다(検討中だ)」
「바늘을 움직이다」 → "move the needle" → 일본어라면 「효과를 내다(効果を出す)」

단, 주의가 필요하다. 평범한 문장이 그냥 평범한 영어로 돌아갈 뿐이거나(「나는 학생입니다」 → "I am a student"), 마천루와 같은 정착어는 지적해서는 안 된다. 이것을 잘못 판단하면 자연스러운 일본어까지 오류(red line)를 표시하게 된다. 위양성(False Positive)이야말로 최대의 적이다. 이 경계선은 나중에 다시 한번 중요하게 작용한다.

가장 자주 나타나고, 가장 알아채기 어려운 유형: 무생물 주어

실례에서 가장 많은 것은 단어가 아니라 구문의 직역 —— 무생물 주어 + 타동사다. 영어의 "X enables Y" / "the file lowered the score"를 그대로 번역하면, 일본어에서도 "파일이 스코어를 낮춘다"라고 써버리게 된다. 엄밀히 말하면 이것은 단어의 차용이라기보다 구문 수준의 번역투이지만, "영어를 그대로 흉내 내는" 메커니즘은 칼크와 같기에 본 스킬도 통틀어 칼크로 잡아낸다.

문법은 옳다. 오해도 일으키지 않는다. 하지만 일본어 문장으로서는 부자연스럽게 들린다. 일본어는 "사람이 무엇을 했는지", "무엇이 어떻게 되었는지"로 쓰는 것이 자연스러우며, "사물이 사물에게 이렇게 시켰다"라고 쓰면 번역문의 냄새가 난다.

AI가 이 구문을 양산하는 이유는, 영어가 주체인 학습 데이터의 구조를 확률적으로 흉내 내기 때문이다. 번역가의 손에 남는 번역투와 같은 메커니즘으로 태어난다. 그래서 —— 다음에 보여주는 것처럼 —— AI에게 쓰게 하여 공개한 자신의 기사에 적용하면, 바로 이 유형이 줄지어 나타난다. 정돈되어 보이는 AI 문장을 그대로 해부한다.

이것은 느끼면서도 말로 표현할 수 없는 결함의 전형이다. 독자는 "왠지 딱딱하다"라고밖에 말할 수 없다. 이름을 붙여주면 고칠 수 있다.

자신의 기사로 실연한다 (도그푸딩, Dogfooding)

좋은 말만 늘어놓아도 소용없다. AI에게 쓰게 하여 Zenn에 공개한 자신의 기사에, 직접 만든 스킬인 jp-style-check를 실제로 적용했다. 소재는 「Claude Code가 폐안을 다시 구현하는 『컨텍스트 드리프트(Context Drift)』를 막는 문서 관리술」이다. 구성도 일본어도 한 번 읽어보면 정돈되어 있다. 그럼에도 번역투는 나타났다.

스킬의 출력은 확도에 따라 2개 층으로 나뉜다. 〔지적〕은 반증 가능한 결함, 〔조언〕은 확도가 낮은 리듬 계열의 조언이다. 장소, 이유, 수정 방법을 반환한다. 아름다움 점수는 매기지 않는다 (이유는 후술).

〔지적〕 1 칼크 (무생물 주어)

Before: LLM이 자동 생성한 리포지토리 레벨의 컨텍스트 파일

은(는), 태스크 성공률을 평균 3% 저하시켰고, 추론 비용을 20% 이상 증가시켰다.

역번역하면 "the context file lowered the task success rate by 3% and increased inference cost by 20%+". 무생물 주어 + 사역 타동사의 영어 그대로의 형태로 돌아간다.

After: 컨텍스트 파일을

주면, 태스크 성공률은 평균 3% 하락하고, 추론 비용은 20% 이상 증가했다.

「파일이 낮췄다(ファイルが下げた)」를 그만두고, 「주면 하락했다(与えると下がった)」로 바꾼다. 주어를 사물에서 사건으로 옮기는 것만으로도 번역투(訳語臭)가 사라진다.

〔지적〕 2 칼크 (한 단어 번역)

Before: 리포지토리 레벨의 컨텍스트 파일

"repository-level"의 한 단어 번역. 사전의 첫 번째 의미를 그대로 갖다 붙이는 유형이다.

After: 리포지토리 전체의 / 리포지토리 단위의

단어는 관용구가 아니기에 역번역 테스트(逆翻訳テスト)에 걸리기 어렵다. 그렇기에 오히려 놓치기 쉽다. level → 레벨, native → 네이티브, status → 스테이터스는 한 번쯤 의심해 볼 가치가 있다.

〔지적〕 3 칼크 (무생물 주어 + 명사화)

Before: 무질서한 정보의 추가는, AI에게 과도한 파일 탐색과 무의미한 테스트를 촉구하여, 본질적인 태스크 해결을 저해한다.

「정보의 추가는…… 촉구하여…… 저해한다」. 이것도 무생물 주어이며, 게다가 「추가(追加)」「해결(解決)」과 같이 동작이 명사로 굳어져 있다.

After: 정보를 무질서하게 늘리면, AI는 불필요한 파일 탐색이나 무의미한 테스트를 수행하게 되어, 본래 풀어야 할 태스크에서 멀어진다.

명사화를 풀어서 동사로 되돌리면, 누가 무엇을 하는지가 명확히 드러난다.

〔지적〕 4 간결 (명사화로 동작 주체가 사라짐)

Before: 물리적인 액세스 제한을 설정함으로써, 과거 기억의 변조라는 거동을 배제한다.

「변조라는 거동을 배제한다(改ざんという挙動を排除する)」는 무엇이 무엇을 하는지가 추상적인 층위에 숨겨져 있다.

After: 물리적인 액세스 제한을 설정하여, 과거의 기록이 변조되는 것 자체를 방지한다.

〔지적〕 5 명쾌 (약어가 미정의됨)

Before: 어느 것이든, LLM의 주의 집중 메커니즘(Attention Mechanism)의 편향(Lost in the Middle와 CDV)을 구조 측면에서 보완하는 설계이다.

CDV가 요약 부분에서 처음 등장한다. 본문에서는 「컨텍스트 헤드(context head)」라는 용어로 설명했는데, 결론에서 다른 약어로 변해버렸다. 독자는 CDV를 모른다.

After: 처음 등장할 때 CDV(문맥에 의한 주의 희석)라고 정의하거나, 본문에서 사용한 「컨텍스트 헤드」로 용어를 통일한다.

그리고, 이 점이 중요하다 — 지적되지 않은 부분

컨텍스트 내에 태스크와 무관한 정보(노이즈나 폐기된 안의 로그)가 혼입되면, 「컨텍스트 헤드」는 관련 정보에 충분한 주의를 할당할 수 없게 된다.

이 문장에 대해 스킬(skill)은 아무런 지적을 내놓지 않았다. 주술 관계가 통하고, 해석이 일의적이며, 번역투도 없다. 「이곳은 문제없음」이라고 침묵하는 것이야말로 검출기의 가치다. 모든 것에 빨간 펜을 긋는 교정은 금방 신뢰를 잃게 된다.

왜 「채점」이 아니라 「결함 검출」인가

이것이 이 도구의 설계 사상이며, 아마도 가장 전달하고 싶은 점일 것이다.

세상에 존재하는 「AI가 아름다운 일본어를 쓴다」류의 이야기들을 나는 일단 전부 의심하고 있다. 이유는 단순하다. 아름다움은 안정적으로 측정할 수 없기 때문이다. LLM은 소리를 들을 수 없으며, 풍미나 품격을 일관된 기준으로 채점할 수 없다. 할 수 있는 척하면, 그 당시의 기분에 따라 흔들리는 점수가 나올 뿐이다.

그래서 이 스킬은 아름다움을 채점하지 않는다. 대신에, 반증 가능한 결함만을 타격한다. 주술의 꼬임, 문장의 이중 의미, 번역투, 미정의 약어, 표기 불일치——「이 부분이 이러한 이유로 이렇게 고쳐진다」라고 보여줄 수 있는 것만을 지적한다. 확신도가 낮은 리듬 관련 사항은 〔조언〕으로 분류하여, 확신도를 솔직하게 나누어 보여준다.

위양성(False Positive)을 억제하는 것이 결함 검출기의 생명선이다. 따라서 문학적·캐주얼한 문체에서는 반복 강조나 의도적인 어격(語格) 전환도 「정당하다」고 판단하여 지적하지 않는다.

2가지 스킬

배포물은 Claude Code의 플러그인이며, 스킬은 2가지다.

jp-style-check: 일본어의 명쾌함만을 본다. 간결·명쾌·오해 없는 문장 + 일관성(용어·표기·어격). 「읽기 어렵다」, 「간결하게 해줘」, 「이거 번역투 아니야?」라고 느낄 때 사용한다.
logic-jp-check: 동일한 일본어 체크에 **논리층(logic layer)**을 더한다. 나미가와 료의 『사고·논리·분석』에 따라, 주장과 근거의 대응, 귀납·연역, MECE, 인과 관계를 점검한다. 문장뿐만 아니라 논증까지 보고 싶을 때 사용한다.

두 스킬은 체크의 핵심을 공유하며, logic-jp-check는 논리 섹션을 추가할 뿐이다.

도입

/plugin marketplace add Forest-Project-Lab/jp-writing-skills
/plugin install jp-writing-skills@jp-writing-skills

VSCode 확장 기능 버전의 경우

/Manage plugin

Marketplaces 탭에서 github 링크를 삽입하여 추가(adding)

github: https://github.com/Forest-Project-Lab/jp-writing-skills

Plugins 탭에서 설치(install)

도입 후에는 명시적으로 /jp-writing-skills:jp-style-check라고 호출해도 되고, 평범하게 "이 일본어를 다듬어줘", "이거 번역투 같지 않아?"라고 부탁하는 것만으로도 실행된다. 네트워크 통신은 하지 않으며, 실행 스크립트도 동봉하지 않는다. 단순한 지시문(prompt)일 뿐이다. 내용은 도입 전에 확인해 주길 바란다.

요약

AI의 일본어가 "너무 정돈되어 부자연스럽게" 보이는 정체의 대부분은, 직역 칼크(Calque, 번역 차용)가 만들어내는 번역투——특히 무생물 주어 구문이다. 이름 없는 위화감은 고칠 수 없지만, 이름을 붙여주면 고칠 수 있다.

그리고 정돈되어 보이는 AI의 문장일수록 찾아내기 어렵다. 실제로 AI에게 쓰게 하여 공개한 자신의 기사에서 5건이 발견되었다. 그렇기에 감각이 아니라 반증 가능한 결함으로서, 위치와 이유와 수정 방법을 통해 타격할 수 있는 도구를 만들었다. 아름다움은 채점하지 않는다. 할 수 없는 것을 "할 수 있다"라고 말하지 않는 것이 유일한 성실함이라고 생각한다.

"내 문장이 읽기 불편하지만 어디가 잘못되었는지 언어화할 수 없다"——그 언어화를 기계의 쪽에 맡기고 싶은 사람에게.

AI의 일본어가 '너무 정돈되어 부자연스러운' 정체는 '칼크(번역투)'였다 — 고품질 일본어 문장을 생성하는 스킬을 만들었다

요약

핵심 포인트