Grammi의 영문 해석이 왜 「하이브리드 방식 (Rule x AI)」인지 해설

영문을 입력하는 것만으로 품사·구문·문형을 AI가 색상별로 분석하는 영어 학습 서비스 「Grammi」.

그 심장부인 영문 해석 엔진은 사실 「룰 기반(Rule-based) 자연어 해석」과 「AI 해석」의 하이브리드 방식으로 작동하고 있습니다.

이 기사에서는 Grammi가 왜 이러한 구성에 도달하게 되었는지, 그리고 내부에서 어떻게 두 가지 해석 엔진이 연계되고 있는지를 개발 과정의 시행착오와 함께 소개합니다.

처음에는 「AI 해석 온리」로 가능할 것이라 생각했다

Grammi의 초기 버전은 심플하게 AI (Claude 또는 ChatGPT)에게 모든 해석을 맡기는 구성이었습니다.

영문을 던지면 품사·SVOCM·청크(Chunk)·일본어 번역·패러프레이즈(Paraphrase)까지 일괄적으로 JSON을 반환받는 설계입니다.

처음에는 잘 작동하는 것처럼 보였고 실제로 단순한 영문에서는 문제없이 해석할 수 있었지만, 운영하는 과정에서 AI 단독으로는 넘을 수 없는 벽도 보이기 시작했습니다.

AI 해석 온리의 단점

과제	구체적인 예
결과가 흔들림	같은 영문을 던져도 실행할 때마다 SVOCM 할당이 미묘하게 변함
자신만만하게 틀림 (할루시네이션 (Hallucination))	"to + 동사"를 매번 O라고 주장하거나, 존재하지 않는 조동사를 생성하는 등
예외적인 구문에 약함	도치·가정법·형식 주어·there 구문·분사구문에서 정밀도가 떨어짐
비용과 레이턴시 (Latency)	전부 AI에게 맡기면 토큰 소비량과 응답 시간도 늘어남

「학습 서비스로서 매번 답이 흔들리는 것은 좋지 않다」. 이것이 개선의 필요성을 느낀 첫 번째 문제였습니다.

그렇다면 룰 기반만으로 만들 수 있을까?

다음에 검토한 것이 「룰 기반 해석 온리」 방향성이었습니다.

spaCy (영어 NLP 라이브러리)를 사용하면 품사 태그·의존 구조는 거의 기계적·결정론적으로 취득할 수 있습니다.

She saw her run.
PRON VERB PRON VERB
nsubj ROOT dobj xcomp

dep (의존 레이블)을 보면,
nsubj → S / ROOT(VERB) → V / dobj → O
와 같이 SVOCM으로 사상(Mapping)할 수 있을 것 같습니다.

실제로 어느 정도 수준까지는 이것으로 작동합니다.

룰 기반만의 단점

과제	구체적인 예
의미적인 판단을 할 수 없음	`that` 절이 O (목적어절)인지 C (보어)인지를 문맥으로 판단할 수 없음
확장 레이블을 붙일 수 없음	「형식 주어 it」, 「진주어 to 부정사」, 「호칭」, 「조건절」 등의 "학습자용 레이블"을 내놓을 수 없음
일본어 번역·해설·패러프레이즈를 내놓을 수 없음	이것은 구조 해석의 역할이 아니라 생성형 AI의 영역임
도치·생략·구어 표현에 약함	spaCy의 구조 해석 자체가 흔들림

기계적이고 안정적이지만, 영어 학습자에게 정말로 필요한 「의미적인 해설」이 없다. 이것이 룰 기반 단체의 한계였습니다.

「양쪽의 장점을 취하는」 하이브리드 방식

그래서 Grammi가 채택한 것이, 룰 기반으로 골격을 추출하고 AI로 의미를 보완하는 2단계 파이프라인입니다.

영문 입력
│
▼
...

포인트는 AI에게 「전부 생각해내」라고 말하는 것이 아니라, **「이미 절반 정도 조립된 골격이 있다. 이것을 검증·확장해줘」**라고 부탁하는 부분입니다.

spaCy → AI로의 힌트 전달

spaCy의 해석 결과는 AI 프롬프트에 <spacy_analysis> 태그로 심어서 전달합니다.

<spacy_analysis>
토큰 목록 (spaCy 해석 결과):
[0] She pos=PRON dep=nsubj → S (고신뢰)
...

AI에 대한 지시는 명확합니다.

svocm_confidence: high인 토큰은 강력하게 존중할 것
low나 「미정」인 토큰은 AI가 스스로 판정할 것
spaCy가 명백히 틀렸다면 AI가 덮어써도 좋을 것

즉 **「룰 기반은 초안, AI는 정서(清書)」**라는 관계성입니다.

역할 분담의 전체상

최종적으로 각각의 해석 엔진이 담당하는 업무는 다음과 같이 정리되었습니다.

spaCy (룰 기반)가 담당하는 것

토큰 분할 (축약형 I'm, don't 등)

의 분리 포함) - 품사 태깅 (Part-of-Speech Tagging; NOUN / VERB / ADJ / ADP / AUX …)

의존 구조 분석 (Dependency Parsing; nsubj / dobj / ROOT / attr …)
형태소 분석 (Morphological Analysis; Tense / VerbForm / Voice …)
SVOCM 1차 매핑 (신뢰도 포함)

AI (Claude)가 담당하는 것

SVOCM 최종 확정 (모호한 케이스 / 도치 / 복문 해결)
확장 레이블 (Extended Labels; O절 / 형식 주어 / 진주어 / 호칭 / 조건절 / 분사 …)
문형 판정 (제1~5문형 / 수동태 / 명령문)
자연스러운 일본어 번역
문법 해설
청크 분할 (의미 단위 + 강약 마크)
패러프레이즈 (Paraphrase) 3가지 스타일 (Concise / Casual / Formal)
어휘 픽업 (최대 5개 단어, IPA · 의미 · 태그)
문법 오류 검출
난이도 판정 (Lv 1~5)

'객관적인 구조 분석'은 spaCy에게, '의미적·교육적 해설'은 AI에게 맡기는 식으로 깔끔하게 분업이 이루어져 있음을 알 수 있습니다.

하이브리드화로 무엇이 바뀌었나

전환한 결과, 많은 개선이 나타났습니다.

분석 결과가 안정됨: 뼈대는 spaCy가 결정하므로 매번 결과가 흔들리지 않게 됨
할루시네이션 (Hallucination)이 감소함: AI가 '제로 베이스에서 구축'하는 것이 아니라 '검증'하는 입장이 되었기 때문
예외 구문에 대한 대응이 좋아짐: spaCy의 sentence_info (수동태 / there 구문 / 종속절 플래그)를 통해 AI에 사전 정보를 전달할 수 있음
AI 비용이 절감됨: AI가 구조를 처음부터 추측하는 데 드는 토큰 소비를 줄임
확장 레이블이 무너지지 않음: '형식 주어', '진주어'와 같은 학습자용 레이블이 안정적으로 붙게 됨

개발자 관점에서는 '정답이 명확한 부분은 규칙(Rule), 해석이 필요한 부분은 AI'라는 깔끔한 책임 분담이 이루어짐으로써 코드로서도 유지보수하기 쉬운 구성이 되었습니다.

앞으로의 업데이트

물론, 아직 계속해서 시행착오를 겪는 중입니다.

spaCy가 취약한 도치, 가정법, 구어체 표현의 정밀도 향상
AI 프롬프트 (Prompt) 튜닝 (신뢰도 처리 방식을 세밀하게 제어)
규칙 기반 (Rule-based) 측에서 흡수할 수 있는 범위를 더욱 넓혀 AI 비용 절감

영어 학습자분들이 '문장 구조가 보인다!'라고 느낄 수 있는 도구를 목표로, 매일 업데이트를 거듭해 나가겠습니다 🙇

마치며

'AI에게 모든 것을 맡기는 것'이 아니라, 'AI에게 무엇을 맡기고 무엇을 맡기지 않을 것인가'를 설계하는 것.

AI 프로덕트 개발에서 중요한 사고방식이 아닐까 생각했습니다.

영어 문장 구조의 '시각화'를 꼭 한번 체험해 보세요 ✨

Insights