FUTO Swipe: 오픈 소스 키보드가 어떻게 Google Gboard를 상대로 승리했는가

2026년 6월 24일 게시 — TekMag

휴대폰 키보드에서 스와이프(swipe)를 하여 타이핑할 때, 여러분은 아마도 수십억 달러의 R&D(연구개발) 비용, 무제한의 클라우드 컴퓨팅(cloud compute), 그리고 10년 치의 데이터를 보유한 Google의 Gboard가 가능한 최고의 정확도를 제공할 것이라고 가정할 것입니다. 그 가정이 방금 깨졌습니다.

Android용 오픈 소스 FUTO Keyboard 내부에 탑재된 신경망 스와이프 엔진(neural swipe engine)인 FUTO Swipe는 이제 일대일 벤치마크(benchmark)에서 7.38%의 top-1 오류율(error rate)을 달성했습니다. 이는 Gboard의 11.05%보다 26% 개선된 수치입니다. 게다가 이 엔진은 단 130만 개의 활성 파라미터(active parameters)만으로 기기 내에서 완전히 오프라인(offline)으로 작동합니다.

이것은 단순한 과장 광고가 아닙니다. 벤치마크 결과가 공개되었고, 모델 가중치(model weights)는 Hugging Face에 있으며, 소스 코드(source code)는 GitHub에 있습니다. 여기 독립적인 오픈 소스 프로젝트가 가장 기본적인 모바일 경험 중 하나에서 어떻게 Google을 상대로 Google을 앞질렀는지 그 방법을 소개합니다.

모든 것을 바꾼 벤치마크

FUTO가 공개한 벤치마크는 수천 개의 스와이프 입력에 대해 네 가지 키보드를 비교합니다:

이전 FUTO 버전으로부터의 개선은 훨씬 더 놀랍습니다. 바로 오류율이 4.6배 감소했다는 점입니다. 이것은 점진적인 업데이트가 아니라, 키보드가 스와이프를 이해하는 방식에 대한 완전한 재작성(rewrite)입니다. 여러분은 swipe.futo.tech에서 직접 수치를 확인할 수 있습니다.

비결: 작은 AI, 스마트한 아키텍처 (Architecture)

FUTO Swipe의 성취가 놀라운 이유는 단순히 Gboard를 이겼기 때문이 아니라, 어떻게 Gboard를 이겼느냐에 있습니다. 이 시스템은 3단계 신경망 아키텍처(three-stage neural architecture)를 사용하며, 전체 활성 파이프라인(active pipeline)의 무게는 단 1,364,271개의 파라미터에 불과합니다. 이는 FP32 기준으로 약 10MB 정도입니다.

참고로, 최신 대규모 언어 모델 (Large Language Models, LLM)은 수천억 개의 파라미터(parameters)에 달합니다. 이것은 과장된 홍보를 거부하는 AI 이야기이며, Moebius: How a 0.22B AI Model Matches 10B+ Giants at Image Inpainting와 같이 우리가 다루었던 다른 최근의 돌파구들과 맥을 같이 합니다. 해당 사례에서 아주 작은 모델은 자신의 체급을 훨씬 뛰어넘는 성능을 보여주었습니다.

3단계 파이프라인 (The Three-Stage Pipeline)

1. 인코더 (Encoder, 635K 파라미터) — 타임스탬프가 포함된 가공되지 않은 (x, y) 터치 궤적 데이터를 입력받아 타임스텝(timestep)별 문자 방출(character emissions)을 생성하는 1D 시간적 합성곱 신경망 (1D Temporal Convolutional Network, TCN)입니다. 결정적으로, 이 인코더는 레이아웃에 구애받지 않습니다 (layout-agnostic). 키 좌표에 적용된 DCT 기저(basis)를 사용하여 런타임 시 제공되는 어떤 키보드 레이아웃과도 작동합니다. Colemak이나 Dvorak으로 전환하더라도 재학습 없이 그대로 작동할 수 있습니다.

2. 디코더 (Decoder, 304K 파라미터) — 특히 영어 QWERTY 레이아웃에 맞춰 인코더의 출력을 정제하는 작은 DFSMN (Deep Feedforward Sequential Memory Network)입니다. 이곳이 레이블이 지정된 스와이프 데이터가 가장 중요하게 작용하는 지점입니다.

3. 문맥 언어 모델 (Context LM, 1.5M 파라미터) — 대규모 어휘를 위한 해시 임베딩 (hash embeddings)을 갖춘 인과적 DFSMN (causal DFSMN)으로, 다음 단어 예측 및 빔 재순위화 (beam reranking)를 처리합니다. 스와이프 데이터 없이 텍스트 데이터만으로 학습되었습니다.

전체 모델은 2024년 8월부터 2025년 3월 사이에 swipe.futo.org를 통해 자원봉사자들로부터 수집된 122만 개의 스와이프 커뮤니티 기여 데이터셋을 사용하여 단 한 대의 워크스테이션 GPU에서 학습되었습니다. 이 데이터셋은 MIT 라이선스 하에 완전히 공개되어 있으며 Hugging Face에서 이용 가능합니다.

이러한 커뮤니티 주도적이고 효율적인 모델 이야기는 우리가 다루었던 또 다른 오픈 소스 AI 이정표인 GLM-5.2: Open-Source AI Model Beats GPT-5.5 for 1/6 the Cost와 평행을 이룹니다. 이는 오픈 생태계가 폐쇄적인 (walled-garden) AI 제품들과 경쟁하고 이를 이길 수 있음을 증명합니다.

ClearFlow: 스와이프를 위해 설계된 키보드 레이아웃

FUTO는 신경 엔진(neural engine)에서 멈추지 않았습니다. 그들은 스와이프 타이핑(swipe typing)에 특화되어 알고리즘적으로 최적화된 키보드 레이아웃인 ClearFlow를 개발했습니다. 약 800,000개의 레이아웃을 테스트함으로써, FUTO는 공선 삼그램(colinear trigrams, 세 개의 키가 일직선으로 배열되어 스와이프 궤적에 모호함을 유발하는 시퀀스)을 최소화하는 키 배열을 설계했습니다. 초기 사용자들은 표준 QWERTY 키보드와 비교했을 때 "오해석이 적고 수정이 덜 필요하여 덜 답답하다"라고 보고하고 있습니다.

프라이버시 우선의 차별점

아마도 가장 극적인 차별점은 FUTO Swipe가 하지 않는 기능일 것입니다. 스와이프 엔진, 자동 수정(autocorrect), 다음 단어 예측(next-word prediction), 그리고 받아쓰기(dictation)를 포함한 키보드 전체가 100% 오프라인으로 작동합니다. 어떤 데이터도 기기를 떠나지 않습니다. 텔레메트리(telemetry)도, 추적(tracking)도 없습니다.

클라우드 기반 예측을 위해 타이핑 데이터를 Google 서버로 전송하는 Gboard나, 현재 연결성을 요구하는 광고 및 AI 기능을 통합하고 있는 SwiftKey와 비교해 보십시오. FUTO의 접근 방식은 해당 조직의 설립 철학인 **"컴퓨터는 당신의 것입니다(Computers Belong to You)."**와 일치합니다.

이러한 프라이버시 중심의 입장은 우리가 The Coming Loop: How AI Harness Engineering is Quietly Rewriting Software Development에서 탐구했던 AI 지원 소프트웨어의 광범위한 트렌드의 일부입니다. 즉, 차세대 도구들은 사용자의 주체성(user agency)과 로컬 실행(local execution)을 최우선으로 합니다.

FUTO 생태계

FUTO Swipe는 억만장자 자선가인 Eron Wolf가 자금을 지원하는 기술 독립 조직인 FUTO(futo.org)에서 탄생했습니다. 과거 수리할 권리(right-to-repair) 옹호자인 Louis Rossmann이 커뮤니케이션 디렉터로 활동했으나(그는 2025년 2월에 떠났습니다), FUTO는 Immich(사진 백업), Grayjay(크리에이터 중심 비디오 플랫폼), Polycentric(탈중앙화 소셜), FCast, 그리고 Live Captions에도 자금을 지원합니다. 이 모든 프로젝트는 의도적인 반(反) VC(venture capital), 반(反) 감시 자본주의(anti-surveillance-capitalism) 사명을 띠고 있습니다.

FUTO Keyboard 앱은 Google Play Store, F-Droid, 또는 GitHub를 통한 직접 APK 다운로드(최신 버전: v0.1.29.1, 2026년 6월 22일)로 이용할 수 있습니다. 이 앱은 구독 방식이 아닌 일회성 구매 (one-time purchase) 모델을 사용하지만, 라이선스 구조는 복잡합니다. 키보드 앱은 FUTO의 Source First License (OSI 인증 오픈 소스는 아님)를 사용하며, 스와이프 라이브러리는 GPLv3, 데이터셋은 MIT 라이선스를 따릅니다. 50억 달러짜리 질문은 이것입니다: 완전히 오픈 소스가 아닌 라이선스 모델이 커뮤니티의 채택을 늦출 것인가? HN(Hacker News) 커뮤니티는 확실히 의견이 분분했습니다 — 토론은 357포인트에 도달하며 메인 페이지 4위에 올랐습니다.

주의사항: FUTO Swipe가 아직 구현하지 못한 것들

균형 잡힌 분석을 위해서는 FUTO Swipe의 부족한 점도 인정해야 합니다:

Android 전용 — iOS 버전 계획 없음. 일정 미정.
영어 QWERTY 디코더 (English QWERTY decoder) — 인코더(encoder)는 어떤 레이아웃과도 작동하지만, 정교한 디코더(decoder)는 영어 QWERTY 전용입니다. 다른 레이아웃은 '매우 뛰어난' 수준이 아닌 '괜찮은' 수준의 정확도를 보입니다.
다국어 동시 타이핑 불가 — 2개 이상의 언어에서 동시에 스와이프를 인식하는 Gboard의 기능이 없습니다. 사용자는 수동으로 언어를 전환해야 합니다.
GIF 검색 불가 — 이념적인 결정입니다: FUTO는 GIF 검색을 광고와 추적의 매개체로 간주합니다.
134MB의 앱 크기 — 대부분 음성 모델(Whisper 기반 오프라인 받아쓰기) 때문입니다. 핵심 키보드 크기는 15MB 미만입니다.
UX 완성도 부족 — 왼쪽 스와이프하여 삭제(SwiftKey의 주요 기능)가 불가능하며, 가끔 무작위로 대문자가 입력되거나 자동 수정(autocorrect) 동작이 불안정한 경우가 있습니다.

결론

FUTO Swipe는 모바일 기술 분야에서 진정한 '다윗과 골리앗'의 순간을 보여줍니다. 79명의 기여자, 2,700개의 GitHub 스타, 그리고 커뮤니티가 기여한 데이터셋을 보유한 이 오픈 소스 (open-source) 프로젝트는 단 하나의 GPU로 학습되고 완전히 오프라인 (offline)으로 작동하며, Google을 그들의 방식대로 이겨낸 지구상에서 가장 정확한 스와이프 (swipe) 키보드 중 하나를 만들어냈습니다.

모든 사람에게 Gboard를 대체할 수는 없을 것입니다. 특히 다국어 사용자나 iOS 사용자들에게는 더욱 그렇습니다. 하지만 개인정보 보호 (privacy)를 중시하거나, 독립적인 소프트웨어를 지원하고 싶거나, 혹은 단순히 가능한 최고의 스와이프 정확도를 원하는 수백만 명의 Android 사용자들에게 Swipe 기능이 포함된 FUTO Keyboard는 새로운 표준입니다.

지금 keyboard.futo.org에서 이용할 수 있습니다.

대표 이미지: Android에서 실행 중인 FUTO Keyboard (출처: keyboard.futo.org, 홍보 자료).

원문은 TekMag에 게시되었습니다.

FUTO Swipe: 오픈 소스 키보드가 어떻게 Google Gboard를 상대로 승리했는가

요약

핵심 포인트

FUTO Swipe: 오픈 소스 키보드가 어떻게 Google Gboard를 상대로 승리했는가

모든 것을 바꾼 벤치마크

비결: 작은 AI, 스마트한 아키텍처 (Architecture)

3단계 파이프라인 (The Three-Stage Pipeline)

ClearFlow: 스와이프를 위해 설계된 키보드 레이아웃

프라이버시 우선의 차별점

FUTO 생태계

주의사항: FUTO Swipe가 아직 구현하지 못한 것들

결론

댓글