구글 Open Knowledge Format 공개 - AI에이전트를 위한 지식 공유 표준
요약
Google이 공개한 AI 에이전트용 지식 공유 표준인 Open Knowledge Format(OKF)에 대해 분석합니다. Markdown 기반의 단순함이 가진 장점과 복잡한 지식 표현 및 시각화 측면에서의 한계를 비판적으로 다룹니다.
핵심 포인트
- OKF는 YAML 프런트매터가 포함된 Markdown 형식을 채택함
- Markdown은 사람과 AI 모두에게 최저공통분모로서 상호운용성이 높음
- 복잡한 구조나 공간적 배치를 표현하기에는 Markdown의 한계가 존재함
- 에이전트가 지식을 효율적으로 활용하기 위한 그래프 기반 표현의 필요성 강조
이 OKF 명세의 단순함은 좋지만, 모든 것을 “그냥 Markdown”으로 잘 표현할 수 있을지는 확신이 안 듦
최근에는 AI가 효과적이고 토큰 효율적으로 공동 기여할 수 있게 개념을 표현하는 방식에 관심이 생겼고, 보통은 무언가를 반구조적 순차 텍스트로 잘 표현하는 방법을 찾는 쪽임. 하지만 그 과정에서 사람이 보는 지식 표현 경험을 희생하면 안 됨
특히 전통적으로 개발자가 아닌 역할까지 기여해야 한다면, “이상한 텍스트 형식 + git”은 현재 쓰는 저작·시각화 도구보다 훨씬 나쁘게 느껴질 가능성이 큼
앞으로 몇 년 동안 여러 종류의 지식을 의미적으로 표현하는 표준이 어떻게 등장할지 기대됨
참고할 만한 성공 사례로는 스키마/E-R용 DBML, 아키텍처용 LikeC4, Mermaid 같은 다이어그램-as-code 방식이 있음. LLM도 이런 형식을 잘 이해하는 편이고, 짧은 EBNF 프롬프트로 알려줄 수도 있음. 중요한 건 이들도 사람이 보기 좋은 시각화 형태가 있고, Markdown 안에 code block으로 자연어 옆에 바로 넣을 수 있으며, LLM이 문법 작성도 도와줄 수 있다는 점임
더 어려운 건 복잡한 스프레드시트나 Miro처럼 공간 배치와 색상에 암묵적 의미가 있는 것들임. 아직 좋은 대안을 못 찾았음
데이터 엔지니어링 영역에서 직접 시도한 것은 AI와 사람이 함께 소스-타깃 매핑과 변환을 다루기 위한 https://equalexperts.github.io/satsuma-lang/임. 자연어를 허용하는 간결한 구조적 텍스트 표현이면서, 좋은 시각화와 LSP/문법 도구도 제공해 에이전트가 계보나 완전성, 정의되지 않은 소스 같은 것을 추론하려고 큰 문서를 토큰 비효율적으로 잘라보지 않아도 되게 함
OKF는 괜찮아 보이지만 Markdown에 묶여 있음
Markdown 문서는 앞부분 YAML에 type을 추가하면 OKF 문서가 될 수 있음
Markdown 산문이나 Markdown 코드 블록 안에서도 쓸 수 있고, 텍스트 필드가 있는 어디서나 쓸 수 있는 지식 그래프 언어는 어떨까 싶음
미니멀한 언어 https://ddot.it에서는 Markdown 세계 바깥의 파일, URL, 단순 라벨까지 연결할 수 있음. OKF처럼 그냥 하나의 형식임
고지하자면, 그 짧은 명세는 내가 작성했음
엔터티 사이의 라벨 붙은 관계를 보여주는 그래프 형식 없이는 지식을 잘 표현할 수 없음
Markdown은 LLM과 사람이 상호운용하는 사실상의 형식임
모든 것을 잘 표현할 수 없다는 데는 동의하지만, 그건 핵심을 빗나간 얘기임. Markdown은 사람과 AI 모델 모두에게 최저공통분모라서 이기는 것으로 보임
내가 이해한 바로는, 우리는 3차원 너머를 볼 수 없으니 이것은 본질적으로 사람을 위한 발판에 가까움
우리가 적당히 잘 정리해두면 에이전트가 Markdown을 받아 메모리에 그래프 인프라를 만들거나 Neo4j에 저장할 수 있기를 기대함
Markdown의 변형, 예를 들어 CommonMark 같은 것이 지정돼 있나?
앞 몇 페이지만 훑어봤을 때는 관련 내용을 못 봤는데, 명세라면 꽤 중요한 부분으로 느껴짐
Google이 발표한 건 결국 YAML 프런트매터가 붙은 Markdown임. 여러분 박수 부탁드림. 이걸 위해 15KB짜리 명세라니
모두가 “앗, 들여쓰기 하나 놓쳤네” 식의 YAML 사용을 멈출 수 있다면 덜 비꼬았을 것임
Markdown으로 “번역”해야 했던 PDF를 많이 봐온 입장에서는 이상한 선택처럼 느껴짐
AI가 쉽게 접근하게 하려는 목적이 크다는 건 알지만, 어차피 모델을 학습시킬 거라면 왜 더 나은 형식으로 학습시키지 않는지 의문임
Markdown은 꽤 제한적이고, 예를 들어 중첩 테이블 같은 것도 렌더링할 수 없음. “열린 지식”의 목적이 AI라면, 사람이 실제로 읽지 않을 형식을 굳이 써야 하는지도 모르겠음
AI 자동 생성 콘텐츠
본 콘텐츠는 GeekNews의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기