OKF를 사용하여 WordPress를 오픈 지식 그래프(Open Knowledge Graph)로 전환하기
요약
WordPress의 HTML 기반 콘텐츠를 AI 친화적인 오픈 지식 포맷(OKF)으로 전환하여 구조화된 지식 그래프를 구축하는 방법을 소개합니다. 이를 통해 AI 시스템이 데이터 간의 관계를 더 쉽게 이해하고 활용할 수 있는 환경을 제공합니다.
핵심 포인트
- HTML 중심의 CMS 콘텐츠를 AI 친화적인 구조로 변환 필요
- OKF를 활용하여 Markdown 기반의 경량화된 지식 그래프 구축
- 구조화된 지식 표현을 통해 AI 데이터 수집 및 활용성 증대
- Git 친화적이고 벤더 독립적인 지식 관리 가능
수년 동안 콘텐츠 관리 시스템(CMS)은 사람과 검색 엔진에 최적화되어 왔습니다.
페이지(Pages), 포스트(posts), 분류 체계(taxonomies), 사용자 정의 포스트 유형(custom post types), 카테고리(categories), 태그(tags), 그리고 내부 링크(internal links)는 모두 웹에 콘텐츠를 게시하는 데 효과적으로 작동합니다.
하지만 현대의 AI 시스템은 다른 것을 필요로 합니다.
그들은 구조(structure)가 필요합니다.
그들은 관계(relationships)가 필요합니다.
그들은 지식(knowledge)이 필요합니다.
이 지점에서 오픈 지식 포맷 (Open Knowledge Format, OKF)이 흥미로워집니다.
문제점 (The Problem)
대부분의 WordPress 웹사이트는 가치 있는 지식을 포함하고 있습니다.
부동산 웹사이트에는 다음과 같은 내용이 포함될 수 있습니다:
- 프로젝트 (Projects)
- 개발자 (Developers)
- 도시 (Cities)
- 매물 (Properties)
SaaS 웹사이트에는 다음과 같은 내용이 포함될 수 있습니다:
- 기능 (Features)
- 문서 (Documentation)
- 가이드 (Guides)
- 통합 (Integrations)
- FAQ
대학교 웹사이트에는 다음과 같은 내용이 포함될 수 있습니다:
- 강의 (Courses)
- 학과 (Departments)
- 교수 (Professors)
- 연구 논문 (Research papers)
정보는 존재합니다.
관계도 존재합니다.
하지만 지식은 HTML 페이지 안에 갇혀 있습니다.
사람들에게는 괜찮습니다.
하지만 AI 시스템에게는 이상적이지 않습니다.
OKF란 무엇인가? (What Is OKF?)
Open Knowledge Format (OKF)는 Google Cloud에서 Markdown 파일을 사용하여 지식을 표현하는 경량화된 방식으로 도입한 오픈 사양(open specification)입니다.
지식을 그래프 데이터베이스(graph database)나 독점적인 형식(proprietary format)에 저장하는 대신, OKF는 다음을 사용합니다:
- 디렉토리 (Directories)
- Markdown 문서 (Markdown documents)
- 메타데이터 (Metadata)
- 링크 (Links)
모든 문서는 하나의 개념(concept)이 됩니다.
모든 링크는 하나의 관계(relationship)가 됩니다.
그 결과, 휴대 가능하고 AI 친화적인 지식 그래프(knowledge graph)가 만들어집니다.
왜 WordPress인가? (Why WordPress?)
WordPress는 웹의 상당 부분을 구동합니다.
그럼에도 불구하고 대부분의 WordPress 콘텐츠는 여전히 HTML로 배포됩니다.
만약 우리가 WordPress 콘텐츠를 OKF 문서로 변환할 수 있다면, 다음과 같은 이점을 얻을 수 있습니다:
- 구조화된 지식 표현 (Structured knowledge representation)
- 더 나은 AI 데이터 수집 (Better AI ingestion)
- 휴대 가능한 지식 그래프 (Portable knowledge graphs)
- 벤더 독립성 (Vendor independence)
- 사람이 읽을 수 있는 저장 방식 (Human-readable storage)
- Git 친화적인 버전 관리 (Git-friendly versioning)
지식 계층 구축하기 (Building Knowledge Layer)
이 아이디어를 탐구하기 위해, 저는 Knowledge Layer를 구축했습니다:
https://github.com/wooserv/wp-knowledge-layer
Knowledge Layer는 WordPress 콘텐츠를 Open Knowledge Format (OKF) 문서로 동기화하는 WordPress 플러그인입니다.
목표는 간단합니다:
WordPress 콘텐츠를 지속 가능한 Markdown 기반의 지식 그래프 (Knowledge Graph)로 변환하는 것입니다.
이 플러그인은 다음을 지원합니다:
- 페이지 (Pages)
- 포스트 (Posts)
- 사용자 정의 포스트 타입 (Custom Post Types)
- 분류 체계 (Taxonomies)
- 내부 링크 (Internal links)
- 증분 동기화 (Incremental synchronization)
모든 것을 반복해서 다시 구축하는 대신, 콘텐츠가 변경될 때마다 동기화됩니다.
작동 방식 (How It Works)
콘텐츠가 게시될 때:
- WordPress 콘텐츠를 탐색합니다.
- HTML을 Markdown으로 변환합니다.
- 메타데이터 (Metadata)를 추출합니다.
- 내부 링크를 재작성합니다.
- OKF 문서를 생성합니다.
- 지식 그래프 (Knowledge Graph)를 업데이트합니다.
결과물인 파일들은 인간과 AI 시스템 모두가 읽을 수 있는 상태로 유지됩니다.
왜 Markdown인가? (Why Markdown?)
Markdown은 여러 가지 장점을 제공합니다:
- 사람이 읽기 쉬움 (Human-readable)
- 버전 관리 가능 (Version controllable)
- 휴대성 (Portable)
- AI 친화적 (AI-friendly)
- 검사 용이 (Easy to inspect)
- 아카이빙 용이 (Easy to archive)
가장 중요한 점은, Markdown이 특수한 인프라를 요구하지 않는다는 것입니다.
미래 (The Future)
AI 시스템이 구조화된 지식을 점점 더 많이 소비함에 따라, 웹사이트에는 페이지와 포스트 이상의 것이 필요합니다.
웹사이트는 자신의 지식을 개방적이고 휴대 가능한 형식으로 노출할 방법이 필요합니다.
OKF는 유망한 기반을 제공합니다.
WordPress는 이미 지식을 포함하고 있습니다.
다음 단계는 그 지식을 접근 가능하게 만드는 것입니다.
Knowledge Layer는 그 격차를 메우기 위한 하나의 시도입니다.
참고 문헌 (References)
Google Cloud:
https://cloud.google.com/blog/products/data-analytics/how-the-open-knowledge-format-can-improve-data-sharing
Open Knowledge Format Specification:
https://github.com/GoogleCloudPlatform/knowledge-catalog/blob/main/okf/SPEC.md
커뮤니티 자료:
[https://suganthan.com/blog/open-knowledge-format/]
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기