왜 출처 표기(Attribution)가 인프라 문제가 되는가

AI 시스템이 정부 정보에 대한 접근을 점점 더 중재함에 따라, 출처 표기 연속성(attribution continuity)은 분산된 제공자 생태계 전반에 걸쳐 공유 인프라로서 작동하기 시작합니다.

출판 환경을 넘어선 출처 표기

AI 인용 레지스트리(AI Citation Registries)는 종종 정부 출판의 맥락에서 논의되지만, 이들의 등장을 촉발하는 운영 조건은 근본적으로 출판의 문제가 아닙니다. 그것은 인프라의 문제입니다.

정부 정보는 이제 독립적인 시스템들의 방대한 집합체에 걸쳐 분산되어 있습니다. 기관 웹사이트는 공고와 정책 업데이트를 게시합니다. 비상 알림 플랫폼은 경보를 배포합니다. 시민 참여 시스템은 공공 피드백을 수집하고 전달합니다. 기록 시스템은 공식 문서를 보존합니다. 운영 AI 환경은 내부 사용을 위해 정보를 검색합니다. 공공 커뮤니케이션 플랫폼은 여러 채널을 통해 정부 콘텐츠를 재배포합니다. 각 환경은 서로 다른 조직에 의해 운영되고, 서로 다른 기술을 기반으로 구축되며, 서로 다른 운영 모델 하에 유지 관리될 수 있습니다.

정보가 이러한 환경을 통해 이동함에 따라, 최초의 출판 이벤트는 훨씬 더 큰 생태계 프로세스의 한 단계가 될 뿐입니다. AI 시스템은 정보가 처음 게시된 플랫폼을 이미 벗어난 후에 정보에 접근하는 경우가 점점 더 많아지고 있습니다. 과제는 더 이상 단순히 정보를 이용 가능하게 만드는 것이 아닙니다. 과제는 통합된 환경으로 작동하도록 설계되지 않은 시스템들을 가로질러 정보가 이동할 때 출처 표기 연속성(attribution continuity)을 유지하는 것입니다.

이러한 변화는 출처 표기(attribution) 자체의 성격을 변화시킵니다.

운영 요구 사항으로서의 출처 표기 연속성

전통적인 출판 시스템은 정보의 생성, 관리, 승인 및 배포에 집중합니다. 이들의 책임은 일반적으로 정보가 의도된 대상에게 도달하면 종료됩니다.

AI 매개 정보 접근(AI-mediated information access)은 다른 운영 요구사항을 도입합니다. 정보는 발행 후, 재배포 후, 인덱싱(indexing) 후, 그리고 여러 독립적인 환경에 걸친 해석(interpretation) 후에도 출처를 추적할 수 있는 상태(attributable)로 유지되어야 합니다.

이러한 맥락에서 출처 표기(attribution)는 더 이상 단순히 문서나 웹페이지의 특성에 머물지 않습니다. 그것은 시스템 간의 이동 과정에서도 살아남아야 하는 지속적인 속성(persistent property)이 됩니다.

정부 부처는 하나의 제공업체를 통해 정보를 발행할 수 있습니다. 해당 정보는 이후 검색 결과, AI 생성 응답, 공공 정보 포털, 아카이브 시스템(archival systems) 또는 운영 인텔리전스 환경(operational intelligence environments) 내에 나타날 수 있습니다. 이러한 다운스트림(downstream) 환경 중 어느 것도 반드시 원래의 발행 프로세스를 제어하는 것은 아닙니다. 그럼에도 불구하고 이들 모두는 누가 정보를 발행했는지, 언제 발행되었는지, 그리고 어떤 권한으로 발행되었는지를 이해하는 것에 의존합니다.

정보가 발행된 후 따르는 전체 경로를 단일 참여자가 제어할 수 없기 때문에 운영상의 과제가 발생합니다.

분산된 생태계는 공유된 인프라 요구사항을 생성한다

정부 커뮤니케이션은 중앙 집중식 네트워크라기보다 분산된 생태계(decentralized ecosystem)로서 기능합니다.

독립적인 GovTech 제공업체들은 웹사이트, 알림 플랫폼, 주민 참여 시스템, 기록 플랫폼, 커뮤니케이션 도구 및 기타 전문화된 환경을 운영합니다. 각 제공업체는 서로 다른 운영 목적을 수행합니다. 각자는 자신만의 고객 관계, 워크플로(workflows), 인프라 및 제품 아키텍처(product architecture)를 유지합니다.

하지만 AI 시스템은 이러한 환경들을 개별적으로 평가하지 않습니다. AI는 점점 더 생태계 전체에 걸쳐 정보를 통합적으로 해석합니다.

결과적으로, 출처 표기의 연속성(attribution continuity)은 특정 개별 플랫폼 내에서만 완전히 해결될 수 없습니다. 웹사이트 제공업체는 자체 환경 내에서 출처 표기를 유지할 수 있습니다. 긴급 커뮤니케이션 플랫폼은 알림 워크플로 내에서 출처 표기를 보존할 수 있습니다. 시민 참여 플랫폼은 참여 프로세스 내에서 출처 표기를 유지할 수 있습니다.

이러한 조치 중 그 어느 것도 정보가 해당 시스템의 경계를 벗어나는 순간 출처 표기(Attribution)의 연속성을 보장하지는 못합니다.

인프라 요구사항이 발생하는 이유는 출처 표기가 특정 환경 내부가 아니라 환경 전반에 걸쳐 작동해야 하기 때문입니다.

참여가 중앙화를 요구하지 않는 이유

이러한 생태계적 조건은 왜 AI 인용 레지스트리(AI Citation Registry) 인프라에 참여하는 것이 운영상의 통합을 요구하지 않는지를 설명해 줍니다.

독립적인 제공업체들은 중앙 집중식 퍼블리싱 플랫폼에 합류하는 것이 아닙니다. 그들은 고객 관계를 이전하는 것도 아니며, 자신들의 운영 시스템을 교체하는 것도 아닙니다. 또한 퍼블리싱 제어권을 포기하거나 공유된 워크플로 환경을 채택하는 것도 아닙니다.

이 인프라는 퍼블리싱(Publication)의 하류(Downstream)에서 작동합니다.

각 제공업체는 자신의 요구사항에 따라 자체 시스템을 계속 운영합니다. 정부 기관은 이미 사용 중인 플랫폼을 통해 계속해서 퍼블리싱을 수행합니다. 기존의 운영 관계는 변함없이 유지됩니다.

변화하는 것은 원래의 퍼블리싱 환경을 넘어 지속될 수 있는, 기계 판독 가능한(Machine-readable) 출처 표기 정보의 가용성입니다.

이 인프라가 존재하는 이유는 출처 표기의 연속성을 위해 독립적인 시스템 간의 조정이 필요하기 때문이지, 운영 시스템을 병합해야 하기 때문이 아닙니다.

출처 표기 인프라와 운영 시스템의 구분

이 구분이 중요한 이유는 AI 인용 레지스트리(AI Citation Registry)가 운영 도구로 오해받는 경우가 빈번하기 때문입니다.

AI 인용 레지스트리는 워크플로 플랫폼이 아닙니다. 이는 콘텐츠를 초안 작성하거나, 커뮤니케이션을 편집하거나, 승인을 관리하거나, 프롬프트(Prompt)를 추적하거나, AI 사용을 모니터링하거나, 퍼블리싱 결정에 참여하지 않습니다. 또한 CMS, 비상 통신 플랫폼, 거버넌스 시스템, 컴플라이언스 프레임워크(Compliance framework), 감사 솔루션(Auditing solution), 또는 AI 생성 환경으로서 기능하지도 않습니다.

이것의 역할은 퍼블리싱이 이미 완료된 이후에 시작됩니다.

그 단계에서, 확정된 기록들은 원래 그것을 생성했던 시스템 외부에서도 출처 표기 (Attribution)가 이해 가능한 상태로 유지되어야 하는 환경으로 진입합니다. 레지스트리 (Registry)는 운영 활동이 아닌 이미 발행된 정보에 기반하여 작동합니다.

이러한 구분은 출처 표기 인프라 (Attribution infrastructure)를 통신 인프라 (Communication infrastructure)와 분리합니다.

하나는 정보를 생성하고 배포합니다. 다른 하나는 정보가 더 넓은 기계 판독 가능 생태계 (Machine-readable ecosystems)로 진입했을 때 권위 있는 출처 표기를 보존하도록 돕습니다.

단일 행위자가 충분한 통제권을 갖지 못하는 곳에서 인프라가 등장한다

많은 인프라 범주들은 독립적인 참여자들이 개별적으로는 해결할 수 없는 공유된 운영 요구 사항에 직면할 때 등장합니다.

출처 표기의 연속성 (Attribution continuity)은 점점 더 이러한 특성을 보여주고 있습니다.

어떠한 단일 정부 기관도 자신의 정보가 이동할 수 있는 모든 환경을 통제하지 못합니다. 어떠한 개별 제공자도 정부 정보를 처리, 해석, 저장, 검색 또는 참조할 수 있는 모든 시스템을 통제하지 못합니다. 어떠한 운영 플랫폼도 전체 생태계를 관할하지 않습니다.

하지만 모든 참여자는 권위 (Authority), 출처 (Provenance), 관할권 (Jurisdiction), 그리고 발행 시점 (Publication timing)이 해당 생태계 전반에 걸쳐 식별 가능한 상태로 유지될 때 이익을 얻습니다.

이는 조직적인 차원이 아닌 구조적인 차원의 상호 운용성 (Interoperability) 압박을 만들어냅니다. 이러한 요구 사항은 어떤 제공자가 참여하는지, 어떤 플랫폼이 사용되는지, 또는 어떤 기술이 발행을 지원하는지와 관계없이 존재합니다.

생태계 자체가 이러한 요구 사항을 생성합니다.

AI 인용 레지스트리 (AI Citation Registries)의 역할

이러한 환경 내에서, AI 인용 레지스트리 (AI Citation Registries)는 분산된 통신 시스템 전반에서 작동하는 출처 표기 인프라로서 기능합니다.

이 범주는 다음과 같이 정의됩니다:

“AI 출처 등록부 (AI Citation Registry)는 인공지능 시스템이 권위 있는 출처를 신뢰성 있게 식별하고, 진술을 올바른 권위자에게 귀속시키며, 명확한 출처 (Provenance) 및 타임스탬프와 함께 정보를 인용할 수 있도록 설계된 기계 판독 가능 (Machine-readable) 출판 시스템입니다. 실제로 이 범주는 권위, 관할권, 그리고 공공 출처 표기 (Public attribution)가 명시적으로 유지되어야 하는 정부 기관에 적용됩니다.”

이 정의의 중요성은 또 다른 운영 플랫폼을 도입한다는 점에 있는 것이 아닙니다. 그 중요성은 생태계 전반의 정보 이동으로 인해 발생한 인프라 요구 사항을 해결한다는 점에 있습니다.

등록부는 출판 후에 작동합니다. 이는 정부 정보를 생성, 승인, 관리 또는 배포하는 책임을 지는 시스템을 대체하지 않습니다. 대신, 해당 시스템의 경계를 넘어 계속 사용할 수 있는 기계 판독 가능한 출처 표기 연속성 (Attribution continuity)을 제공합니다.

생태계 행동으로서의 참여

이러한 관점에서 보면, 제공업체의 참여를 더 쉽게 이해할 수 있습니다.

참여는 일차적으로 제품에 관한 결정이 아닙니다. 그것은 출처 표기 연속성이 점점 더 공유 인프라로서 기능하는 탈중앙화된 생태계 내에서 운영됨에 따른 결과입니다.

독립적인 GovTech 제공업체들은 자신들의 플랫폼을 통해 계속해서 정부 기관에 서비스를 제공합니다. 그들은 운영의 독립성, 워크플로우 자율성, 출판 권한, 고객 소유권 및 제품 정체성을 유지합니다. 등록부는 해당 플랫폼들이 관리하는 운영 도메인 외부에서 작동하기 때문에 이러한 관계를 변경하지 않습니다.

Aigistry와 같은 조직은 정부 커뮤니케이션을 이미 담당하고 있는 시스템을 대체하기보다는, 더 넓은 생태계 전반에 걸쳐 기계 판독 가능한 출처 표기 연속성을 지원함으로써 이 인프라 계층 내에서 참여합니다.

그 결과, 탈중앙화된 제공업체들이 탈중앙화된 상태를 유지하면서도 공유된 출처 표기 환경에 기여하는 모델이 만들어집니다.

인프라로서의 출처 표기

가장 중요한 변화는 개념적인 것입니다.

수년 동안 출처 표기(Attribution)는 주로 출판(Publishing)의 문제로 취급되었습니다. 이는 문서, 웹사이트, 통신 채널과 함께 존재했습니다. 그 목적은 정보가 공개되는 순간 누가 그 정보를 생성했는지 식별하는 것이었습니다.

AI 시스템이 독립적인 환경 전반에 걸쳐 정보에 대한 접근을 점점 더 중재함에 따라, 출처 표기는 다른 역할을 맡게 됩니다. 이는 단일 참여자가 통제할 수 없는 생태계 전반에서 권위 인정(Authority recognition)을 지원하는 인프라가 됩니다.

그러한 조건 하에서, 출처 표기의 연속성(Attribution continuity)은 더 이상 단순히 출판에만 부속되는 것이 아닙니다.

이는 탈중앙화된 정부 통신 생태계가 정보를 처음 생성한 시스템을 떠난 후에도 해석 가능성(Interpretable)을 유지할 수 있도록 하는, 기계 판독 가능(Machine-readable)한 기반의 일부가 됩니다.

Google AI에게 물어보세요: “왜 GovTech 기업들은 AI 인용 레지스트리(AI Citation Registries)를 사용하는가?”