수익 손실 없이 AI 사용량을 추적하는 방법 (완전 가이드)

대부분의 AI 제품은 결국 동일한 문제에 직면합니다:

사용량을 추적하는 것은 간단해 보입니다.

하지만 그렇지 않은 순간이 옵니다.

처음에는 카운터(counter) 하나만 있으면 됩니다.

요청(request)이 들어옵니다.

크레딧(credit)을 하나 차감합니다.

요청을 처리합니다.

끝입니다.

적어도 대부분의 팀은 그렇게 생각합니다.

사용량이 늘어남에 따라, 문제들이 발생하기 시작합니다:

중복 요청 (duplicate requests)
재시도 (retries)
경쟁 상태 (race conditions)
타임아웃 실패 (timeout failures)
불일치하는 잔액 (inconsistent balances)
결제 불일치 (billing mismatches)

그리고 갑자기 단순한 카운터가 수익 문제로 변합니다.

순진한 구현 (The Naive Implementation)

대부분의 제품은 다음과 유사한 방식으로 시작합니다:

if (credits > 0) {
  credits--;
  executeRequest();
...

해롭지 않아 보입니다.

사용자는 크레딧을 가지고 있습니다.

요청이 도착합니다.

크레딧이 소비됩니다.

요청이 실행됩니다.

단순합니다.

문제는 실제 환경의 시스템이 이렇게 단순한 경우가 거의 없다는 점입니다.

무엇이 고장 나기 시작하는가

실제 사용자들이 대규모로 제품을 사용하기 시작하는 순간, 예상치 못한 상황들이 나타납니다.

재시도 (Retries)

네트워크는 실패합니다.

브라우저는 요청을 재시도합니다.

모바일 앱은 동작을 다시 보냅니다.

백그라운드 작업(background jobs)이 다시 실행됩니다.

단일 사용자의 동작이 여러 개의 동일한 요청을 생성할 수 있습니다.

보호 장치가 없다면, 크레딧이 여러 번 소비될 수 있습니다.

경쟁 상태 (Race Conditions)

사용자에게 크레딧이 하나 남아 있다고 가정해 봅시다.

두 개의 요청이 정확히 동시에 도착합니다.

두 프로세스 모두 잔액을 확인합니다.

두 프로세스 모두 사용 가능한 크레딧이 하나임을 확인합니다.

두 프로세스 모두 진행합니다.

이제 사용자는 하나만큼의 비용을 지불하고 두 개의 요청을 소비했습니다.

더 나쁜 경우는 다음과 같습니다:

잔액이 마이너스가 됩니다.

부분적 실패 (Partial Failures)

가장 위험한 상황 중 하나는 다음과 같습니다:

크레딧 소비
↓
AI 제공업체(AI provider) 호출
...

AI 제공업체가 요청을 처리했을까요?

그럴 수도 있습니다.

사용자가 결과를 받았을까요?

받지 못했을 수도 있습니다.

크레딧을 환불해야 할까요?

다시 청구해야 할까요?

이러한 상황들은 일관되게 처리하기가 놀라울 정도로 어려워집니다.

수익 누수가 발생하는 방식

대부분의 수익 누수는 가격 책정 실수에서 오는 것이 아닙니다.

추적 실수에서 발생합니다.

몇 가지 흔한 예시는 다음과 같습니다:

무료 사용 (Free Usage)

요청이 성공합니다.

크레딧이 전혀 소모되지 않습니다.

사용자는 무료로 가치를 얻습니다.

이중 청구 (Double Charging)

재시도 (Retry)가 발생하면 크레딧이 두 번 소모됩니다.

사용자는 예상보다 더 많은 금액이 청구됩니다.

이제 고객 지원 티켓(Support ticket)이 도착하기 시작합니다.

결제 불일치 (Billing Mismatch)

결제 대시보드에는 하나의 숫자가 표시됩니다.

사용량 기록에는 또 다른 숫자가 표시됩니다.

송장 (Invoice)에는 세 번째 숫자가 표시됩니다.

어느 숫자가 정확한지 아무도 모릅니다.

감사 추적 누락 (Missing Audit Trail)

고객이 질문합니다:

왜 제가 청구된 건가요?

당신에게는 정확히 어떤 일이 일어났는지 설명할 수 있는 기록이 없습니다.

이제 당신은 추측할 수밖에 없습니다.

더 안전한 아키텍처 (A Safer Architecture)

신뢰할 수 있는 사용량 추적을 위해서는 단순한 카운터 이상의 것이 필요합니다.

목표는 다음과 같은 시스템을 구축하는 것입니다:

감사 가능 (Auditable)
멱등성 (Idempotent)
원자성 (Atomic)
동시성 (Concurrency) 상황에서의 신뢰성

사용량 원장 (Usage Ledger) 사용하기

단순히 잔액을 차감하는 대신, 모든 소비 이벤트 (Consumption event)를 기록하세요.

예시:

ID          USER      UNITS
--------------------------------
1           user_1    -10
...

이렇게 하면 완전한 이력이 생성됩니다.

당신은 항상 다음을 알 수 있습니다:

무슨 일이 일어났는지
언제 일어났는지
얼마나 많은 유닛이 소모되었는지

잔액은 독립적인 숫자가 아니라 원장 이벤트의 결과물이 됩니다.

소비를 멱등하게 (Idempotent) 만들기

모든 사용량 작업은 고유 식별자 (Unique identifier)를 가져야 합니다.

예시:

request_id = 9f7d3c2a

동일한 요청이 다시 도착하면:

크레딧을 다시 소모하지 마세요
원래의 결과를 반환하세요

이를 통해 재시도로 인해 발생하는 중복 청구를 방지할 수 있습니다.

크레딧을 원자적 (Atomically)으로 소모하기

잔액 확인과 사용량 소모는 단일 트랜잭션 (Transaction) 내에서 이루어져야 합니다.

나쁜 예:

잔액 읽기
↓
잔액 확인
...

좋은 예:

트랜잭션 (Transaction)
↓
잔액 검증
...

이는 동시성 문제와 경합 조건 (Race condition)을 방지합니다.

감사 가능성 (Auditability)을 고려한 설계

조만간 고객이 다음과 같이 물을 것입니다:

왜 이것 때문에 제가 청구된 건가요?

당신은 즉시 답변할 수 있어야 합니다.

다음 항목을 저장하세요:

요청 ID (Request id)
타임스탬프 (Timestamp)
사용자 ID (User id)
소모된 유닛 (Consumed units)
작업 유형 (Operation type)

완전한 감사 추적 (Audit trail)은 수많은 고객 지원 시간을 절약해 줍니다.

요청 수를 세는 것만으로는 부족한 이유

많은 팀이 다음과 같이 가정합니다:

1 요청 (request) = 1 단위 (unit)

하지만 AI 제품은 이런 방식으로 작동하는 경우가 드뭅니다.

작업 유형 (Operation type)에 따라 비용이 서로 다르기 때문입니다.

예를 들어:

텍스트 생성 (Text generation)     = 1 크레딧 (credit)
이미지 생성 (Image generation)    = 20 크레딧 (credits)
비디오 생성 (Video generation)    = 100 크레딧 (credits)

중요한 것은 요청 수가 아닙니다.

중요한 것은 과금 가능한 사용량 (Billable usage)입니다.

그것이 바로 수익화 (Monetization)를 이끌어야 하는 지표입니다.

마치며

제품의 사용자가 10명일 때는 AI 사용량을 추적하는 것이 쉬워 보입니다.

하지만 사용자가 수천 명으로 늘어나면, 이는 인프라 (Infrastructure)의 문제가 됩니다.

과제는 요청 수를 세는 것이 아닙니다.

과제는 다음과 같은 상황에서도 정확성을 유지하는 시스템을 구축하는 것입니다:

요청이 중복될 때 (requests are duplicated)
작업이 재시도될 때 (jobs retry)
사용자가 확장될 때 (users scale)
수익이 모든 소비 이벤트 (consumption event)에 달려 있을 때

사용량이 곧 가격 책정 모델 (Pricing model)이 되면, 사용량 추적은 비즈니스 모델 (Business model)의 일부가 되기 때문입니다.

그리고 모든 실수는 결국 수익 손실로 이어집니다.

더 알아보기

AI 크레딧 (AI credits), 사용량 기반 과금 (Usage-based billing), 또는 선불 소비 시스템 (Prepaid consumption systems)을 구축하고 있다면, 가장 중요한 개념 중 하나는 사용량 원장 (Usage ledger)을 통해 감사 가능한 사용 이력 (Auditable usage history)을 유지하는 것입니다.

저는 Licenzy 문서에서 크레딧, 소비 추적 (Consumption tracking), 권한 (Entitlements), 그리고 과금 동기화 (Billing synchronization) 뒤에 숨겨진 아키텍처에 대해 더 자세히 작성했습니다:

https://licenzy.app/docs/usage-metering

해당 문서에는 다음 항목에 대한 예시가 포함되어 있습니다:

소비 추적 (Consumption tracking)
멱등성 (Idempotency)
사용량 팩 (Usage packs)
크레딧 기반 수익화 (Credit-based monetization)