텍스트 기반 시스템이 감지하지 못하는 블록체인 공격을 차단하는 Vision AI 구축 — 부르키나파소 와가두구에서
요약
텍스트 기반 보안 시스템이 감지하지 못하는 블록체인 'Drain Star' 공격을 차단하기 위해 Vision-Language Model(VLM)을 활용한 보안 솔루션을 구축했습니다. AMD MI300X에서 미세 조정된 모델을 통해 트랜잭션 관계를 시각적 그래프로 분석하여 48ms 만에 공격을 탐지합니다.
핵심 포인트
- 텍스트 기반 분석의 한계를 시각적 그래프 분석으로 극복
- VLM을 활용해 트랜잭션 간의 위상학적 패턴(별 모양) 감지
- AMD MI300X 기반의 미세 조정된 VLM으로 48ms 내 차단 성공
- 100만 개 이상의 트랜잭션 그래프로 구성된 Sigui-DePIN-1M 데이터셋 구축
텍스트 기반의 모든 보안 시스템이 감지하지 못하는 블록체인 공격을 차단하는 Vision AI를 구축했습니다 — 부르키나파소 와가두구에서.
AMD MI300X에서 미세 조정(fine-tuned)된 Vision-Language Model (VLM)이 기존의 모든 시스템에서 0.42점을 기록했던 Drain Star 공격을 어떻게 감지하고 48ms 만에 차단했는지에 대하여.
모든 것을 빠져나간 공격
UTC 기준 14:32:01이었습니다. 9개의 지갑이 동시에 하나의 허브 주소로 송금을 시작했습니다. 각 송금액은 0.48 USDC였습니다. 개별적으로 보면 각각은 완전히 정상적으로 보였습니다.
수신 허브는 이전에 부정적인 평판이 없었습니다. 송금 지갑들은 깨끗한 이력을 가지고 있었습니다. 거래 금액은 각 송신자의 평균보다 낮았습니다. 빈도는 보통 수준이었습니다. 단일 거래 중 어떤 것도 규칙을 트리거하지 않았습니다.
기존의 모든 텍스트 기반 보안 시스템은 이를 R = 0.42로 점수 매겼을 것입니다 — 모호하며 경계선에 있는 수치입니다. 최선의 경우: 사람의 검토로 에스컬레이션(escalated)됩니다. 최악의 경우: 통과됩니다.
4.32 USDC가 유출되었습니다. 9명의 피해자. 경고는 0건.
이것이 바로 Drain Star 공격이며, 텍스트 기반 분석으로는 완전히 보이지 않습니다.
지금까지는 말이죠.
아무도 해결하지 못하고 있는 문제
저는 지난 6개월 동안 블록체인 보안 인프라를 구축해 왔습니다. 제가 계속해서 마주친 것은 생태계의 그 누구도 제대로 다루지 않았던 근본적인 격차였습니다.
규칙 기반(rule-based) 및 머신러닝(ML) 기반 보안 시스템 모두 트랜잭션을 하나씩 분석합니다. 이들은 다음을 확인합니다:
금액 (정상인가? 비정상인가?)
빈도 (너무 빠른가?)
목적지 (알려진 악성 행위자인가?)
스마트 컨트랙트 (감사(audited)를 받았는가?)
이 방식은 단순한 공격에는 잘 작동합니다. 하지만 조직적인 공격은 개별 트랜잭션 수준에서는 위험해 보이지 않습니다. 공격의 시그니처(signature)는 위상학적(topological)입니다 — 즉, 단일 트랜잭션이 아닌 트랜잭션 간의 관계 속에 존재합니다.
9개의 지갑이 각각 0.48달러를 보내는 Drain Star 공격은 다음과 같습니다:
9개의 정상적으로 보이는 금액 ✓
9개의 정상적인 빈도 ✓
동일한 목적지로 향하는 9개의 트랜잭션 (의심스러운가? 아마도)
이전의 나쁜 이력이 없는 1개의 허브 주소 ✓
텍스트 기반 점수: R = 0.42. 에스컬레이션(ESCALATE).
어쩌면 사람이 잡아낼 수도 있습니다. 어쩌면 못할 수도 있고요.
모든 것을 바꾼 통찰
여기서 제가 깨달은 것이 있습니다: 이러한 공격들은 시각적으로 매우 명백하다는 점입니다.
트랜잭션 서브그래프 (transaction subgraph)를 이미지로 렌더링하면 — 지갑은 노드 (nodes)로, 전송은 유향 에지 (directed edges)로 — 드레인 스타 (Drain Star)는 말 그대로 별 모양처럼 보입니다. 하나의 허브를 향해 뻗어 나가는 9개의 바퀴살. 빨간색 허브 노드 (높은 차수 중심성 (high degree centrality)). 보라색 에지 (USDC 전송).
이 그래프를 3초 동안 바라보는 보안 분석가라면 즉시 이렇게 말할 것입니다: "저건 드레인 스타네요. 차단하세요."
그래서 질문은 이렇게 바뀌었습니다: Vision-Language Model (VLM)이 48밀리초 안에 똑같은 일을 해낼 수 있을까?
정답은 '예'입니다. 하지만 먼저 학습시켜야 합니다.
데이터셋 구축: 100만 개의 트랜잭션 그래프
일반적인 데이터로는 VLM을 미세 조정 (fine-tune)할 수 없었습니다. 모델이 실제 블록체인 공격 토폴로지 (topologies)를 즉각적으로 인식할 수 있을 때까지 수천 번은 직접 봐야 했습니다.
그래서 저는 Sigui-DePIN-1M을 구축했습니다: Ethereum, Arbitrum, Polygon의 187만 개의 실제 온체인 (on-chain) 트랜잭션에서 추출한 1,000,000개의 주석이 달린 블록체인 트랜잭션 그래프 이미지입니다.
구축 파이프라인:
1단계 — 데이터 수집
아카이브 노드 (archive node) 쿼리를 통해 추출된 원시 트랜잭션 서브그래프. 각 시드 트랜잭션에 대해: 10블록 윈도우 (window)를 아우르는 depth-2 에고 네트워크 (ego-network).
2단계 — 시각화
각 서브그래프를 NetworkX와 Matplotlib을 사용하여 672×672 PNG로 렌더링:
배경: #0d0f2b (짙은 인디고)
허브 노드 (차수 > 3): 빨간색
리프 노드 (leaf nodes): 초록색
USDC 전송 에지: 보라색 (너비는 금액에 비례)
과적합 (overfitting)을 방지하기 위해 4개의 레이아웃 알고리즘을 교대로 사용
3단계 — 레이블링 (Labeling)
그래프 이론적 기준에 따른 4가지 클래스:
Code
10,000개 샘플에 대한 수동 검토를 통해 검증된 평가자 간 일치도 (Cohen's κ = 0.91).
결과: 현존하는 가장 전문화된 블록체인 보안 데이터셋 11.1GB.
📊 데이터셋: huggingface.co/datasets/Ibonon/sigui-depin-1m
AMD MI300X에서 Imina-Na 미세 조정
저는 모델의 이름을 Imina Na라고 지었습니다 — 도곤 (Dogon) 우주론에서 Awa 사회의 '위대한 가면 (Grand Mask)'을 의미합니다. 가장 신성한 층입니다.
기본 모델 (Base model): Qwen2-VL-2B-Instruct. 미세 조정 (Fine-tuning) 방법: 어텐션 프로젝션 (attention projections)을 대상으로 하는 LoRA (r=16, α=32). 하드웨어: AMD Developer Cloud를 통한 AMD Instinct MI300X (192GB HBM3).
코드
결과:
| 지표 (Metric) | 기본 Qwen2-VL | Imina-Na V2 (미세 조정됨) |
|---|---|---|
| 전체 F1 (Overall F1) | 88.1% | 92.9% |
| Drain Star 재현율 (recall) | 82.3% | 95.2% |
| 오탐 (False positives) | 12.0% | 3.1% |
| 추론 지연 시간 (Inference latency) | 48ms | 48ms (변화 없음) |
미세 조정을 통해 F1 점수가 4.8점 상승했고 오탐률을 75% 줄였습니다. 지연 시간은 동일합니다. 트레이드오프 (tradeoffs)가 없습니다.
🤖 모델: huggingface.co/Ibonon/imina_na_v2_lora
전체 파이프라인: Sigui 프로토콜 (Sigui Protocol)
Imina Na는 제가 Sigui 프로토콜이라고 부르는 5계층 보안 오라클 (security oracle)의 5계층 (Layer 5)입니다. 이 이름은 60년마다 일어나는 도곤 (Dogon)족의 우주적 재생 의식에서 따왔습니다.
코드
위험 공식 (The risk formula):
Python
공격 이야기로 돌아가서: 실제로 무슨 일이 일어났는가
이야기를 처음부터 마무리하겠습니다.
공격 내용:
9개의 조정된 지갑 (coordinated wallets) → 1개의 허브 (hub)
각 전송 금액: $0.48 USDC
모든 지갑: 깨끗한 이력 (clean history)
허브: 이전의 나쁜 평판 없음
텍스트 전용 파이프라인 (Layers 1-4):
코드
이 공격은 사람의 검토 단계로 격상되었을 것입니다. 차단되었을 수도 있고, 아닐 수도 있습니다. UTC 기준 14:32:01에 사람이 지켜보고 있었는지 여부에 달려 있습니다.
Imina Na (Layer 5)를 사용했을 때:
트랜잭션 서브그래프 (transaction subgraph)가 3ms 만에 렌더링됩니다. 하나의 빨간색 허브 노드로 수렴하는 9개의 인바운드 엣지 (inbound edges). 토폴로지 (topology)가 즉각적으로 식별됩니다.
Imina Na의 응답:
Json
최종 점수:
코드
의사 결정 시간: 총 48ms.
공격은 차단되었습니다. 9개의 지갑이 보호되었습니다.
공격은 텍스트에는 보이지 않았습니다. Imina Na는 그것을 보았습니다.
ERC-8259: 에이전트 신뢰의 표준화 (Standardizing Agent Trust)
Sigui를 구축하면서 저는 더 깊은 문제가 있다는 것을 깨달았습니다. 이더리움 (Ethereum) 상에서 AI 에이전트의 신원과 평판에 대한 표준이 없다는 점입니다.
에이전트가 트랜잭션을 생성할 때, 스마트 컨트랙트 (smart contract)가 다음과 같은 작업을 수행할 방법이 없습니다:
- 어떤 AI 모델이 지갑을 운영하고 있는지 검증
- 행동 신뢰 점수 (behavioral trust score)를 조회
- 보안 오라클로부터 표준화된 위협 신호를 수신
저는 이를 해결하기 위해 Ethereum Magicians에 ERC-8259를 제출했습니다.
이 제안은 세 가지 인터페이스를 제안합니다:
Solidity
이 표준은 AHM에서 활동하며 Base 메인넷의 약 20,000개 에이전트 지갑에 대한 행동 평판 (behavioral reputation)을 운영하는 Pablo로부터 실질적인 피드백을 받았습니다. 신뢰도 인지형 평판 (confidence-aware reputation, 관찰 밀도 ≠ 점수)에 대한 그들의 운영적 통찰력이 현재 명세서 (spec)에 반영되었습니다.
💬 토론: ethereum-magicians.org/t/erc-8259
에이전트에 Sigui 사용하기 (코드 3줄)
전체 시스템은 오픈 소스 Python SDK로 제공됩니다:
Bash
Python
LangChain 에이전트용:
Python
OpenClaw 에이전트용:
Bash
이 스킬은 프로그래밍 방식의 처리를 위해 종료 코드 (exit codes)와 함께 결정론적 판결 (deterministic verdicts: ALLOW / BLOCK / ESCALATE)을 반환합니다. Starknet, Aptos, 그리고 Ethereum을 네이티브로 지원합니다.
🔧 OpenClaw Skill: clawhub.ai/ibonon/sigui-security
지금까지의 수치
부르키나파소 와가두구에서 혼자 구축한 성과:
- 380개 이상의 공격을 차단하고 Arc L1 테스트넷에 영구 기록
- 오픈 소스 데이터셋 내 1,000,000개의 트랜잭션 그래프
- 첫 달 PyPI 다운로드 273회 (sigui-sdk)
- 4일 만에 115개의 OpenClaw 스킬 설치
- HuggingFace에서 데이터셋 다운로드 133회
- Starknet Foundation Grant: 사전 심사 통과, 심층 기술 심사 진행 중
- ERC-8259: Ethereum Magicians에서 활발한 커뮤니티 리뷰 진행 중
다음 단계: Trustformer
Imina Na의 48ms 지연 시간 (latency)은 주로 그래프 렌더링 파이프라인(~28ms의 오버헤드)에서 발생합니다. 모델 추론 (inference) 자체는 약 20ms에 불과합니다.
저는 렌더링 단계를 완전히 제거하는 네이티브 시공간 그래프 어텐션 트랜스포머 (Spatio-Temporal Graph Attention Transformer)인 Trustformer (T-GAT)를 제안합니다. 트랜잭션을 이미지로 변환하는 대신, 새로운 이중 흐름-평판 어텐션 (Dual Flow-Reputation Attention) 메커니즘을 통해 원시 토큰 시퀀스 (raw token sequences)로 처리합니다:
Python
예상 지연 시간: < 5ms. 동일한 F1 점수. 렌더링 오버헤드 없음.
프리프린트 (Preprint): drive.google.com/file/d/1t9CklAUMLQ9wZgcqLrrvMtTYSGOYYos_
(현재 cs.CR 또는 cs.AI 분야의 arXiv 보증인 (endorser)을 찾고 있습니다 — arxiv.org/auth/endorse 에서 보증 코드 P4EHO3를 사용하세요.)
만약 귀하가 보증인 (endorser) 자격을 갖추고 있으며 이 작업이 가치 있다고 판단하신다면, 귀하의 지원을 받는 것을 영광으로 생각하겠습니다.)
오픈 소스, 전부 다
모든 것은 MIT 라이선스이며 현재 바로 이용 가능합니다:
리소스 | 링크
🐙 GitHub | github.com/ibonon/Sigui
📦 SDK (PyPI) | pypi.org/project/sigui-sdk
🧠 Model V2 | huggingface.co/Ibonon/imina_na_v2_lora
📊 Dataset | huggingface.co/datasets/Ibonon/sigui-depin-1m
🔧 OpenClaw Skill | clawhub.ai/ibonon/sigui-security
💬 ERC-8259 | ethereum-magicians.org/t/erc-8259
📄 Preprint | Trustformer Architecture
더 큰 그림
AI 에이전트 (AI agents)가 지갑을 관리하고, 탈중앙화 금융 (DeFi) 전략을 실행하며, 인간의 감독 없이 스마트 컨트랙트 (smart contracts)와 상호작용하는 자율적인 경제 주체가 됨에 따라, 이들을 보호하는 보안 인프라는 이러한 세상을 위해 설계되지 않았습니다.
전통적인 시스템은 트랜잭션 (transactions)을 하나씩 분석합니다. 공격자들은 여러 트랜잭션에 걸쳐 협력합니다. 이 격차는 점진적인 문제가 아니라 구조적인 문제입니다.
시각적 위상 분석 (Visual topology analysis)이 유일한 정답은 아닙니다. 하지만 이는 누락되었던 계층이며, Sigui는 실제 블록체인 데이터에서 운영 가능한 지연 시간 (production latency) 내에 이를 실행하는 첫 번째 시스템입니다.
블록체인 인프라와 상호작용하는 AI 에이전트를 구축하고 계신다면, 귀하가 겪고 있는 보안 과제에 대해 듣고 싶습니다. 댓글을 남기거나 GitHub을 통해 저에게 연락해 주세요.
— Eric Warma · 독립 연구원 · 부르키나파소 와가두구
태그: #blockchain #ai #security #machinelearning #python #web3 #opensource #defi
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기