실행 비디오로부터의 검증된 프로그램 복구: 신뢰할 수 없는 생성기를 위한 건전한 오라클 (Sound Oracle)

점점 더 많은 종류의 도구들이 정답 보장이 없는 후보를 제안하는 신뢰할 수 없는 생성기(untrusted generator), 신경망 모델(neural model) 또는 탐색(search)을 사용하여 동작 관찰로부터 프로그램을 복구하고 있습니다. 우리는 실행 녹화본으로부터 실행 가능한 Scratch 프로그램을 복구하는 구체적인 설정에서, 이러한 복구 과정을 어떻게 신뢰할 수 있게 만들 수 있는지 연구합니다. 녹화본은 프로그램이 무엇을 하는지는 보여주지만 코드는 결코 보여주지 않습니다. 많은 프로그램이 동일한 비디오를 생성할 수 있으므로 소스(source)를 그대로 복구하는 것은 불가능하며, 올바른 목표는 렌즈(lens)를 통해 정밀하게 정의된 대로 카메라가 식별할 수 있는 범위 내에서 동일하게 동작하는 프로그램입니다. 핵심은 의도적인 판결 비대칭성(verdict asymmetry)을 가진 2단계 검증 오라클(validation oracle)입니다. 정적 검사기(static checker)는 참조 모델과의 렌즈 동등성(lens-equivalence)을 증명하고 인증서(certificate)를 발행하며, 부분 순서 독립 몫(partial-order independence quotient)이 적절하다면 결코 잘못된 프로그램을 수락하지 않습니다. 반면 렌더러(renderer)는 반박하거나 유한한 일치(finite agreement)를 목격할 수만 있을 뿐, 결코 인증할 수는 없습니다. 이 주변에서, Vid2Prog는 비디오와 알려진 에셋 매니페스트(asset manifest)로부터 각 스프라이트(sprite)의 움직임, 가시성 및 타이밍을 읽어 소스 없이 후보를 합성합니다. 폐쇄 루프(closed loop)는 렌더링을 수행하고 정답(ground truth)을 위해 복구를 다시 실행합니다. 정확한 렌즈 하에서, 이 오라클은 동시성 몫(concurrency quotient)을 함정에 빠뜨리기 위해 구축된 적대적 배터리(adversarial battery)를 포함하여, 라벨링된 246개의 서로 다른 쌍에 대해 잘못된 수락(false accept)을 하지 않았습니다. 어휘(vocabulary) 범위를 벗어난 입력이나 실제 프로젝트에 대해서는 기권하거나 반박하며, 테스트한 어떤 것도 수락하지 않았습니다. 어휘 범위 내의 복구는 소스를 프레임 단위로 재현하며 80%가 정적 인증서를 획득한 반면, 대부분 어휘 범위를 벗어나는 전체 실제 프로젝트는 14%의 비율로 복구되었습니다. 이는 어휘에 제한된 비율이며 시스템이 잘못된 답으로 이 비율을 부풀리지 않습니다. 최첨단 시각-언어 모델(vision-language model)은 일회성(single-shot)으로 일치하는 프로그램 중 어느 것도 복구하지 못했으나, 오라클 루프 내 수리(oracle-in-the-loop repair)를 통해 극소수까지 끌어올린 반면, 구조화된 파이프라인은 모두를 복구했습니다. 이 격차는 신뢰할 수 없는 생성기에 대해 건전한 검사기(sound checker)가 만들어내는 차이입니다.

Insights

실행 비디오로부터의 검증된 프로그램 복구: 신뢰할 수 없는 생성기를 위한 건전한 오라클 (Sound Oracle)

요약

핵심 포인트

댓글

Active Energy, UAE 자산 수익 창출 시작과 함께 전략적 재편 완료

Intrusion, 사이버 보안 기업 VigilAigent 인수 추진

토큰화 (Tokenisation) 규제가 구축됨에 따라 Valereum은 상업 운영 단계로 진입

미세 조정 (Fine-Tuning)을 위한 합성 데이터 (Synthetic Data): 생성, 필터링 및 모델 붕괴 (Model

Active Energy, UAE 자산 수익 창출 시작과 함께 전략적 재편 완료

Intrusion, 사이버 보안 기업 VigilAigent 인수 추진

토큰화 (Tokenisation) 규제가 구축됨에 따라 Valereum은 상업 운영 단계로 진입

미세 조정 (Fine-Tuning)을 위한 합성 데이터 (Synthetic Data): 생성, 필터링 및 모델 붕괴 (Model