Qiita헤드라인2026. 06. 26. 02:30

WorldCupVoice라는 OSS가 흥미로워서 구조를 정리해 보았습니다

요약

실시간 라이브 영상을 시청하며 스포츠 중계를 수행하는 오픈소스 프로젝트 WorldCupVoice의 구조를 분석합니다. Next.js, FastAPI, OpenAI, RTC 기술을 결합하여 실시간 영상 샘플링부터 음성 합성까지 이어지는 파이프라인을 구축했습니다.

최근, WorldCupVoice라는 흥미로운 OSS를 발견했습니다.

이것은 제 프로젝트가 아니라, 제작자는 zicojiao 님입니다.

README와 공개 코드를 읽고, "이것은 상당히 흥미로운 구성이구나"라고 생각되어 정리해 보겠습니다.

우선 데모 영상을 보는 것이 가장 빠릅니다. AI가 시청자와 동일한 라이브 영상을 보면서 중계하는 구성으로 되어 있습니다.

프로젝트는 여기 있습니다.

이 프로젝트의 포인트는, AI가 나중에 경기 내용을 요약하는 것이 아니라, RTC 채널 상의 라이브 영상을 보고 중계한다는 점입니다.

README나 코드를 보면서 특히 흥미로웠던 점은, 이미지 설명이 아니라 중계에 가깝게 만들기 위한 제약 사항이 상당히 명확하다는 것이었습니다.

예를 들어, 다음과 같은 방침입니다.

또한, 라이브 계열에서는 비용 제어도 중요하지만, 이 프로젝트에서는 Start AI / Stop AI, viewer heartbeat, hard session TTL을 넣어, 시청자가 없을 때는 자동으로 정지하도록 설계되어 있습니다.

이러한 부분은 "데모로 끝내지 않기" 위한 설계로서 상당히 참고가 될 것 같았습니다.

개인적으로는 스포츠 중계의 재미에 더해, 시각 장애가 있는 시청자를 위해 공간 정보를 풍부하게 전달하는 방향으로도 확장할 수 있을 것 같다고 느꼈습니다.

저는 제작자가 아니므로 잘못 읽은 부분이 있다면 꼭 정정해 주시기 바랍니다만, 실시간 영상과 생성 AI (Generative AI)를 연결하는 구성 사례로서 상당히 좋은 OSS라고 생각했습니다.

다시 한번 말씀드리지만, 제작자는 zicojiao 님입니다. 흥미로운 프로젝트였기에 공유했습니다.

AI 자동 생성 콘텐츠