본문으로 건너뛰기

© 2026 Molayo

Simon헤드라인2026. 05. 09. 11:57

Quoting Luke Curley

요약

이 글은 WebRTC가 네트워크 상태가 좋지 않을 때 오디오 패킷을 공격적으로 떨어뜨리는 방식으로 인해 발생하는 음성 AI의 품질 저하 문제를 지적합니다. 특히, 실시간 대화 환경에서 왜곡된 오디오를 경험하는 것은 WebRTC의 낮은 지연 시간 유지 메커니즘 때문입니다. 필자는 사용자가 느리고 비싼 프롬프트를 기다리는 것보다 정확한 답변을 위해 약간 더 기다리는 것이 낫다고 주장하며, 현재 기술 구현의 한계와 문제점을 비판하고 있습니다.

핵심 포인트

  • WebRTC는 낮은 지연 시간 유지를 위해 오디오 패킷을 공격적으로 드롭(drop)합니다.
  • 이로 인해 회의 통화 등에서 왜곡되거나 끊기는 오디오를 경험할 수 있습니다.
  • 필자는 정확한 답변을 얻기 위해 약간의 대기 시간이 발생하는 것이, WebRTC가 강제하는 낮은 품질의 실시간 응답보다 낫다고 주장합니다.
  • 브라우저 환경에서는 WebRTC 오디오 패킷 재전송이 불가능하여 기술적 한계가 존재합니다.

2026 년 5 월 9 일

WebRTC 는 네트워크 상태가 나쁠 때 내 프롬프트를 저하하고 떨어뜨리도록 설계되었습니다. WTF, 제 친구.

WebRTC 는 지연 시간을 낮게 유지하기 위해 오디오 패킷을 공격적으로 떨어뜨립니다. 만약 회의 통화에서 왜곡된 오디오를 들어본 적이 있다면, 그건 WebRTC 입니다. 아이디어는 회의 통화가 빠른 왕복에 의존한다는 것입니다. 따라서 오디오를 기다리는 데 걸리는 시간은 수용할 수 없습니다.

…but 사용자로 하여금 느리고 비싼 프롬프트가 정확한 답변을 위해 200ms 더 기다리는 것이 훨씬 낫습니다. 결국, 저는 바다를 끓이는 데 좋은 돈을 지불하고 있습니다. 쓰레기 프롬프트는 쓰레기 응답을 의미합니다. LLM 이 특히 반응성이 좋다는 것은 아닙니다.

하지만 기다릴 수 없습니다. 브라우저에서 WebRTC 오디오 패킷을 재전송하는 것은 불가능합니다. 우리는 디스코드에서 시도했습니다. 구현은 실시간 지연 시간이나 아니면 다른 방법을 위해 하드 코딩되어 있습니다.

— Luke Curley, OpenAI 의 WebRTC 문제, How OpenAI delivers low-latency voice AI at scale 에 대한 응답

최근 기사

  • xAI/Anthropic 데이터 센터 거래에 대한 메모 - 2026 년 5 월 7 일
  • 라이브 블로그: Claude 와 코딩하기 2026 - 2026 년 5 월 6 일
  • Vibe coding 과 agentic engineering 은 제가 원하는 것보다 더 가까워지고 있습니다 - 2026 년 5 월 6 일

AI 자동 생성 콘텐츠

본 콘텐츠는 Simon Willison Blog의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0