HN분석2026. 05. 09. 08:09

AI is breaking two vulnerability cultures

요약

본 기사는 소프트웨어 취약점 공개 및 대응 방식의 변화를 다루며, 특히 AI 기술의 발전이 기존 보안 문화에 미치는 영향을 분석합니다. 전통적인 '좌표 공개(coordinated disclosure)'와 '버그는 버그다(bugs are bugs)'라는 두 가지 상반된 접근법 사이에서 긴장감이 고조되고 있습니다. AI가 취약점 검색 및 코드 검토를 빠르고 저렴하게 만들면서, 기존의 장기간 비공개 기간(embargo)은 더 이상 효과적이지 않으며 오히려 위험을 증가시킬 수 있다는 결론을 내립니다.

핵심 포인트

전통적인 '좌표 공개' 방식은 발견된 버그를 사적으로 보고하고 수정 기간을 두는 것이지만, AI 시대에는 정보가 너무 빨리 퍼져 이 방식의 효과가 떨어지고 있습니다.
'버그는 버그다' 문화처럼 신속하게 문제를 해결하려는 경향이 강해지면서, 보안 패치 검토 시 '신호 대 잡음 비율(signal-to-noise ratio)'이 높아졌습니다.
AI 도구의 발전으로 취약점 검색 및 코드 분석 비용과 속도가 극적으로 향상되어, 과거에 유효했던 긴 비공개 기간(embargo)은 위험을 높일 수 있습니다.
필자는 보안 패치 공개 기간(embargo)이 점차 짧아져야 하며, AI가 공격자와 방어자 모두에게 영향을 미쳐 이 변화를 가속화하고 있다고 주장합니다.

다른 사람이 이 변화를 발견하고 보안 영향을 인식하여 공개적으로 공유했습니다. 이제 embargo(비공개 기간)가 종료되었으므로 우리는 이제 전체 세부 사항을 볼 수 있습니다.

여기서 두 가지 다른 취약점 접근 방식 사이의 긴장감을 보며, 이것이 AI 가속화와 어떻게 변할지 생각해보는 것은 흥미롭습니다.

한쪽에는 "coordinated disclosure(좌표 공개)" 문화가 있습니다. 이는 컴퓨터 보안에서 가장 일반적인 접근법입니다. 보안 버그를 발견하면 유지 관리자에게 사적으로 알려주고 수정 기간을 부여합니다 (보통 90 일). 목표는 누군가가 구멍에 대해 알게 되기 전에 수정이 발표되는 것입니다.

다른 한쪽에는 "bugs are bugs(버그는 버그다)" 문화가 있습니다. 이는 특히 Linux 에서 일반적입니다. 커널이 해야 할 일을 하지 않는다면, 누군가는 이를 공격으로 변형할 수 있다는 주장입니다. 가능한 한 빨리 문제를 해결하고 주목하지 마십시오. 많은 변경 사항이 지나가고 있으므로 사람들은 종종 이를 알아채지 못하며, 여전히 머신을 패치할 시간이 있습니다.

이 접근법은 결코 완벽하게 작동하지 않았지만, AI 가 취약점을 찾는 데 능숙해짐에 따라 훨씬 더 큰 문제가 되었습니다. 지금 많은 보안 수정이 발표되고 있어 커밋을 검토하는 것이 훨씬 매력적입니다: 신호 대 잡음 비율이 높습니다. 또한 AI 가 각 커밋을 통과할 때마다 평가하는 것은 점점 더 저렴하고 효과적입니다. [1]

그러나 긴 embargo 는 잘 작동하지 않습니다. 역사적인 탐지 속도는 느렸습니다: 누군가가 발견하고 90 일 공개 기간과 함께 벤더에 보고했다면, 그 동안 다른 사람이 알아채는 확률이 매우 좋았습니다. 하지만 이제 많은 AI 보조 그룹이 취약점을 검색하기 위해 소프트웨어를 스캔하므로 더 이상 성립하지 않습니다. 이 경우 Kim 은 ESP 취약점을 보고한 후 9 시간 만에 Kuan-Ting Chen 이 독립적으로 이를 보고했습니다. Embargoes 는 위험을 증가시킬 수 있습니다: 그들은 비응급의 가짜 느낌을 만들고 결함을 수정할 수 있는 행위자를 제한합니다.

이 문제를 해결하는 방법은 모르지만, 개인적으로는 매우 짧은 embargo 가 좋은 접근법이라고 생각합니다. 시간이 지남에 따라 더 짧아져야 합니다. 다행히 AI 는 방어자뿐만 아니라 공격자도 여기에서 가속화하여 이전에는 쓸모없는 짧은 embargo 를 가능하게 합니다.

[1] Gemini 3.1 Pro, ChatGPT-Thinking 5.5, Claude Opus 4.7 에서 테스트했습니다. f4c50a403 를 주면 세 모델 모두 즉시 정답을 찾았습니다.

f4c50a403 를 주어 바로 결과를 얻었을 때, diff 만 제시했을 때: Gemini 는 보안 패치라고 확신했고, GPT 는 아마도 보안 패치일 것 같다고 생각했으며, Claude 는 아마도 보안 패치가 아닐 것 같다고 생각했습니다.

이것은 매우 빠른 테스트로 가능한 것을 보여줍니다: 각 모델 한 번 실행하여 프롬프트 "검색 없이 이 것이 보안 패치처럼 보입니다가?" 를 사용하여 결과를 얻습니다. 교차 모델 비교에 대한 신뢰를 너무 많이 두지 마세요!

AI 자동 생성 콘텐츠

원문 바로가기

AI is breaking two vulnerability cultures

요약

핵심 포인트

댓글