LLM 생성 코드의 보안성: 비교 분석
요약
본 연구는 LLM이 생성한 코드의 보안 취약점을 실증적으로 분석합니다. 7개의 주요 LLM을 대상으로 개발자의 사용 패턴을 모방하여 테스트한 결과, 모든 모델이 심각도가 높은 취약점을 포함한 코드를 생성함을 확인했습니다.
핵심 포인트
- 7개의 대중적인 LLM 보안성 평가 수행
- 모든 평가 대상 LLM에서 보안 취약점 발견
- 대다수 취약점이 'Critical' 또는 'High' 수준
- LLM 생성 코드의 실제 운영 환경 도입 시 주의 필요
대다수의 소프트웨어 개발자들은 개발 프로세스에서 인공지능 (AI) 도구를 사용하거나 사용할 계획을 가지고 있습니다. 이들이 도구를 사용하는 주요 이유는 생산성 향상과 더 빠른 학습입니다. 실제로 대규모 언어 모델 (LLM)이 생성한 코드는 현재 주요 기술 기업들을 포함하여 실제 운영 환경에서 사용되고 있습니다. 하지만 코드를 생성하기 위해 AI 도구를 사용하는 것과 관련된 위험성에 대한 우려도 제기되었습니다. 본 논문에서 우리는 소프트웨어 보안에 미치는 위험에 초점을 맞춥니다. 우리는 7개의 대중적인 LLM에 의해 생성된 코드의 보안성을 실증적으로 평가합니다. 우리는 LLM을 사용하여 코드를 생성할 때 개발자의 행동을 모방하기 위해 이전 연구를 기반으로 연구를 수행했습니다. 우리의 연구 결과에 따르면, 우리가 평가한 7개의 LLM 모두 취약점을 포함하는 코드를 생성하며, 그중 대다수는 심각도(severity)가 'Critical' 또는 'High' 수준인 것으로 나타났습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기