투명성과 추적성을 통한 AI 지원 과학 소프트웨어 개발의 격차 해소
요약
과학 소프트웨어 개발 분야에서 LLM을 활용한 AI 지원 개발이 확산되고 있으나, 공식적인 가이드라인 부재로 인해 품질 보증 및 추적성 문제가 제기되고 있습니다. 본 논문은 NQA-1과 같은 엄격한 품질 표준을 준수하기 위해, 핵융합 에너지용 코드인 TMAP8을 사례로 AI 지원 검증 및 확인(V&V)을 위한 구조화된 프레임워크와 가이드라인을 제안합니다.
핵심 포인트
- AI 지원 개발의 무분별한 사용은 과학 소프트웨어의 품질과 신뢰성에 체계적인 위험을 초래할 수 있음
- NQA-1과 같은 고도의 안전 표준이 요구되는 분야에서는 AI 사용에 대한 공식적인 워크플로우와 거버넌스가 필수적임
- 검증 및 확인(V&V) 케이스 개발은 객관적 정확성 측정과 감사 가능성 확보를 위한 이상적인 AI 활용 시험장임
- 제안된 가이드라인은 인간의 책임성을 보존하면서도 AI를 책임감 있게 관리할 수 있는 공개 및 검토 표준을 수립함
과학 소프트웨어 분야에서 AI 지원 개발 (AI-assisted development)의 광범위한 도입은 미래의 우려 사항이 아니라 현재의 현실입니다. 연구자들은 이미 대규모 언어 모델 (Large Language Models, LLMs)을 사용하여 코드를 작성하고, 테스트 케이스를 생성하며, 문서를 초안하는 데 사용하고 있지만, 이러한 관행은 공식적인 워크플로우와 발표된 연구에서 여전히 인정받지 못하거나 가이드라인이 없는 상태로 남아 있습니다. 이러한 임시방편적이고 통제되지 않은 AI 사용은 과학 소프트웨어의 품질에 체계적인 위험을 초래하며, 특히 엄격한 소프트웨어 품질 보증 (Software Quality Assurance, SQA) 또는 심지어 추적성, 독립적 검증 및 문서화된 절차가 매우 중요한 원자력 품질 보증 레벨 1 (Nuclear Quality Assurance Level 1, NQA-1) 표준을 따르는 안전 관련 모델링 및 시뮬레이션 도구에서 더욱 그러합니다. 따라서 과학 소프트웨어 커뮤니티가 직면한 질문은 AI 지원 개발을 허용할 것인가의 여부가 아니라, 어떻게 책임감 있게 관리할 것인가입니다. 본 논문은 엄격한 소프트웨어 품질 보증 맥락에서의 AI 지원 코드 개발을 위한 가이드라인을 제안합니다. 핵융합 에너지용 오픈 소스 트리튬 이동 코드인 TMAP8을 시연 플랫폼으로 사용하여, 우리는 AI 지원 검증 및 확인 (Verification and Validation, V&V) 케이스 개발을 위한 구조화된 프레임워크를 제안합니다. V&V 케이스 개발은 그러한 거버넌스를 확립하기 위한 이상적인 시험장입니다. 검증 케이스는 알려진 해답을 가지고 있기 때문에 정확성을 객관적으로 측정할 수 있고, 오류를 설계 단계에서 식별할 수 있으며, 산출물(artifacts)을 완전히 감사(auditable)할 수 있기 때문입니다. 본 논문에 기술된 실무 경험을 바탕으로 개발된 제안된 가이드라인은 NQA-1 요구 사항 내에서 작동하며, 인간의 책임성을 보존하고, 책임감 있는 AI 지원 과학 소프트웨어 개발이 요구하는 공개 및 검토 표준을 수립합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기