A11YRepair: 지식 강화형 분할 정복(Divide-and-Conquer) 수정을 통한 웹 접근성 장벽 해소
요약
웹 접근성(A11Y) 문제를 해결하기 위해 LLM 기반의 분할 정복(Divide-and-Conquer) 프레임워크인 A11YRepair를 제안합니다. WCAG 지식을 통합하여 다중 결함을 효율적으로 수정하며, 실제 오픈 소스 프로젝트에 적용되어 그 성능을 입증했습니다.
핵심 포인트
- 기존 APR 시스템의 웹 접근성 수정 성능 한계 지적
- LLM 기반의 분할 정복 워크플로우를 통한 클러스터링 및 패치 생성
- WCAG 도메인 지식을 결함 위치 파악 및 패치 합성 과정에 통합
- 실제 웹 프로젝트 벤치마크인 A11YBench 구축
- Google, Microsoft 등 주요 기업의 오픈 소스 프로젝트에 패치 병합 성공
장애가 있는 사용자가 웹 콘텐츠를 인지하고 사용할 수 있도록 보장하는 웹 접근성 (A11Y)은 현대 웹 애플리케이션의 필수 요구 사항입니다. 그러나 기존의 도구들은 접근성 위반 사항을 수정하기보다는 탐지하는 데 압도적으로 집중되어 있습니다. 자동 프로그램 수정 (APR) 기술이 이러한 환경에서 유망해 보이지만, 본 연구에 따르면 최신 APR 시스템들은 실제 웹 접근성 위반 사항에 적용했을 때 성능이 저조한 것으로 나타났습니다. 기존의 희소 버그 (sparse-bug) 시나리오와 달리, 웹 접근성 문제는 페이지당 구조적으로 연관된 여러 개의 위반 사항으로 나타나는 경우가 많으며, 이는 여러 파일에 걸친 조정된 편집을 필요로 합니다. 기존의 수정 시스템은 각 버그를 개별적으로 처리하고, 버그 간의 관계나 웹 콘텐츠 접근성 지침 (WCAG)과 같은 도메인 규칙을 통합하지 않기 때문에 이러한 다중 결함 규모를 관리하는 데 실패합니다. 우리는 웹 접근성 수정을 위한 LLM 기반 프레임워크인 A11YRepair를 제안합니다. A11YRepair는 중복된 결함 위치 파악 (localization)을 줄이기 위해 조정된 편집이 필요한 위반 사항들을 먼저 클러스터링한 다음, LLM이 집중적이고 일관된 패치를 생성할 수 있도록 각 클러스터를 근본 원인별로 분해하는 분할 정복 (divide-and-conquer) 워크플로우를 도입합니다. 또한 이 프레임워크는 결함 위치 파악과 패치 합성 (patch synthesis) 과정 모두에서 도메인 인식을 강화하기 위해 WCAG 기반 지식을 통합합니다. 체계적인 평가를 지원하기 위해, 우리는 GitHub에서 수집한 60개의 실제 웹 프로젝트로 구성된 벤치마크인 A11YBench를 구축했습니다. 실험 결과, A11YRepair는 최신 베이스라인 모델들보다 더 높은 수정 효과와 더 낮은 비용을 달성함을 보여주었으며, 절제 연구 (ablation studies)를 통해 분할 정복 설계와 선택적 도메인 지식 통합의 중요성을 확인했습니다. 특히, A11YRepair가 생성한 패치들은 Google, Microsoft, Facebook, IBM, K8s, Docker, Alibaba의 오픈 소스 프로젝트에 병합되었으며, 이는 본 프레임워크의 실질적인 가치를 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기