arXiv논문2026. 06. 29. 11:25

웹 접근성을 위한 웹페이지 요소 간의 문맥적 연관성: 실증 연구

요약

스크린 리더 사용자를 위해 웹페이지 요소 간의 문맥적 연관성을 링크 예측 기술로 복구하는 연구를 제안합니다. 인간이 주석을 단 데이터셋을 구축하고, GCN 및 GAT 등 머신러닝 모델을 통해 접근성 트리의 의미적 연결성을 일반화할 수 있는지 검증합니다.

핵심 포인트

스크린 리더 사용자를 위한 웹 요소 간 문맥적 연관성 복구 연구
인간 주석 기반의 웹사이트 문맥 연관성 데이터셋 구축
접근성 트리를 그래프로 변환하여 MLP, GCN, GAT 등 모델 적용
DOM 및 CSS의 공간적·의미적 특징을 활용한 링크 예측 수행

[배경] 요소 목록(element list)을 통해 웹페이지를 탐색하는 스크린 리더(Screen reader) 사용자들은 종종 "더 읽기(Read more)"와 같은 접근 가능한 이름(accessible names)을 마주하게 됩니다. 이러한 이름들은 W3C의 접근 가능한 이름 및 설명 계산(Accessible Name and Description Computation) 명세에 따라 유효하지만, 단독으로는 해석이 불가능합니다. 이러한 이름을 의미 있게 만들어 줄 주변 요소들이 페이지 내에 존재함에도 불구하고, 어떠한 메커니즘을 통해서도 대상과 연결되어 있지 않습니다. 어떤 주변 요소가 주어진 대상과 문맥적으로 관련이 있는지 선택하는 방법에 대해 실증적으로 연구한 선행 연구는 없었습니다. [목적] 본 등록 보고서(registered report)는 웹페이지 요소 간의 인간이 인지하는 문맥적 연관성(contextual associations)을 링크 예측(link prediction)을 통해 접근성 트리(accessibility tree)로부터 복구할 수 있는지, 그리고 학습된 연관성이 웹사이트 전반에 걸쳐 일반화될 수 있는지를 조사합니다. [방법] 우리는 Tranco top-million 리스트를 기준으로 계층화된 35개 웹사이트에서 인간이 주석을 단(human-annotated) 문맥적 연관성 데이터셋을 구축할 것이며, 페이지당 3명의 독립적인 주석 작성자를 배치할 것입니다. 각 페이지는 접근성 트리에서 파생된 그래프로 표현되며, DOM 및 CSS의 공간적(spatial) 및 의미적(semantic) 특징을 통해 보강됩니다. 우리는 사전 등록된 통계적 프레임워크 하에 leave-one-site-out 교차 검증(cross-validation)을 사용하여 네 가지 머신러닝 모델(MLP, GCN, GAT, SEAL)을 두 가지 휴리스틱(heuristic) 베이스라인과 비교하며, Hit@K 및 MRR을 지표로 사용합니다. [결과] 파이프라인을 구축하고 검정력 시뮬레이션(power simulation)의 매개변수를 설정하기 위해 5개 사이트에 대해 저자가 주석을 단 파일럿 연구(pilot study)를 수행했습니다. 파일럿 연구 결과 Hit@10은 네 가지 학습된 모델에서 0.16~~0.85, 두 가지 휴리스틱 베이스라인에서 0.08~~0.30 범위를 나타냈습니다. 최종 결과는 계획된 실험과 분석이 완료된 후 보고될 예정입니다. [결론] 본 연구는 웹페이지의 문맥적 연관성에 대한 인간 주석 데이터셋, 접근성 트리 그래프에서의 문맥 선택을 위한 링크 예측의 실증적 평가, 그리고 사이트 간 일반화 분석에 기여합니다.

AI 자동 생성 콘텐츠

원문 바로가기

웹 접근성을 위한 웹페이지 요소 간의 문맥적 연관성: 실증 연구

요약

핵심 포인트

댓글