본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 24. 11:43

AutoSpecNER: 차량 사양 추출을 위한 세밀한 개체명 인식 (Named Entity Recognition) 데이터셋

요약

차량 사양 추출을 위한 세밀한 개체명 인식(NER) 데이터셋인 AutoSpecNER를 제안합니다. 복잡한 차량 속성을 정밀하게 식별할 수 있도록 설계되었으며, 벤치마크 테스트를 통해 모델 성능 향상 효과를 입증했습니다.

핵심 포인트

  • 차량 사양 추출을 위한 새로운 NER 데이터셋 AutoSpecNER 제안
  • 엔진, 변속기 등 고도로 세분화된 태그 세트 활용
  • 사전 학습된 언어 모델을 통한 벤치마크 성능 검증 완료
  • 비정형 텍스트 내 미세한 차량 정보 포착 능력 강화

본 논문은 차량 사양 추출을 위한 세밀한 개체명 인식 (Named Entity Recognition, NER) 데이터셋인 AutoSpecNER를 소개합니다. 차량 사양 정보는 복잡하고 정형화되지 않은 텍스트 형식으로 존재하는 경우가 많아, 이를 정확하게 추출하는 것은 매우 도전적인 과제입니다. 우리는 차량의 다양한 속성(예: 엔진 유형, 변속기, 구동 방식 등)을 정밀하게 식별할 수 있도록 설계된 새로운 데이터셋을 제안합니다. AutoSpecNER는 고도로 세분화된 태그 세트를 사용하여 기존의 일반적인 NER 모델이 놓치기 쉬운 미세한 사양 정보를 포착할 수 있도록 합니다. 우리는 다양한 사전 학습된 언어 모델 (Pre-trained Language Models)을 사용하여 AutoSpecNER 데이터셋에 대한 벤치마크 테스트를 수행하였으며, 제안된 데이터셋이 차량 사양 추출 작업에서 모델의 성능을 향상시키는 데 기여할 수 있음을 입증하였습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0