본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 01. 16:27

생성형 인공지능을 활용한 학술 출판물의 연구 데이터 재사용 측정: 오픈 사이언스 지표 개발 및 예비 결과

요약

본 기사는 오픈 사이언스 관행 중 하나인 '연구 데이터 재사용'의 영향력을 측정하기 위한 새로운 LLM 기반 지표를 개발했습니다. PLOS와 DataSeer는 이 지표를 통해 기존 계량학적 방법보다 높은 43%의 데이터 재사용률을 측정하는 데 성공했으며, 이는 생성형 AI가 대규모 연구 데이터 재사용 측정을 가능하게 함을 시사합니다.

핵심 포인트

  • 오픈 사이언스 분야에서 '연구 데이터 재사용'의 영향력 측정 중요성이 증가하고 있습니다.
  • LLM(대규모 언어 모델) 기반 지표를 개발하여 연구 데이터 재사용률을 효과적으로 측정할 수 있게 되었습니다.
  • 개발된 LLM 지표는 기존 계량학적 기법보다 높은 43%의 데이터 재사용률을 보여주며, 그 유효성을 입증했습니다.
  • 생성형 AI를 활용하면 대규모 연구 데이터 공유 및 재사용 효과를 보다 정확하게 측정할 수 있습니다.

다수의 메타사이언스 연구와 다른 이니셔티브들은 오픈 사이언스의 '하류' 효과나 영향력을 이해하는 것이 더 중요해짐에 따라 오픈 사이언스 관행의 유병률을 모니터링하기 시작했습니다. PLOS 와 DataSeer 는 오픈 사이언스의 중요한 효과인 연구 데이터의 재사용을 측정하기 위한 새로운 LLM 기반 지표를 개발했습니다. 우리의 결과는 기존 계량학적 기법보다 높은 43% 의 데이터 재사용율을 보여주었습니다. 우리는 LLM 과 생성형 인공지능을 사용하여 대규모로 데이터 재사용을 측정할 수 있음을 보여줍니다. 현재 연구 데이터 공유 및 재사용의 긍정적 효과는 과소평가될 가능성이 있습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
4

댓글

0