본문으로 건너뛰기

© 2026 Molayo

X요약2026. 04. 27. 15:00

9만 9천 행 규모의 사이버 보안 SFT 데이터셋 공개

요약

개발자 Alican Kiraz0 가 준비한 오픈소스 사이버 보안 데이터셋을 Hugging Face 에서 무료로 공개했습니다. 이 데이터셋은 1999 년부터 2025 년까지의 모든 CVE(취약점) 기록을 SFT(Supervised Fine-Tuning, 지도학습용 미세조정) 형식으로 변환하여 구성되었습니다. 총 99,000 행 규모의 데이터를 제공하며, 보안 AI 모델 학습이나 관련 연구에 활용 가능합니다.

핵심 포인트

  • 1999~2025 년까지의 모든 CVE 기록이 포함된 데이터셋을 공개했습니다.
  • 총 99,000 행 규모의 SFT 형식 데이터를 제공합니다.
  • Hugging Face 에서 'All-CVE-Records-Training-Dataset' 이름으로 무료로 다운로드 가능합니다.

사이버 보안 분야에서 제가 준비한 오픈 소스 99,000 행 규모의 SFT 데이터셋과 SFT 형식으로 변환한 1999–2025 사이의 모든 CVE 기록이 포함된 데이터셋을 아래 링크에서 확인하실 수 있습니다.

SFT Cybersecurity Dataset:
https://huggingface.co/datasets/AlicanKiraz0/All-CVE-Records-Training-Dataset

AI 자동 생성 콘텐츠

본 콘텐츠는 X @alicankiraz0 (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
4

댓글

0