가짜 이미지 탐지를 위한 딥러닝 모델의 비교 평가
요약
본 연구는 GAN 기반의 정교한 이미지 조작에 대응하기 위해 VGG16, ResNet50, EfficientNetB0, XceptionNet 등 네 가지 CNN 아키텍처의 가짜 이미지 탐지 성능을 비교 평가했습니다. 실험 결과 VGG16이 91%로 가장 높은 정확도를 보였으며, 데이터 불균형과 과적합 문제를 해결하기 위한 데이터 증강 및 공정성 기반 학습의 중요성을 제시했습니다.
핵심 포인트
- VGG16 모델이 91%의 정확도로 네 가지 아키텍처 중 가장 우수한 탐지 성능을 기록함
- EfficientNetB0는 가짜 이미지에 대한 민감도는 높으나 실제 샘플에 대한 신뢰도가 낮아 데이터 불균형에 따른 편향을 보임
- 데이터셋 불균형, 과적합, 해석 가능성 부족이 교차 도메인 강건성을 저해하는 주요 한계점으로 지적됨
- 신뢰할 수 있는 탐지 시스템 구축을 위해 균형 잡힌 데이터셋과 고급 증강 기술, 공정성 고려 학습이 필수적임
GAN (Generative Adversarial Networks) 기반 이미지 조작 기술이 점점 정교해짐에 따라 디지털 포렌식 (Digital Forensics) 분야에 상당한 도전 과제가 제기되고 있습니다. 본 연구는 통합된 전처리 (Preprocessing) 및 학습 파이프라인을 사용하여 VGG16, ResNet50, EfficientNetB0, XceptionNet을 포함한 네 가지 사전 학습된 CNN (Convolutional Neural Network) 아키텍처의 가짜 이미지 탐지 성능을 비교합니다. 클래스 불균형 (Class Imbalance) 문제를 해결하고 일반화 (Generalization) 성능을 향상시키기 위해, 실제 이미지와 조작된 이미지로 구성된 데이터셋을 크기 조정 (Resizing), 정규화 (Normalization), 데이터 증강 (Augmentation) 과정을 통해 처리하였습니다. 모델은 정확도 (Accuracy), 정밀도 (Precision), 재현율 (Recall), F1-score, 그리고 ROC-AUC를 사용하여 평가되었습니다. VGG16은 91%로 가장 높은 정확도를 달 기록하였으며, XceptionNet, ResNet50, EfficientNetB0는 각각 90%에 도달했습니다. EfficientNetB0는 가짜 이미지에 대해 더 강한 민감도를 보였으나 실제 샘플에 대한 신뢰도는 감소하였는데, 이는 불균형으로 인한 편향 (Bias)을 반영합니다. 한계점으로는 데이터셋 불균형, 과적합 (Overfitting), 그리고 제한된 해석 가능성 (Interpretability)이 있으며, 이는 교차 도메인 강건성 (Cross-domain Robustness)에 영향을 미칩니다. 본 연구는 재현 가능한 베이스라인 (Baseline)을 제공하며, 신뢰할 수 있는 가짜 이미지 탐지 시스템을 개발하기 위해 균형 잡힌 데이터셋, 고급 증강 기술, 그리고 공정성을 고려한 학습 (Fairness-aware training)의 필요성을 강조합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기