CurEvo: 비디오 이해를 위한 커리큘럼 지향적 자기 진화
요약
CurEvo는 기존 자기 진화(self-evolution) 방식이 가진 구조적 지침 부족 문제를 해결하기 위해, 커리큘럼 학습(curriculum learning)을 도입한 새로운 프레임워크입니다. 이 프레임워크는 모델의 현재 능력에 맞춰 작업 난이도를 동적으로 조절하고 평가 기준과 데이터 다양성을 균형 있게 조정하는 '커리큘럼 지향적 피드백 루프'를 형성합니다. 이를 통해 비디오 이해 과정(지각, 인식, 이해)을 구조화되고 점진적인 학습 과정으로 전환하여, 자율 비디오 이해의 성능을 크게 향상시킵니다.
핵심 포인트
- CurEvo는 자기 진화 기반 비디오 이해 프레임워크에 커리큘럼 학습 원리를 적용했습니다.
- 모델 능력에 따라 작업 난이도와 데이터 다양성을 동적으로 조절하는 '커리큘럼 지향적 피드백 루프'를 구축합니다.
- 지각, 인식, 이해의 다차원적인 QA 프레임워크를 개발하여 일관되고 측정 가능한 학습 진행을 보장합니다.
- 7가지 백본에 걸쳐 4개의 VideoQA 벤치마크에서 성능 개선 효과를 입증했습니다.
최근 자기 진화 (self-evolution) 기반 비디오 이해 프레임워크의 발전은 인간 주석 없이도 자율 학습이 가능할 잠재력을 입증해 왔다. 그러나 기존 방법들은 반복적인 학습 과정 전반에 걸쳐 구조화된 지침이 부족하여, 약하게 제어된 최적화 (weakly controlled optimization) 와 통제되지 않은 난이도 진행 (uncontrolled difficulty progression) 에 종종 시달려 왔다. 이러한 한계를 해결하기 위해, 우리는 자기 진화에 커리큘럼 학습 (curriculum learning) 을 도입하여 보다 구조적이고 점진적인 모델 개선을 달성하는 커리큘럼 지향적 자기 진화 프레임워크인 CurEvo 를 제안한다. CurEvo 는 모델의 능력에 따라 작업 난이도를 동적으로 조절하고, 평가 기준을 정제하며, 데이터 다양성을 균형 있게 조정함으로써 학습 복잡도와 모델 능력을 일치시키는 커리큘럼 지향적 피드백 루프 (curriculum-guided feedback loop) 를 형성한다. 이 원칙을 바탕으로, 우리는 지각 (perception), 인식 (recognition), 이해 (understanding) 차원을 아우르며 질문 생성과 답변 평가를 동시에 진화시키는 다차원 적응형 QA 프레임워크를 개발하여 일관되고 측정 가능한 커리큘럼 진행을 보장한다. 이러한 통합을 통해 CurEvo 는 약하게 제어된 자기 진화를 자율 비디오 이해를 위한 보다 구조화된 학습 과정으로 전환시킨다. 7 가지 백본 (backbones) 에 걸쳐, CurEvo 는 4 개의 VideoQA 벤치마크에서 벤치마크 정확도와 평가기 기반 의미적 점수 (evaluator-based semantic score) 를 일관되게 개선함으로써 커리큘럼 지향적 자기 진화의 비디오 이해에 대한 효과성을 검증하였다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기