
양방향 진화 탐색을 통한 자기 개선 LLM (Self-Improving LLMs with Bidirectional Evolutionary
요약
양방향 진화 탐색(BES)은 후보군 진화와 목표 분해를 결합하여 LLM의 사후 학습 및 추론 성능을 개선하는 프레임워크입니다. 좁은 엔트로피 껍질을 탈피하고 조밀한 중간 피드백을 제공하는 것이 특징입니다.
핵심 포인트
- 전방향 진화와 후방향 목표 분해 결합
- 사후 학습(Post-training) 및 추론 성능 개선
- 좁은 엔트로피 껍질 탈피 및 조밀한 피드백 제공
양방향 진화 탐색 (Bidirectional Evolutionary Search)을 통해 후보군을 전방향으로 진화시키는 것과 목표를 후방향으로 분해 (goal decomposition)하는 것을 결합하여, 좁은 엔트로피 껍질 (narrow entropy shells)을 벗어나고 조밀한 중간 피드백 (dense intermediate feedback)을 제공함으로써 사후 학습 (post-training)과 추론 (inference)을 모두 개선하는 탐색 프레임워크입니다.
논문:
https://huggingface.co/papers/2605.28814
…
컬렉션:
https://huggingface.co/collections/Xkev/bes
…
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기