기술 신조어: 기술 기반 지속 학습을 위한 방향
요약
본 기사는 LLM의 능력을 새로운 기술에 맞춰 확장하는 어려움을 다루며, 기존 파인튜닝 방식의 한계(재기억 위험)와 컨텍스트 기반 접근법의 제한성을 지적합니다. 이를 해결하기 위해 '기술 신조어(skill neologisms)'라는 개념을 제안하는데, 이는 모델 가중치 업데이트 없이 특정 기술 능력을 선택적으로 확장하는 방법입니다. 연구 결과, 이 신조어가 사전 학습된 LLM에 통합되어 다양한 기술과 조합 가능하며, 심지어 제로샷으로도 기능을 수행할 수 있음을 입증했습니다.
핵심 포인트
- LLM의 지속적인 능력 확장은 파인튜닝의 재기억 위험이나 컨텍스트 기반 접근법의 표현력 제한 등의 문제에 직면해 있습니다.
- '기술 신조어(skill neologisms)'는 모델 가중치 업데이트 없이 새로운 기술 능력을 선택적으로 확장하는 혁신적인 방법입니다.
- 이 신조어는 사전 학습된 LLM에 통합되어 다양한 기술과 조합 가능하며, 분포 밖(out-of-distribution)의 기술에도 적용될 수 있습니다.
- 기술 신조어를 통해 모델은 제로샷 방식으로 새로운 기술을 습득하고 지속적으로 능력을 확장할 수 있는 경로를 제공받습니다.
현대적인 LLM(대형 언어 모델) 은 지속적으로 증가하는 다양한 기술의 숙련과 이를 유연하게 구성할 수 있는 능력을 보여줍니다. 그러나 새로운 기술을 확장 가능한 방식으로 모델의 능력을 확장하는 것은 여전히 해결되지 않은 문제입니다: 파인튜닝 (fine-tuning) 과 파라미터 효율적 변형은 재학습을 통한 재기억 (catastrophic forgetting) 의 위험이 있으며, 컨텍스트 기반 접근법은 표현력이 제한되어 있고 모델의 유효 컨텍스트에 의해 제약받습니다. 우리는 모델의 어휘에 통합된 소프트 토큰 (soft tokens) 과 특정 기술의 능력을 향상시키기 위해 최적화된 '기술 신조어 (skill neologisms)'를 연구합니다. 이는 무게 업데이트 없이 새로운 기술을 선택적으로 확장하는 방법입니다. 먼저 오프더셸프 (off-the-shelf) 사전 학습된 LLM 이 이미 절차적 지식과 관련된 토큰을 보여준다는 것을 관찰했습니다. 우리는 기술 신조어가 특정 기술의 모델 능력을 향상시킬 수 있으며, 분포 밖 (out-of-distribution) 기술과 함께 구성 가능하며, 독립적으로 훈련된 기술 신조어는 제로샷 (zero-shot) 으로 구성될 수 있음을 보여주었습니다. 이러한 결과는 기술 신조어가 기술 기반 지속 학습으로 가는 확장 가능한 경로를 제공할 수 있음을 시사합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기