기술 증류(Skill Distillation)를 통한 브라우저 상의 확장 가능한 행동 복제(Scalable Behaviour Cloning)
요약
인간의 브라우징 상호작용 궤적을 자연어 기술로 변환하여 브라우저 에이전트의 성능을 높이는 기술 증류(Skill Distillation) 연구를 소개합니다. 증류된 기술을 기술 그래프로 구성하여 에이전트가 지식을 통합하고 확장할 수 있도록 합니다.
핵심 포인트
- 인간의 브라우징 데이터를 압축된 자연어 기술로 변환
- 저수준 동작보다 불완전한 정보 하의 의사결정 문제 해결에 집중
- 기술 그래프를 통해 지식의 무제한 축적이 아닌 통합 중심의 성장 도모
- 집단적 기술을 활용한 브라우저 에이전트의 확장성 확보
인터넷 사용자들은 소프트웨어 개발 및 문서 편집부터 검색, 양식 작성, 기업 워크플로에 이르기까지 웹 브라우저를 통해 방대한 범위의 숙련된 작업을 공동으로 수행하며, 이는 인간의 브라우징을 매우 확장 가능하지만 아직 충분히 활용되지 않은 재사용 가능한 브라우저 기술(browser skills)의 원천으로 만듭니다. 우리는 브라우저 에이전트(browser agents)의 병목 현상이 저수준 동작(low-level operation)보다는 불완전한 정보 하에서의 의사결정에 있으며, 에이전트에게 부족한 사전 지식(priors)은 이미 인간의 상호작용 궤적(interaction traces)에 암시되어 있다고 주장합니다. 따라서 우리는 기술 증류(skill distillation)를 통해 브라우저 에이전트를 위한 확장 가능한 행동 복제(scalable behavior cloning)를 연구하며, 사용자 상호작용 궤적을 에이전트가 직접 읽고, 검색하고, 재사용하고, 조합할 수 있는 압축된 자연어 기술(natural-language skills)로 변환합니다. 나아가 우리는 증류된 기술들을 기술 그래프(skill graph)로 구성하여, 성장이 무제한적인 축적이 아닌 통합을 통해 진행되도록 합니다. 이는 브라우저 에이전트의 확장성이 수동으로 설계된 작업보다는 인터넷 사용자들이 이미 표현하고 있는 집단적 기술로부터 올 수 있음을 시사합니다. 우리의 프로젝트는 다음에서 확인할 수 있습니다: https://lab.einsia.ai/browserbc/.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기