대형 언어 모델 (LLM) 을 활용한 혁신 예측

혁신의 출현을 의도한 기술적 조합의 예측은 과학과 정책의 근본적인 과제입니다. 우리는 미래의 조합이 특허의 집단 언어에 초기 흔적을 남긴다는 것을 보여주며, 이 예측 신호는 수십 년 전에 감지될 수 있음을 보여줍니다. 우리는 이러한 신호가 단일 발명가에 귀속되지 않으며, 수천 개의 특허에 걸쳐 기술이 어떻게 기술적으로 기술되는지에 대한 집단적 변화로 나타난다고 합니다. 이를 위해 우리는 국제 특허 분류 (IPC) 코드로 분류된 기술을 어휘의 단어로 취급하는 트랜스포머 기반 모델인 TechToken 을 소개합니다. 이 모델을 통해 우리는 이러한 코드를 미세 조정 (fine-tuning) 과정에서 임베딩함으로써 기술의 언어를 학습합니다. 우리는 코드 임베딩 간의 문맥 유사성 (context similarity) 을 언어적 수렴 (linguistic convergence) 의 측정으로 정의하며, 이는 첫 번째 기술적 조합을 정확하게 예측함을 보여줍니다. TechToken 은 또한 일반 표현 품질을 개선하여 다양한 특허 관련 과제에서 최첨단 모델보다 우수한 성능을 보입니다.

Insights

대형 언어 모델 (LLM) 을 활용한 혁신 예측

요약

핵심 포인트

댓글

AI 에이전트를 실행하는 데 실제로 드는 비용은 얼마인가?

GitHub, Issues를 위한 에이전트 자동화 제어 기능 출시

D200X를 위한 Vibe Deck — Ulanzi D200X를 AI 코딩 에이전트용 커맨드 데크로 변신시키기

Windowed-MTP: 백만 토큰 컨텍스트에서 Full-Context Draft-KV 비용 제거하기

AI 에이전트를 실행하는 데 실제로 드는 비용은 얼마인가?

GitHub, Issues를 위한 에이전트 자동화 제어 기능 출시

D200X를 위한 Vibe Deck — Ulanzi D200X를 AI 코딩 에이전트용 커맨드 데크로 변신시키기

Windowed-MTP: 백만 토큰 컨텍스트에서 Full-Context Draft-KV 비용 제거하기