PHAGE: 표현 학습을 위한 특허 이질적 어텐션 가이드 그래프 인코더

특허 청구항은 의존하는 청구항이 이전 청구항의 범위를 상속하고 정교화하는 방향성 종속 구조를 형성합니다. 그러나 기존의 특허 인코더는 청구항을 텍스트로 선형화하여 이러한 계층 구조를 버립니다. 이 구조를 자체 어텐션(self-attention)에 직접 인코딩하는 것은 두 가지 문제를 야기합니다. 첫째, 청구항 의존성은 의미론적 및 추출 신뢰도가 다른 관계 유형들을 혼합하며, 둘째, 종속성 그래프는 청구항을 기반으로 정의되지만 트랜스포머(Transformers)는 토큰에 대해 어텐션합니다. PHAGE는 결정론적 그래프 구성 파이프라인을 통해 첫 번째 문제를 해결하는데, 이 파이프라인은 근접 결정론적 법률 인용(legal citations)과 노이즈가 많은 규칙 기반 기술 관계를 분리하여 유형 구분을 이질적인 엣지(heterogeneous edges)로 보존합니다. 또한 연결성 마스크(connectivity mask)와 학습 가능한 관계 인식 바이어스(learnable relation-aware biases)를 통해 두 번째 문제를 해결하며, 이는 청구항 수준의 토폴로지를 토큰 수준의 어텐션으로 끌어올려 인코더가 각 관계 유형을 차별적으로 가중할 수 있게 합니다. 이어서 이중 그라뉼러리티 대조 목적 함수(dual-granularity contrastive objective)를 통해 표현을 특허 간 분류학(inter-patent taxonomy)과 특허 내 토폴로지(intra-patent topology) 모두와 정렬합니다. PHAGE는 분류, 검색 및 클러스터링에서 모든 기준 모델(baselines)을 능가하는 성능을 보였으며, 문서 내 청구항의 토폴로지가 문서 간 구조보다 더 강력한 귀납적 편향(inductive bias)이며, 이 편향이 학습 후 인코더 가중치에 지속됨을 보여줍니다.

Insights

PHAGE: 표현 학습을 위한 특허 이질적 어텐션 가이드 그래프 인코더

요약

핵심 포인트

댓글

MaxLinear, 2026년 광학 데이터 센터 매출 전망치를 2억 1,000만~2억 3,000만 달러로 상향하며 3분기 매출을 2억 1

Digital Realty, 42.5억~47.5억 달러 규모의 자본 지출 (Capex) 계획을 바탕으로 프로모트를 제외한 2026년 주당 핵심

무작위 설계를 통한 KV-Cache 제거를 위한 오류 인증 (Error Certificates)

GS-Agent: 생성형 시뮬레이션을 통한 4D 물리 세계 구축

MaxLinear, 2026년 광학 데이터 센터 매출 전망치를 2억 1,000만~2억 3,000만 달러로 상향하며 3분기 매출을 2억 1

Digital Realty, 42.5억~47.5억 달러 규모의 자본 지출 (Capex) 계획을 바탕으로 프로모트를 제외한 2026년 주당 핵심

무작위 설계를 통한 KV-Cache 제거를 위한 오류 인증 (Error Certificates)

GS-Agent: 생성형 시뮬레이션을 통한 4D 물리 세계 구축