PatRe: 특허 심사 전 단계의 사무소 조치 및 반박 생성 벤치마크

특허 심사는 기술적 전문성과 법적 추론이 모두 필요한 복잡하고 다단계 프로세스로, 신청량 증가로 인해 더욱 도전받고 있습니다. 기존 벤치마크들은 특허 심사를 판별적 분류 또는 정적 추출으로 주로 바라보며, 학술 출판에서의 동료 검토 및 반박 과정과 유사한 본질적인 상호작용적이고 반복적인 특성을 포착하지 못했습니다. 이 논문에서는 사무소 조치 생성 및 신청인 반박을 포함한 특허 심사 전 과정을 모델링하는 첫 번째 벤치마크인 PatRe 를 소개합니다. PatRe 는 480 개의 실제 사례를 포함하며, 오라클 (oracle) 및 검색 시뮬레이션 평가 설정을 모두 지원합니다. 우리의 벤치마크는 특허 심사를 정당화와 응답의 동적 다중 턴 과정으로 재정의합니다. 다양한 LLM(대규모 언어 모델) 에 대한 광범위한 실험은 모델 성능에 대한 중요한 통찰력을 제공하며, 이는专有 (proprietary) 및 오픈소스 모델 간의 차이뿐만 아니라 심사자 분석과 신청인 측 반박 사이의 작업 비대칭성까지 포함합니다. 이러한 발견들은 LLM 이 특허 심사의 복잡한 실제 세계 법적 추론 및 기술적 신규성 판단을 모델링하는 데 있어 잠재력과 현재의 한계를 모두 강조합니다. 우리는 특허 심사 모델링의 미래 연구를 촉진하기 위해 코드와 데이터셋을 공개합니다.

Insights

PatRe: 특허 심사 전 단계의 사무소 조치 및 반박 생성 벤치마크

요약

핵심 포인트

댓글

GPT-5.6 완전 가이드: Sol, Terra, Luna의 성능, 가격 및 사용 권장 사항

T. Rowe Price의 Love, 소형주 수익성이 개선되고 있다고 말하다

운영 환경에서 OpenRouter 실행하기: 무엇이 고장 나고, 무엇이 작동하며, 내가 다르게 할 일들

또 다른 암호화폐 기업이 비트코인 보유량을 매각하다

GPT-5.6 완전 가이드: Sol, Terra, Luna의 성능, 가격 및 사용 권장 사항

T. Rowe Price의 Love, 소형주 수익성이 개선되고 있다고 말하다

운영 환경에서 OpenRouter 실행하기: 무엇이 고장 나고, 무엇이 작동하며, 내가 다르게 할 일들

또 다른 암호화폐 기업이 비트코인 보유량을 매각하다