그래프 인지 적응형 노이징을 통한 사실 기반 및 편집 감수성 그래프-시퀀스 생성

그래프-시퀀스 생성 (G2S) 을 위한 미세 조정된 오토리gresiv 모델은 종종 사실적 근거 (factual grounding) 와 편집 감수성 (edit sensitivity) 에서 어려움을 겪습니다. 이러한 문제를 해결하기 위해, 입력 그래프에 조건부인 반복적 정제를 통해 텍스트를 생성하는 비오토리gresiv 확산 프레임워크를 제안합니다. 이를 그래프 인지 언어 모델 (Diffusion Language Model for Graphs, DLM4G) 이라 명명합니다. 그래프 구성 요소 (엔티티/관계) 와 해당 시퀀스 토큰을 정렬함으로써, DLM4G 는 적응형 노이징 전략을 사용합니다. 제안된 전략은 토큰별 디노이징 에러를 신호로 사용하여 엔티티 및 관계 토큰의 노이즈에 적응적으로 변조 (modulate) 하여 그래프 구조 보존을 개선하고, 그래프 편집 하에서 지역적 업데이트 (localized updates) 를 가능하게 합니다. 세 가지 데이터셋에서 평가된 결과, DLM4G 는 동일한 분할로 훈련된 경쟁력 있는 G2S 확산 베이스라인보다 표면 형태 기반 및 임베딩 기반 지표 모두에서 일관되게 우수한 성능을 보였습니다. 또한, 미세 조정된 오토리gresiv 베이스라인 (예: T5-Large) 보다 최대 12 배 큰 모델 대비 더 뛰어난 성능을 보여주며, 제로샷 LLM 전이 베이스라인과도 최대 127 배 큰 모델 대비 경쟁력 있는 성능을 발휘합니다. 가장 강력한 미세 조정된 PLM 베이스라인에 비해 DLM4G 는 사실적 근거 (FGT@0.5) 를 +5.16% 향상시키고 편집 감수성 (ESR) 을 +7.9% 개선했습니다. 최상의 확산 베이스라인과 비교할 때는 FGT@0.5 에서 +3.75%, ESR 에서 +23.6% 의 향상을 기록했습니다. 우리는 또한 분자 캡셔닝 실험을 통해 텍스트 기반 그래프를 넘어선 적용 가능성을 입증하여, 이 방법론이 과학적 G2S 생성에 대한 일반성을 보여주었습니다.

Insights

그래프 인지 적응형 노이징을 통한 사실 기반 및 편집 감수성 그래프-시퀀스 생성

요약

핵심 포인트

댓글

llama.cpp MTP 투기적 디코딩(speculative decoding) 요약: 2026년 7월 기준 Dense 모델에서는 큰 이득

하나의 에이전트에 3개의 MCP 서버를 연결했더니 무서울 정도로 빨라졌다

당신의 CLAUDE.md는 확장되지 않습니다. AI 표준을 코드로 버전 관리하세요.

플라스틱 전자책 단말기 케이스가 분류(Classifier) 문제로 변할 때

llama.cpp MTP 투기적 디코딩(speculative decoding) 요약: 2026년 7월 기준 Dense 모델에서는 큰 이득

하나의 에이전트에 3개의 MCP 서버를 연결했더니 무서울 정도로 빨라졌다

당신의 CLAUDE.md는 확장되지 않습니다. AI 표준을 코드로 버전 관리하세요.

플라스틱 전자책 단말기 케이스가 분류(Classifier) 문제로 변할 때