본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 14. 14:23

GHGbench: 탄소 배출 예측을 위한 통합 멀티 엔티티, 멀티 태스크 벤치마크

요약

GHGbench는 기업 및 건물 수준의 온실가스 배출량 예측을 위한 통합 공개 데이터셋이자 벤치마크입니다. 이 벤치마크는 기업 트랙(Scope 1+2, Scope 3 공시 정보 포함)과 여러 대도시에 걸친 건물 트랙(기후 공변량 및 멀티모달 원격 탐사 임베딩 포함)을 제공하며, 표준화된 평가 분할을 정의합니다. GHGbench는 모델의 성능을 다분포 내 예측뿐만 아니라 교차 지역/도시 전이 등 다양한 시나리오에서 체계적으로 검증하고, 테이블형 파운데이션 모델과 멀티모달 임베딩의 중요성을 입증합니다.

핵심 포인트

  • GHGbench는 기업 및 건물 온실가스 배출량 예측을 위한 통합적이고 표준화된 벤치마크를 제공한다.
  • 건물 배출량은 구조적으로 기업 배출량보다 예측하기 더 어렵다.
  • 모델 성능의 격차는 분포 내(In-distribution)와 분포 외(Out-of-distribution) 간에 가장 크게 나타난다.
  • 테이블형 파운데이션 모델과 멀티모달 원격 탐사 임베딩은 다도시 건물 배출량 태스크에서 강력한 예측 능력을 보여준다.

엔티티(Entity) 수준의 탄소 배출 예측을 위한 공개 데이터셋과 벤치마크는 접근성, 규모, 세밀도(Granularity) 및 평가 방식 측면에서 여전히 파편화되어 있습니다. 우리는 기업 및 건물 수준의 온실가스(Greenhouse-gas) 예측을 위한 공개 데이터셋이자 벤치마크인 GHGbench를 소개합니다. 기업 트랙(Company track)은 Scope 1+2 및 Scope 3 공시 정보와 재무/섹터 신호를 포함하여 12,000개 이상의 기업으로부터 추출한 32,000개 이상의 기업-연도(Company-year) 기록을 포함합니다. 건물 트랙(Building track)은 13개의 공개 소스로부터 491,591개의 건물-연도(Building-year) 기록을 26개 대도시 지역(미국 10곳, 호주 15곳, 싱가포르 1곳)에 걸쳐 단일 스키마(Schema)로 통합하였으며, 기후 공변량(Climate covariates)과 멀티모달 원격 탐사 임베딩(Multimodal remote-sensing embeddings)을 포함합니다. GHGbench는 분포 내(In-distribution) 및 교차 지역/도시 전이(Cross-region/city transfer)를 주요 태스크로 정의하고, 시간적 홀드아웃(Temporal hold-out) 및 단기 예측(Short-horizon forecasting)을 보충적인 부록 증거로 정의하는 표준 분할(Canonical splits)을 설정합니다. 주요 베이스라인(Baselines)은 그래디언트 부스팅 트리(Gradient-boosted trees), 테이블형 파운데이션 모델(Tabular foundation model), MLP, FT-Transformer, 그리고 멀티모달 융합(Multimodal fusion)을 아우르며, LLM 패널을 보조적으로 활용하며, 모든 모델은 멀티 시드 페어드 부트스트랩(Multi-seed paired-bootstrap) 테스트 하에 평가됩니다. 세 가지 벤치마크 수준의 발견 사항이 도출되었습니다: (i) 건물 배출량은 구조적으로 기업 배출량보다 예측하기 어렵습니다; (ii) 기업 트랙과 건물 트랙 모두에서 분포 내(In-distribution)와 분포 외(Out-of-distribution) 사이의 격차가 모델 내부의 격차보다 훨씬 큽니다. 또한 우리가 알기로는 테이블형 파운데이션 모델이 다도시 건물 배출량 태스크에서 튜닝된 트리(Tuned trees) 모델보다 페어드 부트스트랩 측면에서 유의미한 격차를 벌린 첫 번째 베이스라인입니다; (iii) 멀티모달 원격 탐사 임베딩은 테이블형 일반화(Tabular generalisation)가 무너지는 지점에서 정밀한 예측에 도움을 줍니다. GHGbench는 또한 치명적인 도시 전이(City transfer) 문제와 섹터 요인 조회(Sector-factor lookup)의 한계를 체계적인 실패 모드(Failure modes)로 노출합니다. 코드와 재구성 레시피는 GHGbench에서 확인할 수 있습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0