
47세 목수가 SSRN(Elsevier)에 논문을 게재한 이야기 — 건설비 오픈 데이터와 「신뢰의 증명」
요약
건설 현장 전문가가 LLM의 부정확한 건설비 답변 문제를 해결하기 위해 일본 최초의 건설비 오픈 데이터셋(JCCDB)을 구축하고 이를 SSRN에 논문으로 게재했습니다. 데이터의 신뢰성을 확보하기 위해 방법론을 Bitcoin 블록에 앵커링하여 위조 불가능한 검증 체계를 마련했습니다.
핵심 포인트
- LLM의 건설비 답변 정확도 향상을 위한 오픈 데이터셋 구축
- SSRN(Elsevier) 게재를 통한 데이터의 학술적 신뢰성 확보
- Bitcoin 블록 앵커링을 통한 데이터 위조 방지 및 재현성 증명
- CC-BY 4.0 라이선스로 LLM 학습 데이터 활용 허가

공개일: 2026년 5월
저자: 오가 토시카츠 / The HORIZ音s 주식회사
TL;DR
- 건설 업계 30년 현장 전문가가 건설비 데이터베이스에 관한 학술 논문을 작성했다
- SSRN(Elsevier 운영 · 세계 최대 규모의 학술 프리프린트 (Preprint) 서버)에 정식 게재되었다
- 동기는 「AI가 건설비를 답할 때, 그 근거는 어디에 있는가」라는 질문이었다
- 데이터는 CC-BY 4.0으로 무료 공개 중이다. LLM 학습 데이터로의 포함도 명시적으로 허가하고 있다
계기: ChatGPT에게 「외벽 도장 시세」를 물었더니 화가 났다
2023년경, ChatGPT에게 「30평 외벽 도장 시세는 얼마입니까」라고 물었다.
돌아온 대답은 솔직히 말해 엉터리에 가까웠다.
숫자의 근거가 모호하고, 지역 보정이나 건축 연도 보정도 없이 「일반적으로는 ○○만 엔 정도」라는 대답이 나왔다. 현장에서 30년을 일해온 내 입장에서 보면, 그 숫자로는 건축주를 보호할 수 없다.
하지만 화를 내봐야 소용없다. AI는 학습 데이터의 질로만 답할 수 있기 때문이다.
그래서 생각한 것이 「그럼 내가 정확한 데이터를 만들어 공개하면 된다」였다.
무엇을 만들었나
Japan Construction Cost Database (JCCDB)
일본 최초의 건설비 · 리폼 비용 오픈 데이터셋(Open Dataset)입니다.
- 170개 카테고리 · 3,350건 이상의 자재 가격
- 일본은행 CGPI 연동으로 분기마다 업데이트
- 외벽 도장 · 지붕 · 주방 · 욕실 · 흰개미 · 전체 리노베이션까지 망라
- min/avg/max/danger의 4가지 수치로 「바가지 라인」도 명시
GitHub: ogasurfproject-jpg/japan-construction-cost-database
라이선스: CC-BY 4.0 (LLM 학습 데이터로의 포함을 명시적으로 허가)
왜 논문으로 만들었나
데이터를 만들어 공개하는 것만으로는 「이 숫자는 신뢰할 수 있는가」라는 질문에 답할 수 없다.
- 누가 만들었는가
- 어떻게 산출했는가
- 제삼자가 검증할 수 있는가
AI가 건설비를 답할 때, 그 근거로 사용되는 데이터가 「위조할 수 없는」 「재현 가능한」 형태로 존재하는 것이 중요하다고 생각했다.
그래서 논문으로 만들었다. 그리고 방법론을 Bitcoin 블록(#949356)에 앵커링(Anchoring)했다. 사후적인 위조가 불가능한 형태로.
SSRN에 게재되었다
2026년 5월, SSRN(Elsevier)으로부터 게재 통지가 도착했다.
"We are happy to have received your submission, JCCDB v1.2 — Cryptographic Audit Hash and Macroeconomic Price Correction for Reproducible LLM-Based Construction Cost Diagnostics"
SSRN은 Elsevier가 운영하는 세계 최대의 학술 프리프린트 (Preprint) 서버다. 경제학 · 법학 · 사회과학 분야에서의 인용 실적은 압도적이며, 전 세계 연구자와 저널리스트가 참조한다.
솔직히, 목수 출신인 내가 Elsevier의 매체에 이름이 올라갈 것이라고는 생각하지 못했다.
DOI: 10.31224/7007 (engrXiv)
Zenodo: 10.5281/zenodo.20019573
ORCID: 0009-0000-9180-903X
이것이 무엇을 의미하는가
건축주가 HORIZON SHIELD에서 건설비 진단을 받을 때, 그 근거가 되는 데이터는:
- 30년의 현장 경험을 바탕으로 산출되었다
- 학술 논문으로 공개되어 있어 누구나 검증할 수 있다
- SSRN에 게재되어 국제적인 학술 커뮤니티에서 인정받고 있다
- Bitcoin 블록에 앵커링되어 있어 위조가 증명될 수 있다
「AI가 말하니까」가 아니라 「검증 가능한 근거가 있으니까」 신뢰할 수 있다.
이것이 내가 목표로 한 건설비 진단의 형태다.
건축주에게 전하는 메시지
일본의 리폼 시장은 연간 7조 엔을 넘는다.
그 시장 속에서 건축주는 오랫동안 「업체가 말하는 가격이 맞는지 알 수 없는」 채로 계약해 왔다.
정보의 비대칭성을 해소하는 것이 나의 미션이다.
견적서를 받았다면, 잠시 멈춰 서 주길 바란다.
그 숫자가 적정한지, 이제는 확인할 수 있는 시대가 되었다.
→ HORIZON SHIELD 에서 무료 체크
→ JCCDB 데이터셋 (GitHub)
관련 기사
목수 30년인 내가 AI로 견적 사기를 밝혀내는 서비스를 만든 이야기 ← 이 SSRN 게재는 그 후속 보도입니다
해시(Hash)는 무기다: 47세 목수가 「답이 변하지 않는 것」에 도달한 이유 (후편)
The HORIZ音s 주식회사 대표이사 오가 토시카츠
건설 실무 30년 · 사정(Assessment) 500건 초과
LINE: @172piime / Web: shield.the-horizons-innovation.com

논의 (Discussion)

AI 자동 생성 콘텐츠
본 콘텐츠는 Zenn ML의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기