
제도의 차이가 아니라 「제도의 모호함」이었다──8개 제도를 횡단하며 발견한 지역 차이의 정체
요약
인구 밀도, 고령화, 소득 등 객관적 변수로 설명되지 않는 지역적 차이를 '제도의 모호함(1-R²)'으로 정의하여 분석했습니다. 8개 제도를 대상으로 잔차 모델을 적용한 결과, 제도의 견고함에 따라 지역적 편차가 발생하는 구조적 패턴을 발견했습니다.
핵심 포인트
- 결정계수(R²)의 역수를 '제도의 모호함'으로 정의
- 모호한 제도일수록 특정 지역(오사카 등)의 잔차가 크게 발생
- 요양비 계열 제도는 높은 모호함을 보이며 지역적 편차가 큼
- 잔차 구조를 통해 제도의 견고함 서열을 추출하는 지표 활용 가능
시리즈: 상식을 데이터로 뒤집다 / 제도·지역 행동편【Part 2: 구조편】
데이터: e-Stat(위생행정보고례·국민의료비·국세조사·사회인구통계체계) + 국토지리원 면적 조사
분석 스타일: Python (e-Stat API) 자동 취득 + AI (Claude)와의 브레인스토밍
전편: Part 1: 「오사카는 접골원이 많다」는 사실인가──잔차 분석으로 드러난 “설명할 수 없는 지역 차이”
Part 1에서는 접골원의 지역 차이를 인구 밀도·고령화·소득으로 설명하려 했으나, 8할을 설명할 수 없다는 사실이 밝혀졌다.
- 오사카는 인구가 1.6배인 도쿄를 접골원 절대 수로 앞선다
- 하지만 잔차(설명할 수 없는 부분) 1위는 오사카가 아니라 와카야마이며, 벗어나는 지역은 간사이+호쿠리쿠에 편중된다
- 그리고 「벗어나는 현」은 업종에 따라 바뀌며, 접골원·침구업의 $R^2$는 0.17~0.19인 반면 치과는 0.39이다
이 차이는 인구가 아니라, 다른 구조에 지배되고 있는 듯하다. 그 정체를 지금부터 8개 제도를 횡단하며 밝혀낸다.
3줄 요약:
- 「설명할 수 없음(=1−R²)」을 제도의 모호함으로 정의하고, 해석의 여지가 다른 8개 제도에 동일한 잔차 모델을 적용했다. 그 결과 모호한 제도일수록 오사카가 벗어난다($r=+0.66$). 요양비 계열(접골·침구)은 모호함이 80%를 넘어 오사카가 +2.4σ인 반면, 연금·개별 케어는 견고하여(10~18%) 오사카가 평균적이다. 게다가 이 모호함의 순위는 모델을 바꿔도 유지된다 (순위 불변 ρ=1.00 / 변수 로버스트 ρ≧0.83 / 클러스터 안정). 지역 차이가 아니라, 제도의 “견고함의 서열”을 추출하는 구조 지표가 되었다.
Part 1에서 본 「$R^2$가 업종마다 다르다」는 현상을 여기서 무기로 바꾼다.
📐 R² (결정계수)란 무엇인가? ── 가벼운 복습
R²는 모델이 데이터의 변동을 얼마나 설명할 수 있는지를 0~1 사이의 값으로 나타낸다. R²=0.17이라면 「인구 밀도·고령화·소득으로 설명할 수 있는 것은 17%뿐이며, 나머지 83%는 설명할 수 없다」는 뜻이다.
여기서 「제도의 모호함」을 다음과 같이 정의한다.
$$ \text{제도의 모호함} = 1 - R^2 $$
R²가 낮을수록(객관적 요인으로 설명할 수 없을수록) 현장의 해석·운용·상관 관행이 개입할 여지가 크다 = 모호하다,라고 해석할 수 있다.
⚠️
정의의 거리감 (중요): 이것은 「제도의 본질적인 모호함」 그 자체가 아니라, 어디까지나 **「인구 밀도·고령화·소득의 3개 변수로 설명할 수 없는 지역 차이의 비율 (=잔차 구조)」**이다. 이하에서 「모호함」이라 부르는 것은 이 잔차 구조의 크기를 의미한다.
해석의 여지가 다른 8가지 제도에 완전히 동일한 잔차 모델(인구 밀도·고령화·소득)을 적용했다.

*그림 14: 8개 제도의 모호함(1−R²) 랭킹. 각 막대에 오사카의 잔차 σ를 병기. * 독자가 주목할 점: 요양비 계열(접골원 83%·침구 81%·방문 간호 88%)은 극도로 모호하며, 연금 10%·개별 케어 18%는 수식으로 결정되는 「견고한 제도」이다.
| 제도 | 모호함(1−R²) | 오사카 σ | 오사카 순위 |
|---|---|---|---|
| 방문 간호 의료비 | 88% | +1.64σ | 3위 |
| 접골원 (요양비) | 83% | +2.41σ | 2위 |
| 침구원 (요양비) | 81% | +2.40σ | 3위 |
| 생활보호율 | 76% | +1.52σ | 4위 |
| 치과 의원 | 61% | +0.35σ | 16위 |
| 국민 의료비 (1인당) | 52% | +0.54σ | 14위 |
| ... |
그리고 이 기사의 핵심이 이것이다.

*그림 13: 가로축 = 제도의 모호함(1−R²), 세로축 = 오사카의 표준화 잔차 σ. * 독자가 주목할 점: 우상향 관계($r=+0.66$). 모호한 제도일수록 오사카가 벗어난다. 견고한 제도(연금·치과)에서 오사카는 정중앙, 즉 평균적이다.

*그림 12: 왼쪽 = 모호함 랭킹, 오른쪽 = 오사카 σ. * 독자가 주목할 점: 오사카가 2σ를 넘어 벗어나는 것은 「모호함 80% 초과」인 요양비 계열뿐이다.
여기서 세 가지를 말할 수 있다.
- 오사카 현상은 접골원(接骨院)뿐만이 아니다. 그렇다고 "어디나" 그런 것도 아니다. 오사카가 2σ를 넘어 벗어나는 것은 요양비 계열(접골원·침구)뿐이다. 기준이 명확한 치과(+0.35σ)·연금(+0.30σ)에서는 완전히 평균적이다. -
"오사카 = 생활보호"라는 이미지는 절반은 트릭이다. 생활보호율로 가장 크게 벗어나는 곳은 오사카가 아니라 **홋카이도(+3.4σ)**이다. 오사카의 생활보호는 고령화·소득으로 상당히 설명되며, 잔차는 +1.5σ(4위)이다. 설명을 넘어 벗어나는 것은 요양비 계열이다. -
개호(介護)는 사실 "단단한 제도"였다. 당초 "중간 정도의 모호함"이라고 예상했으나, 개호급여비의 모호함은 18%($R^2=0.82$)였다. 급여가 요개호(要介護) 고령자 수에 거의 비례하며, 수식적으로 결정되기 때문이다.
47개 도도부현을 8개 제도의 잔차 프로파일(Residual Profile, 잔차의 지문)로 계층적 군집화 (Hierarchical Clustering, Ward법)를 실시했다. 그 결과, 데이터가 자동으로 6개 타입으로 나뉘었다.

그림 15: 도도부현 × 제도별 표준화 잔차 히트맵 (빨강=과잉, 파랑=과소, 왼쪽 띠=클러스터). 독자가 주목할 점: 교토·오사카·와카야마(보라색 띠)의 왼쪽 = 요양비 계열만 새빨갛다. 도쿄(초록색 띠)는 오른쪽 = 단단한 제도에서 빨갛다. "빨갛게 변하는 지점"이 클러스터마다 다르다.

그림 16: 각 클러스터의 제도별 평균 잔차 σ. 독자가 주목할 점: "어떤 제도에서 벗어나는 현들의 모임인가" = 지역 타입의 정체.
| 클러스터 | 주요 현 | 돌출되는 제도 |
|---|---|---|
| 간사이형 (요양비 돌출) | 교토·오사카·와카야마 | 침구 +2.5 / 접골 +2.3 / 방문간호 +1.6 |
| 홋카이도·서일본형 | 홋카이도·효고·고치·도쿠시마·후쿠오카·오이타·미야자키·히로시마 | 생활보호 +1.2 / 국민의료비 +1.1 / 치과 +1.0 |
| 대도시형 (단단한 제도에서 벗어남) | 도쿄·가고시마·오키나와 | 연금 +1.5 / 개호 +1.4 / 의료비 +1.2 |
| 호쿠리쿠·긴키 주변형 | 도야마·이시카와·후쿠이·기후·시가·나라·카가와 | 접골 +0.8 / 방문간호 +0.7 |
| 수도권 근교형 | 이바라키·사이타마·치바 | 모든 제도에서 마이너스 (개호 -1.9) |
| 지방 표준형 | 도호쿠·코신·주고쿠 등 23개 현 | 거의 평균 (연금 +0.4) |
"간사이 = 치료원"이 문화론이 아니라 데이터 기반(Data-driven)으로 독립 클러스터로서 출현했다. 반면, 시코쿠(고치·도쿠시마)는 접골원이 아니라 국민의료비·생활보호에서 벗어나는 별개의 타입이다. 지역은 "많다/적다"가 아니라 "어떤 제도에서 벗어나는가"로 나뉘어 있었다.
"제도의 모호함 = $1-R^2$"가 분석 전체의 토대다. 이것이 흔들리면 전부 흔들린다. 그래서 두 가지 검증을 수행했다.
검증 1: 자유도 조정 (adjusted $R^2$)에서도 순위는 바뀌는가
$n=47$, 설명변수 3개의 소표본에서는 $R^2$가 다소 과대평가될 수 있다. adjusted $R^2$로 다시 계산해도, **모호함 순위는 완전히 일치(Spearman $\rho=1.00$)**했다.
검증 2: 설명변수를 교체해도 순위가 무너지는가
설명변수 세트를 5가지(기준 / +인구 규모 / 소득 제외 / 밀도 제외 / 고령화 제외)로 바꾸어 재계산했다.
| 변수 세트 | 기준과의 순위 상관 $\rho$ |
|---|---|
| +인구 규모 (4개 변수) | +0.98 |
| ... | |
![]() |
그림 17: 설명변수 세트를 바꿨을 때의 모호함. 가로 띠가 짧을수록 정의가 흔들리지 않는다. 독자가 주목할 점: 띠가 움직여도, 접골원·침구(위 = 모호함 큼)와 개호·연금(아래 = 모호함 작음)의 양극단은 결코 뒤바뀌지 않는다.
이 지점이 이 분석의 가장 깊은 발견이다. 검증을 통해 알 수 있었던 것은 단순히 "지표가 깨지지 않는다"는 것이 아니다.
| 무엇이 | 어떻게 되었는가 |
|---|---|
| 모호함의 실측치 (예: 접골원 = 0.83) | 모델·변수에 따라 흔들림 |
| 모호함의 순위 (단단함의 서열) | 세 가지 의미에서 안정적 |
"순위가 안정적"이라고 말할 수 있는 이유는 다음 세 가지가 갖춰져 있기 때문이다 (단순히 "말을 바꾼 것"이 아니라고 할 수 있는 근거).
- 순위의 불변성: adjusted $R^2$ (자유도 조정)에서도 모호함 순위는 완전 일치 ($\rho=1.00$).
- 변수 로버스트성 (Robustness): 설명변수를 5가지로 교체해도 순위 상관 $\rho \ge 0.83$.
- 클러스터 안정성: §3의 잔차 프로파일에서도 요양비 계열(접골·침구)은 항상 동일한 "부드러운 쪽"의 클러스터로 분류된다.
이 세 가지 점이 동시에 성립하므로, 「모호함」은 분석자가 선택한 파라미터(Parameter, = 현상)가 아니라, **이 모델이 안정적으로 추출하는 “제도의 잔차 구조(Residual Structure)”**라고 할 수 있다. 즉, 이 지표는 「값을 측정하는 척도」라기보다, 제도의 “부드러움의 서열”을 추출하는 구조 추출기로서 기능하고 있다.
「어떤 모델을 사용해도, 접골원은 반드시 “모호한 측”에 위치한다」
단단한 제도 ── 국민연금·개호 (급여가 수식으로 결정됨)
↑
중간 ── 치과·국민의료비 (의학적 객관성이 작용함)
...
물질의 경도(Hardness)처럼 제도에도 「상대적인 부드러움의 서열」이 있다── 단, 이는 “절대적인 물성”이 아니라, 이 3변수 모델에 대해 안정적인 상대적 서열이라는 거리감이 정확하다.
❌ 이것은 「제도가 행동에 미치는 인과 효과(Causal Effect)」에 관한 연구가 아니다. ⭕ 「설명 변수(Explanatory Variable)로 흡수할 수 없는 지역 차이의 분포 구조」를 추출하는 것이다.
※ 본고가 다루는 것은 “제도가 행동에 영향을 미치는 강도”가 아니라, “설명할 수 없는 지역 차이의 분포 구조”이다. 잔차(Residual)는 공변(Covariation)의 분리이지 인과가 아니다.
이 관점의 강점은, 예외를 깔끔하게 설명할 수 있다는 점에서도 나타난다. 개호급여비는 모호함 18%(단단한 제도)임에도 불구하고, 오사카의 σ(표준편차)는 +1.28로 중간 정도로 높다── 언뜻 보면 구조에 반하는 결과다.
하지만 이것은 모순이 아니라 **「외곽 구조(Outlier Structure)」**다. 개호급여의 총량은 요개호 고령자 수에 의해 기계적으로 결정되므로 (따라서 $R^2$는 높음 = 단단함), 오사카는 고령 단독 세대·생활보호 세대의 집중이라는 별개의 인구 구조를 안고 있다. 즉, 오사카의 개호 σ는 「제도의 모호함」에서 유래한 것이 아니라, 모델에 넣지 않은 인구 구조에서 유래한 것이다. 「모호함이 낮음 = 오사카도 평균적」이어야 하지만, 다른 경로에 의해 수치가 끌어올려지고 있음을 그림 13의 회귀 직선으로부터의 이탈(좌상단)이 시각화하고 있다. 반례가 오히려 「모호함 축」과 「인구 구조 축」이 별개임을 보여주고 있다.
본 분석에서 보여줄 수 있는 것은 **공변의 분리(잔차의 정량화)**까지이며, 엄밀한 인과 관계는 아니다. 남은 복병(변수)들을 솔직하게 기술한다.
| 우선순위 | 복병 | 데이터 | 목표 |
|---|---|---|---|
| ★★★ | 공급 구조 (사원 비중·개업률) | 위생행정보고예·취업 유정사(柔整師) 수 | 잔차가 「1개소당 시술자 수」로 어디까지 줄어드는가 = 사업자 구조의 기여도를 분리 |
| ★★★ | 보험 청구의 실운용 | 유정요양비의 부위별 청구 비율·1인당 청구 횟수 (지역별) | 신청 행동의 직접 관측. 오사카의 「3부위 청구율」이 여기에 해당 |
| ★★☆ | 감사·반려율 | 지방후생국 심사 데이터 | 지역 인센티브의 대리 변수 |
| ★☆☆ | 지자체 보조 (아동 의료비 등) | 각 현·시정촌 조례 | 접골원 창구에서 사용할 수 있는지의 차이. 단, 대상이 한정적이며 기여도는 작을 것으로 예상 |
특히, AI와의 브레인스토밍(打ち合わせ)을 통해 정리할 수 있었던 것이 제도의 3층 구조다.
전국 공통 규칙 (동일·건강보험법/수령 위임)
↓ 지방후생국의 운용 차이 (소)
↓ 지자체 보조 (중·한정적)
...
접골원의 요양비는 **「급성인가 만성인가 모호함/부위 수에 대한 재량/의학적 객관성이 약함」**을 특징으로 한다. 즉, 판단의 여지가 크다. 그렇기에 엄격한 규칙이 아니라 “운용의 습관”이 작용하며, 지역 문화가 파고들 수 있다.
Part 1에서 「오사카는 접골원이 많다」는 것을 데이터로 추적했고, 인구로도 고령화로도 소득으로도 설명할 수 없다는 것을 알아냈다. Part 2에서는 그 「설명할 수 없는 차이」를 8개 제도로 확장하여, 오사카가 벗어나는 것은 “모호한 제도”뿐이라는 것을 밝혀냈다.
최종적으로 도달한 질문의 형태는 다음과 같다.
「제도의 차이」가 아니라 「제도의 모호함이 허용하는 “행동 분포”의 차이」
규칙은 전국 공통이다. 하지만 판단의 여지가 있는 제도에서는 그 여지로 지역의 상관습이 흘러 들어온다. 지역 차이는 문화의 색깔이 아니라, 제도 설계가 남긴 “틈새”의 형태였다.
그리고 한 단계 더 높은 발견이 있다. 모호함의 실제 값은 모델에 따라 흔들려도, 단단함의 순위는 깨지지 않았다 (순위 불변·변수 로버스트·클러스터 안정의 3점). 이는 이 지표가 「값을 측정하는 척도」가 아니라, **“이 모델이 안정적으로 추출하는 제도의 잔차 구조”**가 되었다는 것을 의미한다. 깨닫고 보니 우리는 지역 차이 그 자체가 아니라, 설명 변수로 흡수할 수 없는 “재량의 분포”의 서열을 측정하고 있었던 것이다.
마지막으로, 이 글의 도달점을 한 줄로 요약하면 다음과 같다.
제도의 지역 차이는 「수요의 차이」가 아니라, 「설명 변수로 흡수할 수 없는 재량의 분포」로 결정된다.
데이터 분석은 어렵다. 그렇기에,
총수 → 인구 밀도 보정 → 잔차 → (제도 횡단적) 모호함 → 클러스터링 → 강건성(Robustness)
이라는 분해 설계에 스토리가 깃든다. 「오사카 사람이니까」라는 결론에서 멈추지 않고, 걷어낼 수 있는 노이즈를 전부 걷어낸 끝에 제도경제학적인 구조가 보인다.
| 데이터 | 출처 (통계표 ID) |
|---|---|
| 이용·미용소 수 | 위생행정보고예 0004027011 |
| 접골원·침구원 (시술소) | 위생행정보고예 0004026951 |
| 치과 진료소 수 | 의료시설조사 0002013847 |
| 인구 | 인구추계 0003448232 |
| 고령화율 (연령 3구분) | 국세조사 0003448299 |
| 1인당 현민 소득 | 사회·인구통계체계 0000010103 (C120101/2014년도) |
| 국민의료비·방문간호 | 국민의료비 0003356095 |
| 생활보호·개호·연금 | 사회·인구통계체계 0000010110 (J1105/J7102/J520201) |
| 도도부현 면적 | 국토지리원 전국 도도부현 시구정촌별 면적조사 |
| 계열 | 사용 연도 | 비고 |
|---|---|---|
| 점포 수·의료비·국세조사 | 2020년 | 기준 연도 |
| ... |
python analysis/store_count/fetch_and_analyze.py # Part1 §1 상관·산점도
python analysis/store_count/deep_dive.py # 간사이 클러스터 심층 분석
python analysis/store_count/residual_analysis.py # Part1 §2 잔차 랭킹
...
import numpy as np
def ambiguity(y, X):
"""제도의 모호함 = 1 - R² (절편 포함 OLS)"""
...
| 종별 | 경로 |
|---|---|
| 데이터 | data/store_count/*.csv |
| 도표 | output/store_count/fig1 〜fig17 .png |
| 잔차 매트릭스 | data/store_count/residual_matrix.csv |
| 클러스터 할당 | data/store_count/prefecture_clusters.csv |
- 총무성 통계국 e-Stat: https://www.e-stat.go.jp/
- 접골원 수는 「유도정복 시술소 수」(위생행정보고예). 침구원은 「침·구 시술소 수".
- 본고의 「제도의 모호함 = 1−R²」는 인구 밀도·고령화·소득이라는 객관적 3요인에 의한 설명력의 역(裏)이며, 제도 설계 자체에 대한 규범적 평가가 아니다.
- 잔차·상관은 공변동(covariation)의 분리일 뿐 인과 관계의 증명이 아니다. 인과 추정에는 DID(노지 vs 제도 변경 전후) 등의 추가 설계가 필요하다 (§5).
시리즈: 상식을 데이터로 뒤집다 (Part 2: 구조 편)
전편: Part 1: 설명할 수 없는 지역 차이
차회 (예정): 사원비·부위별 청구 비율을 포함한 「공급 구조 vs 상관행」의 분리
AI 자동 생성 콘텐츠
본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기