📜 『주택연구에 있어 공간계량모델 적용에 대한 고찰』 요약
저자: 현동우
「부동산학연구」 제27집 제2호, 2021. 6, pp.7~26
1. 연구 배경
전통적인 주택가격 분석은 위치 정보를 고려하지 않는 일반 회귀모형(OLS)을 주로 사용하지만,
공간적으로 인접한 지역 간 영향이 무시되면 분석 결과의 신뢰도가 떨어질 수 있음.
2. 연구 목적
- 공간계량모형(SAR, SEM, SDM 등)을 소개하고,
- 왜 주택가격 연구에 이런 모델들이 적합한지를 이론적으로 고찰함.
3. 주요 공간계량모형 소개
| 모형 | 설명 | 적용 예시 |
|---|---|---|
| SAR | 종속변수(예: 주택가격)가 이웃 지역의 종속변수에 영향을 받음 | A동 집값이 B동에도 영향 |
| SEM | 오차항 간에 공간적 자기상관이 있음 | 측정되지 않은 공간적 요인이 존재 |
| SDM | 종속변수와 독립변수 모두 공간적으로 영향을 줌 | 인근 지역의 개발, 시설 등 |
| GWR | 위치마다 회귀계수가 다르게 적용됨 | 지역별 요인 민감도 분석에 유리 |
4. 기대 효과
- 공간계량모형은 정책 효과 분석, 주택 수요 예측, 지역 간 상호 영향 분석에 유리함
- 특히, 단일 지역 분석을 넘어서 전이효과(Spillover Effect)를 파악하는 데 강점
5. 결론
공간정보가 풍부해진 지금, 주택시장 분석에 공간계량모형의 적용은 선택이 아닌 필수임.
공간적 자기상관을 무시할 경우 왜곡된 해석이 가능함으로,
보다 정밀한 분석을 위해 SAR, SEM, SDM 등의 공간모형을 적극 활용해야 함이 논문의 핵심 주장
👣 발자취 따라가기
1) 논문에서 사용된 통계학적 용어 정리
| 용어 | 뜻 |
|---|---|
| 공간계량모형 (Spatial Econometric Model) | 공간적 종속성이나 이질성이 존재하는 데이터를 분석하기 위한 통계 모형. 일반 회귀분석과 달리 공간적 상관관계를 고려함. |
| SAR (Spatial Autoregressive Model) | 종속변수가 이웃 지역의 종속변수 값에 영향을 받는 모형. 공간적 자기상관을 포함함. |
| SEM (Spatial Error Model) | 오차항이 공간적으로 상관되어 있을 때 사용하는 모형. 설명변수는 독립적이나, 잔차가 공간적 구조를 띔. |
| SDM (Spatial Durbin Model) | 종속변수와 설명변수 모두의 공간적 지연항을 포함하는 모형. SAR과 SEM을 모두 포괄하는 확장형. |
| GWR (Geographically Weighted Regression) | 위치별로 회귀계수를 추정하는 지역 가중 회귀모형. 공간적 이질성을 반영하여 지역별로 다른 관계를 고려함. |
| 자기상관 (Autocorrelation) | 한 변수의 값이 인접 지역 또는 인접 시간의 값과 상관이 있는 현상. 공간적 자기상관은 지리적으로 가까운 지역이 유사한 값을 갖는 현상을 의미. |
| Moran's I | 공간 자기상관을 측정하는 대표적인 통계량. 값이 클수록 인접 지역 간 유사성이 큼. |
| OLS (Ordinary Least Squares) | 가장 기본적인 선형 회귀분석 방법. 잔차의 제곱합을 최소화하여 회귀계수를 추정함. |
| 다중공선성 (Multicollinearity) | 설명변수들 간에 강한 상관관계가 존재하는 상태. 회귀계수 추정의 불안정성을 유발함. |
| VIF (Variance Inflation Factor) | 다중공선성의 정도를 정량화한 지표. 일반적으로 VIF > 10이면 다중공선성이 심하다고 판단함. |
| 잔차 (Residual) | 실제 관측값과 회귀모형으로 예측된 값 간의 차이. |
| 공간가중행렬 (Spatial Weight Matrix, W) | 지역 간의 인접성 혹은 거리 기반 영향을 수치로 나타낸 행렬. 공간모형에서 핵심적인 입력 값으로 활용됨. |
| 시계열 모형 (Time Series Model) | 시간 흐름에 따른 데이터의 구조와 패턴을 분석하는 통계 모델. (논문에서는 주로 공간 모형 중심이지만 시계열 요소와의 비교가 언급됨) |
2) 🤔 “왜 나는 OLS를 썼을까?” – 공간모형을 알고 난 후의 회고
논문을 통해 다양한 공간계량모형을 접했지만,
이번 송도 프로젝트에서는 일반 선형회귀(OLS) 모델을 중심으로 분석을 진행하였습니다.
그 이유는 크게 두 가지였습니다.
- 해석 가능성의 우선순위
복잡한 공간모형보다는, 변수와 결과 간 관계를 직관적으로 해석할 수 있는 모델이 필요했기 때문입니다.
예를 들자면, '평당가격이 높을수록 거래금액이 상승한다'는 단순한 인과관계를 명확히 설명하고 싶었습니다. - 공간적 왜곡이 제한적인 조건
송도는 비교적 신도시 형태의 계획도시로, 자생적인 클러스터보다 정책과 개발 계획에 따른 가격 변화가 크다고 생각하였습니다.
따라서 공간적 자기상관이 일부 존재할 수 있지만, 회귀 해석의 틀을 근본적으로 왜곡할 수준은 아니라고 판단했습니다.
하지만, 지금 와서 보면 다음과 같은 생각도 듭니다.
- 공구별 예측 오차 차이가 컸던 이유는,
공간적 이질성(예: 공구 1의 고가 단지와 저가 단지 혼재)이 반영되지 못한 한계 때문일 수도 있다. - Moran’s I 같은 공간자기상관 검정을 추가했더라면,
OLS의 전제조건이 얼마나 충족되었는지 더 명확히 판단할 수 있었을 것이다.
🧭 다음 항해를 위한 교훈
공간계량모형이 꼭 ‘지금’ 써야 하는 도구는 아닐 수 있지만, 데이터가 공간적 성격을 가질 때, OLS가 놓치는 인과관계를 보완할 수 있는 강력한 무기가 될 수 있습니다.
이번 프로젝트는 단순한 도구 사용을 넘어,"언제 어떤 도구를 써야 할지 판단하는 기준"을 만들어준 첫 항해였다고 정리하고 마무리하고 싶습니다.
'데이터 항해일지 (연구 & 학습과정)' 카테고리의 다른 글
| [도시] 지역승수와 입지계수 (0) | 2025.04.26 |
|---|---|
| [논문리뷰] Envi-Met 모델을 활용한 도시 열환경 안정도 분석 (0) | 2025.04.22 |
| Open API 포맷별 호출 방법 (0) | 2025.03.05 |
| [포럼] 2024 서울 빅데이터 포럼 (0) | 2025.03.03 |