가우스-마르코프 정리

testwiki
imported>A.TedBot님의 2024년 6월 3일 (월) 08:12 판 (봇: 같이 보기 문단 추가)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)
둘러보기로 이동 검색으로 이동

틀:위키데이터 속성 추적 틀:정리 필요 통계학에서 가우스-마르코프 정리(틀:Llang, 또는 일부 저자는 가우스 정리[1]라고 표기)는 선형 회귀 모형의 오차가 상관관계가 없고, 오차의 분산이 일정하며, 오차의 기대값이 0이며 설명변수가 외생변수일 때 보통 최소제곱 추정량(OLS)은 다른 선형 불편 추정량에 비하여 표본 분산이 가장 낮다고 명시한다.[2] 오차항이 정규분포를 따를 필요는 없다.

이 정리는 비록 가우스의 작품이 마르코프의 작품보다 현저히 앞섰지만 칼 프리드리히 가우스와 안드레이 마르코프의 이름을 따서 명명되었다.[3] 그러나 가우스가 독립성과 정규성을 가정하여 그 결과를 도출하는 동안 마르코프는 위에서 언급한 형식으로 가정들을 줄였다.[4] 비구형 오류에 대한 추가 일반화는 알렉산더 에이트켄에 의해 이루어졌다.[5]

선형 회귀 모델과 최소 제곱 추정

선형 회귀 모델로서 목적 변수 Y와 p개의 설명 변수 틀:Math 및 오차항 εk 의 관계를 다음과 같이 모델화한 것을 생각한다.

Yk=β0+β1X1+β2X2++βpXp+εk, k=1,,n.

목적 변수 및 설명 변수 측정 결과의 조틀:Math를 하나의 데이터로 하여 n( ≧ p)개의 데이터를 이용하여 잔차의 제곱합

k=1n{yi(β0+β1xi,1+β2xi,2++βpxi,p)}2

가 최소가 되다(β0,β1,,βp)를 최소 제곱 추정량이라고 부른다.여기서

𝐘=[Y1Y2Yn], 𝐗=[1x11x12x1p1x21x22x2p1xn1xn2xnp], β=[β0β1βp], ε=[ε1ε2εn]

라고 놓으면 선형 회귀 모델은

𝐘=𝐗β+ε

라며, 최소 제곱 추정량β^

β^=(𝐗𝐗)1𝐗𝐘

으로 주어진다. 또한, 상부 첨자은 전치 행렬을 나타낸다.

가우스 마르코프의 정리

가정

오차항 ε 에 대해서

  1. E[ε]=0 (불편성)
  2. Cov[ε]=σ2𝑰 (등분산성·무상관성)

를 가정한다. 여기서𝑰는 단위 행렬을 나타낸다.

무상관성은 독립성보다도 약한 가정이며, 또 정규 분포 등 특정 분포를 따르는 것을 가정하고 있지 않다.

정리의 내용

최소 제곱 추정량 β^는 최우수 선형 불편 추정량(best linear unbiased estimator, BLUE)이다. 즉 임의의 선형 불편 추정량 β~에 대해서

Cov[β~]Cov[β^]

가 성립한다.

증명

β~는 선형 추정량이므로(p+1)n행렬의 행렬𝐂를 이용하여β~=𝐂𝐘고 하다. β~가 불편성을 갖기 위한 조건을 요구하면 E[β~]=𝐂𝐗β=β가 항등적으로 성립되기 때문에𝐂𝐗=𝐈이다.

다음에β~의 분산 공분산 행렬을 정리하면

Cov[β~]=E[(𝐂𝐘β)(𝐂𝐘β)]=E[𝐂ε(𝐂ε)]=𝐂E[εε]𝐂T=σ2𝐂𝐂

가 된다 여기서𝐂^=(𝐗𝐗)1𝐗라고 했을 때의 추정량이 최소 제곱 추정량β^이 되기 때문에 𝐂𝐂𝐂^𝐂^을 나타내면 된다. 불편성보다𝐂𝐗=𝐈그래서

(𝐂𝐂^)𝐂^=(𝐂𝐂^)𝐗(𝐗𝐗)1=(𝐂𝐗𝐂^𝐗)(𝐗𝐗)1=𝐎

에 주의하면

𝐂𝐂=(𝐂𝐂^+𝐂^)(𝐂𝐂^+𝐂^)=(𝐂𝐂^)(𝐂𝐂^)+𝐂^𝐂^𝐂^𝐂^

가 성립한다. 따라서

Cov[β~]Cov[β^]

가 성립하며, 최소 제곱 추정량β^는 최우수 선형 불편 추정량이 된다.

같이 보기

각주