잔차 제곱합

testwiki
둘러보기로 이동 검색으로 이동

틀:위키데이터 속성 추적 통계에서 잔차제곱합 (SSR) 또는 오차제곱합 (SSE) 이라고도 알려진 잔차 제곱합(RSS)은 잔차의 제곱(실제 경험적 데이터 값과 예측된 값의 차이)이다. 이는 선형회귀와 같은 추정모델과 데이터간의 불일치를 측정한다. 작은 RSS는 모델이 데이터에 꼭 맞는다는 것을 의미한다. 이는 매개변수 선택 및 모델 선택시 최적기준으로 사용된다.

일반적으로, 총제곱합(TSS) = 회귀제곱합(SSE) + 잔차제곱합(SSR)이다. 다변량 최소제곱법(OLS) 사례에 대한 증명은, 일반적인 최소제곱법 모델에서의 파티셔닝을 참고.

하나의 독립변수

독립변수가 하나인 모델에서 RSS는 다음과 같다.[1]

RSS=i=1n(yif(xi))2

여기서 yii 번째 예측할 변수 값이고, xii 번째 독립변수의 값이며, f(xi)yi 의 예측값이다( yi^ 라도도 함). 표준 선형 단순 회귀모델에서는 yi=α+βxi+εi, 여기서 αβ계수이고, yx는 각각 종속변수독립변수이고, ε는 오차이다. 잔차의 제곱합은 ε^i 의 제곱합이며, 다음과 같다.

RSS=i=1n(ε^i)2=i=1n(yi(α^+β^xi))2

여기서 α^는 상수 α의 추정 값이고, β^는 기울기 계수 β의 추정 값이다.

OLS 잔차제곱합에 대한 행렬 표현식

틀:수학 변수개의 관측값과 틀:수학 변수개의 설명자가 있는 일반 회귀 모델(첫 번째 설명자는 계수가 회귀 절편인 상수 단위 벡터임)은 다음과 같다.

y=Xβ+e

여기서 틀:수학 변수는 종속 변수 관측값의 n × 1 벡터이고, n × k 행렬 틀:수학 변수 의 각 열은 k 설명자 중 하나에 대한 관측값 벡터이다. β는 실제 계수의 k × 1 벡터이고, 틀:수학 변수는 실제 기본오차의 n × 1 벡터이다. 최소제곱법 추정값 β는 다음과 같다.

Xβ^=y
XTXβ^=XTy
β^=(XTX)1XTy.

잔차 벡터 e^=yXβ^=yX(XTX)1XTy ; 따라서 잔차 제곱합은 다음과 같다:

RSS=e^Te^=e^2 ,

(잔차 놈(norm)제곱과 동일) 전체를 다시 정리하면 다음과 같다:

RSS=yTyyTX(XTX)1XTy=yT[IX(XTX)1XT]y=yT[IH]y ,

여기서 틀:수학 변수 는 모자행렬 또는 선형회귀의 투영 행렬이다.

피어슨 상관관계와의 관계

최소제곱 회귀선은 다음과 같다.

y=ax+b ,

여기서 b=y¯ax¯ 그리고 a=SxySxx, 여기서 Sxy=i=1n(x¯xi)(y¯yi) 그리고 Sxx=i=1n(x¯xi)2.

그러므로,

RSS=i=1n(yif(xi))2=i=1n(yi(axi+b))2=i=1n(yiaxiy¯+ax¯)2=i=1n(a(x¯xi)(y¯yi))2=a2Sxx2aSxy+Syy=SyyaSxy=Syy(1Sxy2SxxSyy)

여기서 Syy=i=1n(y¯yi)2.이다.

피어슨 상관관계는 다음과 같다.

r=SxySxxSyy; 그러므로, RSS=Syy(1r2).

추가 설명자료

같이 보기

참고자료

틀:서적 인용 틀:각주