표준 편차

testwiki
둘러보기로 이동 검색으로 이동

틀:위키데이터 속성 추적

각 밴드의 너비가 1 표준편차인 정규분포의 구상. 68-95-99.7 규칙 참고.
예측값 0과 표준편차 1을 나타낸 정규분포의 누적 확률.

표준 편차(標準 偏差, 틀:Llang, SD)는 통계집단의 분산의 정도 또는 자료의 산포도를 나타내는 수치로, 분산의 음이 아닌 제곱근 즉, 분산을 제곱근한 것으로 정의된다. 표준편차가 작을수록 평균값에서 변량들의 거리가 가깝다.[1] 통계학확률에서 주로 확률의 분포, 확률변수 혹은 측정된 인구나 중복집합에 적용된다. 관례에 따라 모집단은 그리스 문자로, 표본은 영어 알파벳으로 표기하는데, 모집단의 표준편차는 σ(시그마)로, 표본의 표준편차는 s(에스)로 나타낸다.[2]

편차(deviation)는 관측값에서 평균 또는 중앙값을 뺀 것이다.

분산(variance)은 관측값에서 평균을 뺀 값을 제곱하고, 그것을 모두 더한 후 전체 개수로 나눠서 구한다. 즉, 차잇값의 제곱의 평균이다. 관측값에서 평균을 뺀 값인 편차를 모두 더하면 0이 나오므로 제곱해서 더한다.

표준편차(standard deviation)는 분산을 제곱근한 것이다. 편차들(deviations)의 제곱합(SS, sum of square)에서 얻어진 값의 평균치인 분산의 성질로부터 다시 제곱근해서 원래 단위로 만들어줌으로써 얻게된다.

모표준편차(population standard deviation) σ는 모집단의 표준편차이다. 모분산 σ2에 제곱근을 씌워서 구한다.

표본표준편차(sample standard deviation) s는 표본의 표준편차이다. 표본분산 s2에 제곱근을 씌워서 구한다.

정의

확률변수 X기댓값 E(X)μ라 하자. 이 때 모집단 X의 표준편차 σX는 다음과 같이 정의한다.[3]

σ=E((Xμ)2)=E(X2)+E(2μX)+E(μ2)=E(X2)2μE(X)+μ2=E(X2)2μ2+μ2=E(X2)μ2=E(X2)(E(X))2

유도과정에서 기댓값의 성질이 사용되었다. 표준편차는 분산의 제곱근과 같은 의미를 가진다.

통계적 추정

동일 경중률인 경우

경중률이 동일한 경우 표본 내의 어떤 변인 x가 가지는 모집단에서 표본(sample)의 표준편차의 추정치 s는 다음과 같다.

s=±(xx)2n1=±ν2n1
s: 표본의 표준편차
x: 변인
x: 표본의 평균
n: 표본의 크기
ν: 잔차

분모를 n1로 나누는 이유는 분산을 계산할 때 모평균이 아닌 표본평균을 사용했기 때문에 모집단의 편의 추정량(biased estimator)이 되므로, 분산이 불편 추정량(unbiased estimator)이 되도록 하기 위해서이다.[4] n1자유도(degree of freedom)라고 본다.[5]

경중률이 다른 경우

경중률w라 할 때, w=n인 경우에는 표본표준편차 s를 다음과 같이 구한다.[4]

s=±w(xx)2n1=±wν2n1

같이 보기

틀:위키공용분류

각주

틀:각주

틀:기술적 분석 틀:통계학 틀:전거 통제 틀:토막글