Notice
Recent Posts
Recent Comments
Link
«   2026/04   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30
Tags
more
Archives
Today
Total
관리 메뉴

Elevation

기초통계학 (4) - 추정 본문

정리/통계학

기초통계학 (4) - 추정

aste999 2025. 5. 10. 18:17

 

표본을 통해 모집단을 예상하는 통계적 추론으로 본격적으로 들어가 보자. 통계적 추론에는 추정과 검정이 있는데, 먼저 추정에 대해 간단히 다뤄볼 것이다.

 

 

추정의 원리

추정량(estimator): 모수를 추정하는 데 사용하는 통계량(함수)

추정값(estimate): 추정량의 관측값

 

추정이란, 추출한 표본을 토대로 모수의 값을 추측하는 과정이다. 추정에는 점추정과 구간추정이 있다.

이때 모집단 전체가 아닌 표본을 보기 때문에 오차가 생길 수밖에 없는데, 이를 표집오차(sampling error)라 한다.

표집오차는 변동(variance)와 편의/편향(bias)로 분해된다.

 

$$\hat{\theta}-\theta = [\hat{\theta}-E(\hat{\theta})] + [E(\hat{\theta})-\theta]$$

 

편향=0이라는 것은, $E(\hat{\theta})=\theta$이므로 추정량의 기댓값이 모수와 같아진다는 것을 의미한다. 이를 불편성(unbiasedness)라 한다. 한편 추정량 자체의 분산이 작으면 효율적인 추정량이라고 볼 수 있으므로, 이를 효율성(Efficiency)라 한다. 일반적으로는 불편추정량 중 분산이 최소가 되는 최소분산 불편추정량(MVUE)을 추정을 하기에 좋은 추정량으로 본다.

 

 

모평균에 대한 구간추정

구간추정은 점추정량의 변이 정도에 따른 정확성을 함께 제시해 주어 유용하다. 구간 추정은 신뢰수준 $1-\alpha$를 고정시켜 놓고, $P(a<\mu<b)=1-\alpha$를 만족시키는 가장 길이가 짧은 구간을 신뢰구간으로 선택한다.

 

모평균 $\mu$에 대한 구간추정을 해 보자. 모평균의 추정량은 $\overline{X}$를 사용한다. $\frac{\overline{X}-\mu}{\sigma / \sqrt{n}} \sim Z$이므로 $Z$를 기준으로 신뢰구간을 정한다. 이때 $Z$는 좌우대칭이므로 신뢰구간도 0을 기준으로 좌우대칭의 형태로 나타날 것이다.

 

$$\hat{\mu}=\overline{X},\;SE(\hat{\mu})=\frac{\sigma}{\sqrt{n}}$$

$$-z_{\alpha/2} \leq \frac{\overline{X}-\mu}{\sigma / \sqrt{n}} \leq z_{\alpha/2}$$

$$\therefore \overline{X} - z_{\alpha/2}\frac{\sigma}{\sqrt{n}} \leq \mu \leq \overline{X}+z_{\alpha/2}\frac{\sigma}{\sqrt{n}}$$

 

신뢰수준 95% 신뢰구간의 의미는, 반복해서 신뢰구간을 구했을 때 이들 신뢰구간 중 95%가 모평균 $\mu$를 포함하고 있음을 뜻한다.

식을 살펴보면 신뢰구간의 길이는 표본의 크기에 영향을 받는 것을 확인할 수 있다. 실제로는 고정된 신뢰수준 하에서 신뢰구간이 일정 기준 이하이기를 기대하므로, 오차범위를 $d$ 이하로 하기 위한 표본의 크기를 계산해 놓고 자료를 수집할 것이다.

 

$$d \geq z_{\alpha/2}\frac{\sigma}{\sqrt{n}}$$

$$\therefore n \geq (z_{\alpha/2}\frac{\sigma}{\sqrt{n}})^2$$