참고문헌 및 인터넷 출처
- http://www.doc88.com/p-393989314472.html
- 위키피디아
1. 중심극한정리(CLT, Central Limit Theorem)
- 모집단의 평균이 이고 분산이 일 때, 임의 추출된 크기가 n 인 표본으로부터
계산된 표본평균은 표본의 n의 크기가 큰 경우 (보통 30이상) 근사적으로 정규분포
를 따른다.
- 표본의 크기가 충분히 커짐에 따라, 수렴하는 확률적 현상
Notice that when the sample size approaches a couple dozen, the distribution of the average is very nearly Normal, even though the parent distribution looks anything but Normal.
2. 정규분포
1) 정의
- 정규분포(가우스 분포)는 연속 확률 분포의 하나이다. 정규분포는 수집된 자
료의 분포를 근사하는 데에 자주 사용되며, 이것은 중심극한정리에 의하여
독립적인 확률변수들의 평균은 정규분포에 가까워지는 성질이 있기 때문이다.
- 정규분포는 2개의 매개 변수 평균 표준편차 에 대해 모양이 결정
- 이 때의 분포를 로 표기
- 특히, 평균이 0 이고 표준편차가 1인 정규분포를 N(0, 1)을 표준정규분포라고
한다
붉은 색은 표준정규분포
2) 파이썬 코드 (출처 : 위키피디아)
# Normal Distribution
import numpy as np
import matplotlib.pyplot as plt
def make_gauss(N, sig, mu):
return lambda x: N/(sig * (2*np.pi)**.5) * np.e ** (-(x-mu)**2/(2 * sig**2))
def main():
ax = plt.figure().add_subplot(1,1,1)
x = np.arange(-5, 5, 0.01)
s = np.sqrt([0.2, 1, 5, 0.5])
m = [0, 0, 0, -2]
c = ['b','r','y','g']
for sig, mu, color in zip(s, m, c):
gauss = make_gauss(1, sig, mu)(x)
ax.plot(x, gauss, color, linewidth=2)
plt.xlim(-5, 5)
plt.ylim(0, 1)
plt.legend(['0.2', '1.0', '5.0', '0.5'], loc='best')
plt.show()
if __name__ == '__main__':
main()
3) 정규분포의 확률밀도함수
4) 정규분포의 특성
5) 정규분포의 유형