이전 글 모음
미국사는 학부/석사생들이 직장 구하는법을 알아보자!! (1편)
미국의 학부/석사생들이 직장 구하는법을 알아보자!! (2편 - 면접 멘탈리티)
통계시리즈:
1탄) 10살도 이해할수있는 "통계적 유의성" 설명!! (수학X용어X)
2탄) 10살도 이해할수있는 "표준편차" 설명!! (수학X용어X)
1탄에서 p값을 소개한바있어
그때 예제를 통해 복습을 하면서
P값의 의미에 대해 심화 설명해볼게
한국평균이 180cm라는 주장하는 남자가있어
나는 180cm가 안될거라고 반박을해
요약
가설: 20대한국 평균키는 180cm일것이다
반박가설: 20대한국 평균키는 180cm가 안될것이다
가설을 깨는 최고의 방법은
대한민국 20대남성을 모두 모아서
키를 재고 평균을 내보는거겠지만
나 혼자 그러기엔 현실적으로 불가능하겠지?
그래서 표본을 추출해야하는거야
무작위로 500명정도를 뽑아서 키를 쟀더니 평균이 170cm!
이를 근거로 난 남자에게 말해
“자, 봐! 500명이나 뽑았는데 평균이 170cm야. 한국평균은 180이 안돼!”
하지만 그 남자는 골똘히 생각하더니 날카로운 반박을해
“잠시만! 너가 무작위로 뽑았을지언정
우연찮게 키가 작은 500명만 뽑았을 가능성도 있는거잖아?”
당황스럽지만 틀린말이 아니야
자, 저 남자말대로
“대한민국 20대의 평균키가 180이다”
라고 가정했을때
500명을 무작위로 뽑았는데
우연찮게 평균이 170cm이하일 가능성
그.게.바.로. p값.이.야.
그 확률(p값)이 아주 낮을것같지?
아주낮다고 볼수있는 0.01이라고 쳐보자
p=0.01을 말로 풀어보자면
한국평균이 진짜 180이라면
“표본을 100번뽑아보면 1번정도 평균170cm이하일것이다”
반대로 말하면
“표본을 100번 뽑아보면 99번은 평균170cm보다 클거다”
즉, 가정이 사실이라면 우리의 관측결과(평균170cm)는
있기 힘든 (1/100확률)의 사건이 벌어졌다는 뜻이야.
그런데 우리가 관측한 수치는
실제로 일어난 일이기때문에 그걸 부정할수는 없어
그럼 무슨말이겠어?
180이라는 가정이 잘못되었을거다 이말이야
“고로 아마 저 남자의 가설이 잘못되었을것이다”
라고 결론을 낼수있는거야
하지만 명심해. 이건 어디까지나 통계를 토대로한 추측이야
진짜로 100번에 한번 일어날수있는일이 일어난걸수도 있거든ㅜ
저번글에선 통계적유의성에 중점적으로 설명했다면
이번엔 p값의 정확한 의미에 대해 알아봤어
복습이 좀있었지만 도움됐길바라고
사실 다음, 다다음글에대한 빌드업이니까
다음엔 p값을 어떻게 계산하는지 알려줄게
요약
- p값은 표본의 통계값이 (예를들어 평균값)
- 우연찮게 모집단의 통계값과 동떨어져있을 확률을 표현
ps
궁금한점 고쳐야할점 다 말해줘
포텐 + 피드백 모두 다 고맙게 받을게