2023. 10. 31. 13:47ㆍ[실험계획]
cf. (1장)
편차: 변량-평균
오차: 추정값-참값
변산성(variability): 자료가 흩어진 정도
[용어 요약]
제곱합: 편차 제곱의 총합, 표본내의 변산성의 총량을 나타냄
분산분석(Analysis Of Variance)은 총 제곱합을 분할하여 수행
* 이때 제곱합이 어떤 변량에서 어떤 평균을 빼느냐에 따라 총제곱합/처리제곱합/오차제곱합으로 나뉨
[cf]
두 집단의 비교) 평균차이를 이용한 T검정 수행
세 개 이상의 집단비교) 분산비를 이용한 분산분석 수행
분산분석을 왜하는가? (다스리언니: 제곱한걸 왜 또 분할하누!)
두 집단의 비교에서 사용한 T검정은 사용이 안되는 이유는 세 집단을 비교하는 적절한 가설을 세우기 어려워서 다른 방법이 필요하다
날씨가 화창한 어느날 농부가 옥수수를 심어야 겠다고 생각했습니다

ppt icon
농부는 키가 아주 큰 옥수수를 길러보려고 서로 다른 비료 1,2,3을 구매했지요!
그리곤 밭에가서 비료 1,2,3을 뿌리고 옥수수의 키를 비교하기로 했습니다.
|
관측값(옥수수의 키)
|
평균
|
제곱합(밭마다 옥수수키의 다름 정도)
|
밭(비료1)
|
1 2 3 4 5
|
3
|
4+1+0+1+4 = 10
|
밭(비료2)
|
2 4 6 8 10
|
6
|
16+4+0+4+16 = 40
|
밭(비료3)
|
2 2 2 2 2
|
2
|
0
|
총 평균: (1+2+3+4+5+2+4+6+8+10+2+2+2+2+2)/15 = 55/15
|
이걸 수식으로 바꾸면

이렇게 됩니다!
여기서 관측값은 아래와 같이 수식관계를 가지게 되는데


각각을 제곱해서 sigma하면 총분산 분해식이 나와용!
총분산 = 집단간분산(처리제곱합) + 집단내분산(오차제곱합)
으로 분해됩니다. 먼저
1) 총분산의 경우
: 관측값에서 총평균을 뺀 제곱의 합이 총분산인건 직관적입니다
2) 집단간 분산의 경우
: 각 집단의 평균에서 총평균을 뺀다면 해당 집단이 얼마나 변동성을 갖는지 알 수 있겠죠?
총분산(SST)=집단간분산(SSB)+집단내(SSW)
총분산(SST)=처리제곱합(SSA)+오차제곱합(SSE)
* 처리제곱합(SSA) 또는 SSTr이라고도 한다.
결론~
그래서 지금까지 우리가 구한 건 총분산내에서 집단처리(실험하고자하는 것)제곱합이랑 오차제곱합을 분리할 수 있고, 그들의 분산비를 검정하는 방식을 통해서 처리가 유의한지 알 수 있다. 검정하려면 분포 필요한데, 이때 평균제곱의 분산비가 F분포를 따르기 때문에 검정이 가능하다.
|
제곱합
|
자유도
|
평균제곱 (자유도로 나눠줌)
|
집단간(SSB)
|
총분산
|
k-1
k: 집단수
|
MSB=총분산/(k-1)
|
집단내(SSW)
|
집단간분산
|
n-k
|
MSW=집단간분산/(n-k)
|
총분산(SST)
|
집단내분산
|
n-1
n: 전체관측수
|
MSB/MSW ~F분포따름
|

색깔별로 값이 들어감
'[실험계획]' 카테고리의 다른 글
[1장] 표준편차랑 표준오차 (0) | 2023.10.31 |
---|