[2장] ANOVA

2023. 10. 31. 13:47[실험계획]

728x90
반응형

cf. (1장)

편차: 변량-평균

오차: 추정값-참값

변산성(variability): 자료가 흩어진 정도

[용어 요약]

제곱합: 편차 제곱의 총합, 표본내의 변산성의 총량을 나타냄

분산분석(Analysis Of Variance)은 총 제곱합을 분할하여 수행

* 이때 제곱합이 어떤 변량에서 어떤 평균을 빼느냐에 따라 총제곱합/처리제곱합/오차제곱합으로 나뉨

[cf]

두 집단의 비교) 평균차이를 이용한 T검정 수행

세 개 이상의 집단비교) 분산비를 이용한 분산분석 수행

분산분석을 왜하는가? (다스리언니: 제곱한걸 왜 또 분할하누!)

두 집단의 비교에서 사용한 T검정은 사용이 안되는 이유는 세 집단을 비교하는 적절한 가설을 세우기 어려워서 다른 방법이 필요하다

날씨가 화창한 어느날 농부가 옥수수를 심어야 겠다고 생각했습니다

ppt icon

농부는 키가 아주 큰 옥수수를 길러보려고 서로 다른 비료 1,2,3을 구매했지요!

그리곤 밭에가서 비료 1,2,3을 뿌리고 옥수수의 키를 비교하기로 했습니다.

관측값(옥수수의 키)
평균
제곱합(밭마다 옥수수키의 다름 정도)
밭(비료1)
1 2 3 4 5
3
4+1+0+1+4 = 10
밭(비료2)
2 4 6 8 10
6
16+4+0+4+16 = 40
밭(비료3)
2 2 2 2 2
2
0
총 평균: (1+2+3+4+5+2+4+6+8+10+2+2+2+2+2)/15 = 55/15

이걸 수식으로 바꾸면

이렇게 됩니다!

여기서 관측값은 아래와 같이 수식관계를 가지게 되는데


각각을 제곱해서 sigma하면 총분산 분해식이 나와용!

총분산 = 집단간분산(처리제곱합) + 집단내분산(오차제곱합)

으로 분해됩니다. 먼저

1) 총분산의 경우

: 관측값에서 총평균을 뺀 제곱의 합이 총분산인건 직관적입니다

2) 집단간 분산의 경우

: 각 집단의 평균에서 총평균을 뺀다면 해당 집단이 얼마나 변동성을 갖는지 알 수 있겠죠?

총분산(SST)=집단간분산(SSB)+집단내(SSW)

총분산(SST)=처리제곱합(SSA)+오차제곱합(SSE)

* 처리제곱합(SSA) 또는 SSTr이라고도 한다.

결론~

그래서 지금까지 우리가 구한 건 총분산내에서 집단처리(실험하고자하는 것)제곱합이랑 오차제곱합을 분리할 수 있고, 그들의 분산비를 검정하는 방식을 통해서 처리가 유의한지 알 수 있다. 검정하려면 분포 필요한데, 이때 평균제곱의 분산비가 F분포를 따르기 때문에 검정이 가능하다.

제곱합
자유도
평균제곱 (자유도로 나눠줌)
집단간(SSB)
총분산
k-1
k: 집단수
MSB=총분산/(k-1)
집단내(SSW)
집단간분산
n-k
MSW=집단간분산/(n-k)
총분산(SST)
집단내분산
n-1
n: 전체관측수
MSB/MSW ~F분포따름

색깔별로 값이 들어감

 
728x90
반응형

'[실험계획]' 카테고리의 다른 글

[1장] 표준편차랑 표준오차  (0) 2023.10.31