閱讀屋>設計> 方差分析和正交試驗設計

方差分析和正交試驗設計

方差分析和正交試驗設計

  第6章 方差分析和正交試驗設計

  §6.1 單因子方差分析

  在實際問題中,某個指標的取值,往往可能與多個因素有關。例如,農作物的產量,可能與作物的品種有關,可能與施肥量有關,可能與土壤有關,等等。又例如,化工產品的收得率,可能與原料配方有關,可能與催化劑的用量有關,可能與反應溫度有關,還可能與反應容器中的壓力有關,等等。

  由於因素很多,自然就會產生這樣的問題:這些因素,對於指標的取值,是否都有顯著的作用?如果不是所有的因素都有顯著的作用,那麼,哪些因素的作用顯著?哪些因素的作用不顯著?還有,這些因素的作用,是簡單地疊加在一起的呢,還是以更復雜的形式交錯在一起的?

  以上這些問題,都需要我們從試驗資料出發,來加以判斷、分析,做出結論。方差分析(Analysis of Variance,簡稱ANOVA)就是一種能夠解決這類問題的有效的統計方法。

  在方差分析中,將可能與某個指標的取值有關的因素,稱為因子(Factor),通常用 A,B,? 來表示。因子所取的各種不同的狀態,稱為水平(Level),用 A1,A2,?,B1,B2,? 來表示。

  如果問題中只考慮一個因子,這樣的方差分析稱為單因子方差分析。如果問題中要考慮兩個因子,這樣的方差分析就稱為雙因子方差分析。當然,還可以有三因子、四因子、更多因子的方差分析。

  我們先來看單因子方差分析。

  問題 設某個指標的取值可能與一個因子 A 有關,因子 A 有 r 個水平:A1,A2,?,Ar。在這 r 個水平下的指標值,可以看作是 r個相互獨立、方差相等的正態總體

  ?i~N(?i,?2),i?1,2,?,r 。

  在每一個水平 Ai 下,對指標作 t (t?1)次重複觀測,設觀測結果為

  Xi1,Xi2,?,Xit ,

  它們可以看作是總體 ?i 的樣本。即有

  問:因子 A 對指標的作用是否顯著?

  137

  檢驗方法

  檢驗因子 A 的作用是否顯著,相當於要檢驗這樣一個假設

  H0:?1??2?r 。

  為了作檢驗,先給出一批定義。稱

  n?rt 為總觀測次數 ,

  1t

  i??Xij 為水平Ai的均值 , tj?1

  SSi??(Xij?i)2 為水平Ai的平方和 ,

  j?1t

  1rt1r

  Xij??i 為總均值 , ni?1j?1ri?1

  SST(Xij?)2 為總平方和 ,

  i?1j?1rt

  SSe(Xij?i)??SSi 為誤差平方和 , 2

  i?1j?1i?1rtr

  SSA?t?(i?)2 為因子A的平方和 。

  i?1r

  這些統計量之間的相互關係,可以用下列圖表的形式表示出來:

  水平 觀測值 Ai 的平方和 Ai 的均值

  1?

  r?? 總均值 A1? Ar

  X11?X1t←─SS1─→ ?? ? ←─SSr─→ X1?Xrt?r←────→ │←── 誤差平方和SSe──→│←─A的平方和SSA──→│ │←───────── 總平方和SST─────────→│

  t

  SSi??(Xij?i)2 反映了在各水平 Ai 的內部指標取值的差異程度,這種差異

  j?1

  完全是由於誤差引起的,而 SSe 是所有這樣的. SSi 的總和,所以稱為誤差平方和。

  SSA?t?(i?)2 反映了各水平之間指標取值的差異程度,如果因子A 的作用i?1r

  不顯著,各水平之間差異很小,1,2,?,r近似相等,與X差異很小,SSA 的值也比 138

  較小,如果因子A 的作用顯著,各水平之間差異很大,1,2,?,r與X的差異也很大,

  所以稱為因子A 的平方和。 SSA 的值就會偏大。SSA 的大小反映了因子 A 的作用大小,

  總平方和 SST 、誤差平方和 SSe 、因子A 的平方和 SSA 之間,有下列平方和分解關係:

  SST?SSe?SSA 。

  這是因為

  SST(Xij?)2 i?1j?1

  rtrt

  (X

  i?1j?1

  rtij?i?i?)2 ?i)?2??(Xij?i)(i?)(i?)2 2

  i?1j?1i?1j?1

  trtrt (Xi?1j?1ij

  ?SSe?2?(?X

  i?1j?1rij?ti)(i?)?t?(i?)2 i?1r

  ?SSe?0?SSA?SSe?SSA 。

  由 SSA 、SSe 可以算出統計量 MSA?SSA(r?1) 和 MSe?SSe(n?r) 。MSA 稱為因子A 的均方,MSe 稱為誤差均方。由 MSA 、MSe 可以算出統計量

  FA?MSASSA(r?1) 。 ?MSeSSe(n?r)

  下面證明一個關於 FA 的分佈的定理。

  定理 6.1 若 H0:?1??2?r 為真,則有

  FA?MSASSA(r?1)~F(r?1,n?r) 。 ?MSeSSe(n?r)

  2 證 設?1??2?r??,這時有 ?i~N(?,?),i?1,2,?,r 。

  因為 Xi1,Xi2,?,Xit 是 ?i的樣本,所以 Xij~N(?,?)2Xij??

  ?~N(0,1),

  i?1,2,?,r,j?1,2,?,t,相互獨立。 139

  Q?

  r

  t

  ?Xiji?1j?1??

  r

  t

  2

  ??(X

  i?1j?1

  rt

  ij

  ?)2

  ?

  2

  ??(X

  ?

  i?1j?1

  ij2

  ?)

  2

  2??(Xij?)(??)?

  i?1j?1

  rt

  ??(??)

  ?

  i?1j?1

  rt

  2

  ??

  SST

  ?0?

  2

  ?

  2

  ?

  SSA

  SSe

  n(??)2

  ?2?2

  2

  ?

  ?

  2

  ?

  ?2

  ?

  n?Q1?Q2?Q3 。

  ??

  其中,Q1?

  r

  SSA

  ?

  r

  2

  ?

  t?(i?)2

  i?1

  r

  ?2

  是r項的平方和,但這r項又滿足1個線性關係式:

  ?(i?1

  i

  ?)??i?r?0,所以,Q1的自由度 f1?r?1。

  i?1

  Q2?

  SSe

  ??(X

  ?

  i?1j?1

  rt

  ij

  ?i)2

  是 n?rt 項的平方和,但這 n 項又滿足 r個線性

  t

  ?

  2

  ?2

  ij

  關係式:

  ?(X

  j?1

  t

  ?i)??Xij?ti?0,i?1,2,?,r,所以,Q2的自由度

  j?1

  f2?n?r。

  ?

  ?nQ3是1項的平方和,所以,Q3的自由度 f3?1。

  ??

  因為 f1?f2?f3?(r?1)?(n?r)?1?n,所以由定理2.7(Cochran 定理)可知:

  2

  Q1?

  SSA

  ?

  2

  2

  ~?(r?1),Q2?

  SSe

  ?2

  ?22

  ?n~?(n?r),Q3~?(1),

  ??

  2

  2

  而且Q1?

  SSA

  ?

  2

  ,Q2?

  SSe

  ?2

  ?

  ?n,Q3相互獨立。

  ??

  因此,由F分佈的定義可知

  140

  2SSA(r?1)FA??

  SSe(n?r)SSe

  SSA

  r?1)

  ~F(r?1,n?r) 。

  ?

  2

  n?r)

  由定理6.1可知,若H0:?1??2?r 為真,則FA~F(r?1,n?r) ; 若 H0:?1??2?r 不真,則SSA的值會偏大,FA的值也會偏大,統計量FA 的分佈,相對於 F(r?1,n?r) 分佈來說,峰值的位置會有一個向右的偏移。

  因此,可得到檢驗方法如下:

  從樣本求出 FA 的值。對於給定的顯著水平?,自由度(r?1,n?r),查F分佈的分位數表,可得分位數F1??(r?1,n?r),使得 P{FA?F1??(r?1,n?r)}?? ,當

  FA?F1??(r?1,n?r) 時,拒絕H0:?1??2?r ,這時,可以認為因子 A 的

  作用顯著,否則,接受 H0:?1??2?r,這時,可以認為因子 A 的作用不顯著 。 單因子方差分析的計算步驟

  方差分析的計算比較複雜,用帶統計功能的計算器計算時,最好按照下列步驟進行,並把計算結果填寫在下列形式的表格中:

  t

  1t

  (1)從Xi1,Xi2,?,Xiti求出 i??Xij 和 SSi??(Xij?i)2,i?1,2,?,r 。

  tj?1j?1

  t

  1t

  把Xi1,Xi2,?,Xiti看作樣本,i??Xij 就是樣本均值,SSi??(Xij?i)2

  tj?1j?1

  1t2

  就是樣本方差 S??(Xij?i) 再乘以樣本觀測次數 t (或修正樣本方差

  tj?1

  2

  1t

  。所以,在計算器上計算時,只要像計算樣本統S*?(Xij?i)2再乘以t?1)?t?1j?1

  2

  141

【方差分析和正交試驗設計】相關文章: