統計 第 12 章 · 題目示範與上手

看完 PDF 一個重點後 → 看八步驟完整解法 → 改程式碼用 scipy 上手驗算
Python:尚未載入(按任一「執行」即載入)

定位:投影片建立了計算管線與公式,PDF 講義是學完整內容的主體;這頁是「看完 PDF 一個重點後」的題目完整解法示範 + 上手練習。每題先給題目,再寫假設檢定八步驟,最後附可改可跑的 scipy 驗算

提示:第一次按「執行」會載入 Python 與 numpy/scipy(約數十秒),之後很快,需連網。範例不用 input()

第 1 節 一因子 ANOVA 計算 One-Way ANOVA

先回想(細節在 PDF §3)

把總變異拆成組間(SSTR,SSTR)與組內(SSE,SSE);MSTR=SSTR/(k−1)、MSE=SSE/(n−k);F=MSTR/MSE ~ F(k−1,n−k),右尾

個案:三種包裝的銷售量(有原始資料)

題目

四家相近超市試銷,三種包裝各賣一週,每組 n=4。包裝1:9,8,7,12;包裝2:5,10,9,8;包裝3:16,12,14,10。α=0.05 檢定三種包裝銷售量是否有差異。

完整解法(八步驟)

三組 (k=3)、共 n=12;組平均 9、8、13,總平均 10。

  1. H₀:μ₁ = μ₂ = μ₃
  2. H₁:至少有一組 μᵢ ≠ μⱼ
  3. 檢定統計量 F = MSTR / MSE,自由度 (k−1, n−k) = (2, 9)
  4. α = 0.05
  5. R = { F ≥ F₀.₀₅(2, 9) = 4.26 }(右尾)
  6. SSTR = 4(9−10)²+4(8−10)²+4(13−10)² = 56 → MSTR = 56/2 = 28;SSE = 3(14/3)+3(14/3)+3(20/3) = 48 → MSE = 48/9 = 5.33;F = 28/5.33 = 5.25
  7. 5.25 ≥ 4.26 → Reject H₀
  8. 結論:α=0.05 下有充分證據說三種包裝的銷售量有顯著差異。
注意:教授講義寫 F₀.₀₅(2,9)=3.2 有誤,正確為 4.26(結論不變)。
▶ 上手驗算 scipy.stats.f_oneway 一行做 ANOVA

  

例題 12.1:三齡層投資金額(只有摘要統計)

題目

384 位年長者分三齡層調查投資金額(千美元):n₁=123, n₂=108, n₃=153;x̄₁=76.21, x̄₂=75.14, x̄₃=82.69(總平均 78.49);S₁²=787.35, S₂²=712.47, S₃²=718.19。α=0.05 檢定三齡層投資金額是否有差異。

完整解法(八步驟)

只有摘要統計(無原始值)→ 用 SSTR=Σnᵢ(x̄ᵢ−x̄)²、SSE=Σ(nᵢ−1)Sᵢ² 手算。

  1. H₀:μ₁ = μ₂ = μ₃
  2. H₁:至少一組不等
  3. F = MSTR/MSE,自由度 (2, 381)
  4. α = 0.05
  5. R = { F ≥ F₀.₀₅(2, 381) ≈ 3.04 }
  6. SSTR = 123(76.21−78.49)²+108(75.14−78.49)²+153(82.69−78.49)² = 4550 → MSTR = 2275;SSE = 122(787.35)+107(712.47)+152(718.19) = 281446 → MSE = 738.7;F = 2275/738.7 = 3.08
  7. 3.08 ≥ 3.04 → Reject H₀
  8. 結論:有充分證據說三齡層投資金額有顯著差異。
▶ 上手驗算 摘要統計手算 ANOVA + f.ppf 臨界值

  
小主題測驗卷 · 4 題(達 90% 放行)

Q13 組、各 n=4(共 12)做 ANOVA,F 的自由度是?

(k−1, n−k) = (2, 9)。分子 k−1=2、分母 n−k=12−3=9。

Q2SSE 的正確算法是?

Σ(nᵢ−1)Sᵢ²。第三個是 SSTR;別用 nᵢSᵢ²。

Q3已知 MSTR=28、MSE=5.33,則 F=?

F=MSTR/MSE=28/5.33=5.25。

Q4ANOVA 的拒絕域形狀是?

右尾。H₀ 假只會讓 MSTR 變大、F 偏大。

第 2 節 前提、判讀與常見陷阱 Conditions & Pitfalls

先回想(細節在 PDF §6)

三前提:各母體常態、變異數未知但相等、樣本獨立。ANOVA 是聯合 t 的推廣;常態不成立改用 Kruskal–Wallis
小主題測驗卷 · 4 題(達 90% 放行)

Q1下列哪個不是 ANOVA 的前提?

樣本數不必相等。前提是常態、等變異、獨立。

Q2比較 4 組平均,為何不用兩兩 t 檢定(共 6 次)取代 ANOVA?

累積放大 α。每次 α=0.05,6 次後整體型一誤差遠大於 0.05。

Q3ANOVA 拒絕 H₀ 後,可以直接下哪個結論?

至少一組不同。要指出哪幾組需再做多重比較。

Q4當常態假設不成立時,應改用?

Kruskal–Wallis。無母數方法,對應 ANOVA。