統計 第 14 章 · 題目示範與上手

看完 PDF 一個重點後 → 看八步驟完整解法 → 改程式碼用 scipy 上手驗算
Python:尚未載入(按任一「執行」即載入)

定位:投影片建立框架、PDF 講義學完整內容;這頁是「看完 PDF 一個重點後」的題目完整解法示範 + 上手練習。重點:最小平方 b₀/b₁、評估(S_e、R²)、對斜率 β₁ 的 t 檢定(=檢定有無線性關係)。

提示:第一次按「執行」會載入 Python 與 numpy/scipy(約數十秒),需連網。

第 1 節 配適迴歸線與評估 Least Squares

先回想(細節在 PDF §2–§3)

最小平方:b₁=S_xy/S_xx、b₀=ȳ−b₁x̄;評估用 估計標準誤 S_e判定係數 R²

例題 14.1:年資 x 與績效獎金 y(n=6)

題目

六位員工的年資與年度績效獎金(千美元):x = 1,2,3,4,5,6;y = 6,1,9,5,17,12。配適迴歸線,求 R²,並在 α=0.05 下檢定獎金與年資是否有線性關係。

完整解法(八步驟)

Σx=21, Σy=50, Σxy=212, Σx²=91, Σy²=576, n=6。

  1. 係數:S_xy=212−21·50/6=37、S_xx=91−21²/6=17.5、S_yy=576−50²/6=159.33
  2. b₁=37/17.5=2.114、b₀=50/6−2.114·21/6=0.934 → ŷ=0.934+2.114x
  3. SSE=159.33−37²/17.5=81.10、S_e=√(81.10/4)=4.50
  4. R²=37²/(17.5·159.33)=0.49(年資解釋約 49% 獎金變異)
  5. 檢定線性關係 ⇔ H₀:β₁=0 vs H₁:β₁≠0;T=(b₁−0)/(S_e/√S_xx),df=n−2=4
  6. R={|T|≥t₀.₀₂₅,₄=2.776}
  7. T=2.114/(4.50/√17.5)=1.96 < 2.776 → Do not reject H₀
  8. 結論:此樣本無足夠證據說年資與獎金有線性關係(樣本小、變異大)。
▶ 上手驗算 scipy.stats.linregress(一行最小平方)

  
小主題測驗卷 · 4 題(達 90% 放行)

Q1最小平方法在最小化什麼?

Σ(y−ŷ)²。因 Σ(y−ŷ)=0,故最小化平方和。

Q2斜率估計 b₁ =?

b₁=S_xy/S_xx。b₀=ȳ−b₁x̄。

Q3判定係數 R² 與相關係數 r 的關係是?

R²=r²。簡單迴歸中判定係數=相關係數平方。

Q4估計標準誤 S_e 的自由度(分母)是?

n−2。S_e=√(SSE/(n−2)),估了 b₀、b₁ 兩個參數。

第 2 節 斜率 t 檢定與判定係數 Slope test & R²

先回想(細節在 PDF §4)

檢定「有無線性關係」=檢定 H₀:β₁=0;T=(b₁−β₁₀)/(S_e/√S_xx) ~ t_{n−2}。R²=SSR/SST 衡量解釋力。

例題 14.4:二手車里程 x 與售價 y(n=100,摘要統計)

題目

100 輛三年車齡 Camry:S_xy=−287.995、S_xx=4307.378、S_yy=29.702,配適得 ŷ=17.25−0.0669x。在 α=0.05 下檢定售價與里程是否有線性關係,並求 R²。

完整解法(八步驟)

先由 SSE 求 S_e,再做斜率 t 檢定;df=n−2=98。

  1. SSE=S_yy−S_xy²/S_xx=29.702−(−287.995)²/4307.378=10.446
  2. S_e=√(SSE/(n−2))=√(10.446/98)=0.3265
  3. H₀:β₁=0;H₁:β₁≠0;T=(b₁−0)/(S_e/√S_xx),df=98
  4. α=0.05;R={|T|≥t₀.₀₂₅,₉₈≈1.984}
  5. T=−0.0669/(0.3265/√4307.378)=−13.45
  6. |−13.45|≥1.984 → Reject H₀
  7. R²=S_xy²/(S_xx·S_yy)=0.648(里程解釋約 64.8% 售價變異)
  8. 結論:售價與里程有顯著線性(負)關係,r=−0.805。
▶ 上手驗算 摘要統計手算斜率檢定 + R²

  
小主題測驗卷 · 4 題(達 90% 放行)

Q1「檢定 x 與 y 是否有線性關係」等同檢定哪個參數?

β₁=0。斜率為 0 → 線水平 → 無線性關係。

Q2斜率 t 檢定的自由度是?

n−2。T=(b₁−β₁₀)/(S_e/√S_xx) ~ t_{n−2}。

Q3總平方和 SST 的分解是?

SST=SSR+SSE,df:n−1=1+(n−2)。

Q4R² = 0.648 的意思是?

x 解釋約 64.8% 的 y 變異(SSR/SST);R²=r²,但不代表因果。