簡單線性迴歸

統計 第 14 章 · 導覽投影片

Simple Linear Regression & Correlation

操作只有一個方向:按 →(或空白鍵)一路往下翻,沒有上下層、不會漏看
底部有進度條頁碼Esc 看縮圖、F 全螢幕。

導覽:建立地圖與框架。完整內容在 PDF 講義,例題解法在 index.html。

三件套怎麼用

檔案角色放什麼
PDF 講義學習主體完整內容、推導、所有例題
slides(本檔)導覽學習地圖、計算管線、招牌公式與易錯
index.html題目示範 + 上手例題八步驟完整解法 + scipy 驗算
路徑:本投影片建框架 → 讀 PDF 學重點 → 到 index 看完整解法並上手 → 回來下一個重點。

學習地圖:用 x 預測 y

一句話:用一個自變數 x 預測一個應變數 y。

母體模型:y = β₀ + β₁x + ε, ε ~ N(0, σ²)

三個步驟:① 配適(最小平方求 b₀、b₁)→ ② 評估(S_e、R²)→ ③ 推論(對斜率 β₁ 的 t 檢定)。

相關 r 衡量線性「強度與方向」;迴歸用來「預測」。

計算管線:資料 → 迴歸線 → 檢定

資料 (xᵢ, yᵢ)
  │  S_xy = Σxy − (Σx)(Σy)/n      S_xx = Σx² − (Σx)²/n      S_yy = Σy² − (Σy)²/n
  ▼
配適:b₁ = S_xy/S_xx,  b₀ = ȳ − b₁x̄   →   ŷ = b₀ + b₁x
  ▼
評估:SSE = S_yy − S_xy²/S_xx
      S_e = √(SSE/(n−2))            R² = S_xy²/(S_xx·S_yy) = r²
  ▼
推論:T = (b₁ − 0)/(S_e/√S_xx) ~ t_(n−2)
      |T| ≥ t_(α/2, n−2) ? ── 是 → 拒絕 β₁=0(有線性關係)

共同骨架:斜率檢定八步驟

  1. (1) H₀:β₁=0 (2) H₁:β₁≠0(檢定有無線性關係)
  2. (3) 統計量 T=(b₁−0)/(S_e/√S_xx) (4) 定 α
  3. (5) R = { |T| ≥ t_(α/2, n−2) } 自由度 n−2
  4. (6) 算 S_xy、S_xx → b₁;SSE → S_e → T
  5. (7) 比較下決策 (8) 白話結論
每個例題把八步+迴歸線完整寫出來的地方:index.html

招牌公式

b₁ = S_xy/S_xx, b₀ = ȳ − b₁x̄, ŷ = b₀ + b₁x
SSE = S_yy − S_xy²/S_xx, S_e = √(SSE/(n−2))
R² = SSR/SST = S_xy²/(S_xx·S_yy) = r², T = (b₁−β₁₀)/(S_e/√S_xx)
完整內容+推導:PDF §2–§4 · 題目完整解法+上手:index

評估模型的三個工具

工具看什麼判讀
估計標準誤 S_e√(SSE/(n−2))越小配適越好
判定係數 R²SSR/SST = r²越接近 1 解釋力越強
斜率 t 檢定β₁ 是否為 0拒絕=有顯著線性關係

考點R²=r²;自由度 n−2。易錯R² 高 ≠ 因果。

推論要點與誤差條件

  • 「有沒有線性關係」=雙尾檢定 H₀:β₁=0;拒絕才可用迴歸線預測
  • β₁ 信賴區間:b₁ ± t_(α/2,n−2)·S_e/√S_xx
  • 誤差四條件:ε 常態、E(ε)=0、等變異(σ 固定)、各誤差獨立
  • 易錯外推(超出 x 範圍)的預測風險高
例:年資×獎金 T=1.96 不拒絕;二手車 T=−13.45 拒絕(index

易錯總表

主題陷阱
自由度S_e 與斜率 t 檢定皆 n−2(非 n−1)
線性關係=檢定 β₁=0;不顯著就別用線預測
=r²;高不代表因果
SSE用 S_yy − S_xy²/S_xx 快算
外推超出 x 觀測範圍預測風險高

看完導覽,接著動手

1. 已有計算管線三評估工具招牌公式 + 易錯
2. 讀 PDF 學最小平方推導與例題。
3. 打開 index.html → 看例題八步驟完整解法,改數字用 scipy.stats.linregress 重跑。
4. 最後用 Quizlet 記憶卡主動回憶。

導覽結束 · 全章完

Per aspera ad astra

完整內容 → PDF 講義 · 題目解法與上手 → index.html · 複習 → Quizlet