以下文章是我在啟碁科技發表的統計說明 原則上匯總了大學及研究所讀的統計概略
這一連串的問題是學習統計的重要觀念 裡面提到了許多關鍵名詞說明及統計特有的思考邏輯
答案是猜不出來 (在沒有任何根據下如果猜得出來算你厲害)
Q2: 請問眼前的木箱裝的比較有可能是隻豬還是個人?
應該是豬 (這不是腦筋急轉彎 以直覺來說猜豬比較正確)
Q3: 為什麼比較有可能是豬?
這會呼應第2題的答案 我們會認為比較可能是豬的初步原因是直覺 因為豬的重量比較重
對應到統計上的觀念就是豬的重量母體分配與人的重量母體分配會如圖1所示
既然豬的重量分配是以300kg為平均值的常態分配 那秤出來是310kg的物體當然較可能是豬
事實上這裡就是假設檢定的由來
而口語化的問題會被轉換成假設檢定常用的形式:虛無假設Ho跟對立假設H1
在這裡的假設檢定會是H0: μ=μ豬, H1: μ≠μ豬(μ是平均值的意思 這裡代指重量)
白話文就是 反方:屬於豬的體重 or 正方:不屬於豬的體重
那麼重量310kg的物體是豬的機率就可以轉成另一個形式
因為你沒辦法藉由計算紅色的面積得到推翻μ=μ豬假設的結果
Q4: 那麼木箱裡面有沒有可能是人呢?為什麼?
答案是有可能的 只是機會比較低
原因同Q3的計算方式 只是現在要計算的是綠色的面積
這個值P(x>310)=0.001(一樣我亂算的) 這個值就小得多了
重到它落入了所謂的棄卻域 也就是310公斤的物體不太可能是人
在這裡假設檢定要改成H0: μ=μ人, H1: μ≠μ人
根據計算出來的機率是0.001 表示實在不太可能是人 但當然有可能是(實際生活上也確實有)
只是機率相當低
Q5: P-Value到底是什麼意思?
在Q3, Q4裡面就有陳述 P-value其實是計算母體中比觀察值還要極端的機率
這個機率要是很低的話 我們會傾向於拒絕假設檢定H0
如果機率低於0.05 表示不太可能得到接受H0的假設
算出來的機率越低 表示觀察值越極端 則該觀察值就越不可能屬於這母體
換成這個例子來說 就是在人的重量母體分布裡面 比310kg大的機率非常低