【工作分享】品質是什麼?品質工程師之路_什麼是統計?The Insight of Quality – Way to be a Quality Engineer

以下文章是我在啟碁科技發表的統計說明 原則上匯總了大學及研究所讀的統計概略

這一連串的問題是學習統計的重要觀念 裡面提到了許多關鍵名詞說明及統計特有的思考邏輯

是學習統計基礎的良好入門教材
這些問題是想像一位完全沒有統計基礎的學生在屏除統計繁雜的計算及各式分配的恐懼之餘
在眼前看見一個大型木箱 並且要利用客觀的常識(重量)試圖論證木箱裡面裝的是什麼東西
試圖用概觀的視角提供學習者領略統計奧妙的第一步
已學習過統計的人也可以藉由這個例子看看自己是否真的懂所謂的統計
現在想像各位眼前有一個木箱 裡頭裝著某個物體 放在秤上有310公斤重(忽略木箱重量)


Q1: 請問眼前的木箱裝的是什麼東西?

答案是猜不出來 (在沒有任何根據下如果猜得出來算你厲害)

Q2: 請問眼前的木箱裝的比較有可能是隻豬還是個人?

應該是豬 (這不是腦筋急轉彎 以直覺來說猜豬比較正確)

Q3: 為什麼比較有可能是豬?

這會呼應第2題的答案 我們會認為比較可能是豬的初步原因是直覺 因為豬的重量比較重

對應到統計上的觀念就是豬的重量母體分配與人的重量母體分配會如圖1所示

既然豬的重量分配是以300kg為平均值的常態分配 那秤出來是310kg的物體當然較可能是豬

事實上這裡就是假設檢定的由來 

當我們想要知道這問題的答案時 我們其實是在比較兩者間的機率

而口語化的問題會被轉換成假設檢定常用的形式:虛無假設Ho跟對立假設H1

在這裡的假設檢定會是H0: μ=μ豬, H1: μ≠μ豬(μ是平均值的意思 這裡代指重量)

白話文就是 反方:屬於豬的體重 or 正方:不屬於豬的體重

那麼重量310kg的物體是豬的機率就可以轉成另一個形式 

也就是去計算310kg的物體有多不可能是豬
P(x>310)= 0.3(我亂算的) 
這個機率就表示在豬的母體分布中 比310大的機會有30%(紅色區域的面積)
這個值算滿高的 意思就是有30%的豬母體都會大於310公斤 這比例非常高
也遠比0.05這個標準來得高 代表你只能傾向接受310公斤是豬的假設

因為你沒辦法藉由計算紅色的面積得到推翻μ=μ豬假設的結果


              圖1

Q4: 那麼木箱裡面有沒有可能是人呢?為什麼?

答案是有可能的 只是機會比較低

原因同Q3的計算方式 只是現在要計算的是綠色的面積 

也就是在人的母體分布中計算P(x>310)的值

這個值P(x>310)=0.001(一樣我亂算的) 這個值就小得多了 

代表310公斤的物體對於人類的體重分布來說太重了

重到它落入了所謂的棄卻域 也就是310公斤的物體不太可能是人 

而這個機率很低 大概是千分之一

在這裡假設檢定要改成H0: μ=μ人, H1: μ≠μ人 

也就是想知道這個木箱裡面的東西有沒有可能是人

根據計算出來的機率是0.001 表示實在不太可能是人 但當然有可能是(實際生活上也確實有)

只是機率相當低

Q5: P-Value到底是什麼意思?

在Q3, Q4裡面就有陳述 P-value其實是計算母體中比觀察值還要極端的機率

這個機率要是很低的話 我們會傾向於拒絕假設檢定H0 

通常認定上以0.05作為標準 (醫學領域可能會用到0.001)

如果機率低於0.05 表示不太可能得到接受H0的假設 

也就是比較不接受觀察值屬於該母體分布的推測

算出來的機率越低 表示觀察值越極端 則該觀察值就越不可能屬於這母體

換成這個例子來說 就是在人的重量母體分布裡面 比310kg大的機率非常低 

大概只有0.001 而我們就越不可能接受310kg是人的推論
瀏覽次數: -

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Interactive Control Chart