二項分布與大數法則 理論與實際相連 曹亮吉 |
在〈藥效如何〉(《科學月刊》第十六卷第五期)一文�,我們假設某藥的治療率為 0.6,然後算出 10 人中有 x 人痊癒的機率為 C10x(0.6)x(0.4)10-x。這是一種機率分布;我們的目的是把試驗的結果拿來和此機率分布模型相對照,以決定治癒率為 0.6 的假說是否合理。
上面這種機率分布稱為二項分布。一般的二項分布是這樣的: 假設某事件的發生率為 p,而試驗做了 n 次。則 n 次中,某事件發生 x 次的機率為 b(x;n,p)=Cxnpx(1-p)n-x 通常我們把 n、p 固定,讓 x 變動,以研究其機率變動的情形。這種機率分布之稱為二項分布。因為它可經由二項式 (p+(1-p))n 的展開式而得: (上式的左邊等於 1;這正表示各種可能的 x 值,其發生的機率之和為 1。) 因此有關二項分布的理論與計算和二項係數 Cxn 的性質有密切的關係。
讓 x 變動,則 b(x;n,p) 變化的情形如何?我們以 n=10,p=0.6 為例,列成下表
我們發現 b(x;10,0.6) 之值隨著 x 之值逐漸升高,到了 x=6 時最大,然後又逐漸變小。這種現象毋寧說是預期的,因為 n=10, p=0.6,所以預期 x=np=6 最可能發生,而 x 離開 6 愈遠愈不可能發生。
一般的 n,p 也有類似的現象。直接從公式來看,我們可以這樣解釋: 時 當 x 小的時候,這個比值會大於 1,而當 x 大過某種程度後,這個比值會小於 1,這只表示 b(x;n,p) 之值由小變大,然後再變小。什麼時候達到最大值?當上述比值由大於 1 變成小於等於 1 的時候。假設 則 np-x>-p 而 。兩式合併得 。因為 0<p<1 ,所以當 x 為兩個最接近 np 向的整數之一時(np 不一定是整數),b(x;n,p) 達到最大值。
我們可以從另一個觀點來看 np 這個值。由於我們有 b(x;n,p) 的機率得到 x 值,所以平均起來得到的 x 值應為 就稱為二項分布 b(x;n, p) 的期望值或平均值。
雖然 x 的期望值是 np,但這不就表示 x 值常出現在 μ 值附近。也許有很多 x 值比 μ 小得多,而正好有很多 x 值比 μ 大得多,兩相抵消,平均起來,x 值就在 μ 附近。為了估計 μ 與 p 差多少,又兼顧 x 值發生的機率,我們要引進方差 註1 ,它要等於 若 c 為正數,我們要估計有多大的機會, 會大於 c。由 σ 的定義,我們得 因此我們就得到 Chebyshev 不等式: 假設 為正數,令 ,則上式可改寫成 因為上式的右邊也隨著 n 增大而趨近於 0,所以無論 原來有多小,只要 n 夠大, 與 p 之差要大於 的機率就會任意小,亦即 這就是所謂的大數法則:在二項分布的機率模型假定之下,只要實驗的次數 n 夠大,則事件發生的次數比 ,從機率的觀點來看,就會很接近 p 值。這是機率論萌芽初期的一個重要定理,它由 Jakob Bernoulli(1654∼1705年)首先證得完整,而在他死後發表於1713年。可注意者,Chebyshev(1824∼1894年)是十九世 紀的數學家,生在 Bernoulli 之後,我們用他的不等式反推 Bernoulli 的大數法則是有違歷史順序的。不過 Chebyshev 不等式非常簡單,而且很容易推廣到其他的機率分布,正足以說明大數法則的基本所在。
二項分布 b(x;n,p) 的 p 是個非常重要,但不容易理解的概念。譬如我們說一個「公正」的骰子其出現 1 的機率為 ,那是假定投擲「公正」的骰子時,1、2、3、4、5、6 出現的機會都一樣;反過來說,出現的機會一樣多,我們才說骰子是公正的。所以「公正」的骰子是理想的、數學式的產物,因為只有等待多次的投擲,才能確定某個骰子出現各數的機會是否都一樣。
又譬如說,某藥的治癒率是什麼呢?我們下能試完所有的人以決定 p 值,我們只能假定有個 p 值,使得藥效的數據遵行二項分布 b(x;n,p)。所以這個 p 值是抽象的、未知確值的假定值。
Bernoulli 的大數法則首先把這種基於定義、理想中的的數學產物 p 和實際的、實驗的結果 相連起來;雖然大數法則並不保證長期實驗的比值 一定會愈來愈靠近原先假定的機率 p,但至少保證這個比值靠近 p 值的機率,會隨著實驗次數增加而靠近 1。也就因為有此保證,我們常常以長期實驗所得的比值代替理想中的 p 值。我們說某藥的治癒率為 0.6,其所代表的意義正是如此。
二項分布的起源與賭博有密切的關係。當然二項分布的應用自不限於賭博,藥效的檢定、產品好壞的檢定等等莫不涉及。此外二項分布還可以導出其他的機率分布,著名的 Poisson 分布就是。這正是我們下次的話題。 |
http://episte.math.ntu.edu.tw/articles/sm/sm_16_06_1/
--
[垃圾桶] 裡沒有會話群組。 當您有超過 5718.752806 MB (還在增加中) 的免費儲存空間時,誰還需要刪除郵件?!
沒有留言:
張貼留言