跳到主要內容

極限::計算

瞭解微分(Differential)的概念之前,要先知道何為極限(Limit),但我們又可以反過來用微分來計算極限。本文以不太嚴謹的方式介紹極限計算常用的夾擠定理(Squeeze theorem)與羅必達法則(L'Hôpital's rule),閱讀本文妳需要有基本的微分能力。 文章難度:\(\spadesuit\)  \(\spadesuit\) / 5

淺談條件機率(四):貝氏定理的能力(II)


(). 貝氏定理的能力(II 倒果為因
你一定不會好奇給老師很多出題空間的貝氏定理為什麼會出現,以及「貝氏」是哪個惱人的傢伙,但我們還是先來談談貝氏乃何許人也吧:
Thomas Bayes1702-1761),貝氏定理有記載的發明人;他是英國的數學家,也是長老會的牧師。有天,他在「擺弄」條件機率的公式時,赫然發現這些公式都是對稱的!
對稱是什麼意思?如果你呼過別人巴掌,或是被呼過巴掌,你就能真正瞭解這個詞的意涵。在這裡我們要呼叫一下牛頓,牛頓的第三運動定律:「作用力與反作用力」敘述的是:當你一巴掌打在別人的臉上,別人也同時用臉打了你的手掌(不過相對於手掌,臉皮還是比較薄,所以能選的話還是用手打人比較好)。
現在我們把手掌換成事件的成因,臉換成結果(事件)。蒐集關於原因的資訊,我們可以計算出某項結果發生的機率,我們稱這是:「正向機率direct probability)」。而當我們有了發生的機率值,也相當於反向地透露出臉紅是因為被手掌打到(而不是因為害羞)的可能性。
原因暴露了可能結果的資訊;結果中隱含可能原因的資訊,像這樣原因結果互相糾纏,就是條件機率的對稱,用數學的語言來描述就是:
… … … (1)
讓我們假設A是結果,B是原因。P( A |B)就是某項原因引發特定結果的機率;P( B |A)指的是特定結果由某個原因引發的機率。證明很簡單,重新整理條件機率的公式,我們有:
… … … (2)
AB代表某個特定結果和某個特定原因同時發生。而因為AB = BA,所以把(2)裡面所有的A換成BB換成A,就可以得到(1)的結論了。
18世紀,學者們已經能夠計算正向機率。比方說這個例子:假設袋子裡面有N個白球與M個黑球,摸到黑球的機率有多大?這是個很直覺的問題,我們還在娘胎裡時就會估計了!但是,要回答所謂「正向機率」的問題,有個很重要的先決條件:我們自己必須是全知的上帝,掌握這世界上所有的資訊(包括某個亂七八糟袋子裡白球和黑球的數量)。
然而在現實中,我們比較可能碰到的問題是:面對某個很大的袋子,裡面裝了很多很多(真的非常多)各種顏色的球;而因為球太多了,袋子也太大了,我們無法一個一個去統計每種色球的數量;只能夠在有限的時間及精力之下,摸出其中的幾個,看看結果;然後去想像(對於貝氏來說就是計算,對懶得算的人來說是經驗)袋子裡面哪種顏色的球佔大多數,哪種顏色的球卻很珍貴少見。
這種我們無法事先知道袋子裡黑白球比例的問题,就是所謂的「逆向機率inverse probability)」,也就是反過來從果(摸出來的白球和黑球個數)à向因(袋子裡黑白球之比例)來計算條件機率。
舉個簡單的例子:假設我們在病例研究中收集到一名肺癌病例(得到肺癌這個結果),那我們推估他是抽菸者(是因為抽菸)的機會是多少?這就是逆向機率,數學上這樣寫:
我們想要找到的是:造成結果的某項原因,稱作原因k。因此在這個結果的條件下,是原因k的機率寫成:P(原因k |結果)

其中,

貝氏定理(Bayes’s Theorem)就是源於貝氏為了解決一個逆向機率問題而寫的文章:「An Essay towards solving a Problem in the Doctrine of Chances」。在那個時後(18世紀),機率還不是「機率(probability)」,而被叫做「機遇論(doctrine of chances)」。這篇文章也是貝氏投稿的,而是在他死後兩年,由朋友Richard Price修改後投遞到「自然科學會報(The Philosophical Transactions of the Royal Society)」出版的。最可思議的是,Price相信:貝氏的這篇文章有助於佐證上帝的存在,並把他的想法寫在這篇文章的引言中。
到了近代,貝氏理論席捲科學界,其應用延伸至各领域;只要需要作出機率預測的地方,都可以見到貝氏定理的蹤影。
而機率充斥了所有角落。我們的世界本身就是不確定的,並且人類對事物的觀察往往侷限在結果的表面(比方說著名的尿布與啤酒:禮拜五賣場的尿布和啤酒總是賣的特別好,而且詭異的是,買啤酒的人通常也會買尿布!!這啥邏輯??)。
這時,我們就需要提供一個猜測。所謂的猜測,當然不能亂猜;具體地說,我們需要根據一步步不斷更新的資訊,算出各種猜测可能性的大小,漸漸得到最可能的猜测。
貝氏統計運用面非常之廣,也包括在二戰時,被用來偵測德國的U-Boat潛水艇(事實上,這也與德國納粹屠殺很多猶太籍或反對其亞利安種族主義的統計學家,迫使其逃亡有關,活該)。或是1968年時美國海軍用來尋找他們在五月失蹤的天蠍號。
最扯的是,2003年英國學者「從來不會贏(Unwin)」還用貝氏理論算出上帝存在的機率是67%!!!(書名是:The probability of GodUnwin是專職替美國政府預測核子災變風險的英國物理學家) 


留言

這個網誌中的熱門文章

淺談條件機率(三):貝氏定理的能力(I)

( 五 ) . 貝氏定理的能力( I ) 違反直覺 我們都知道:對於一枚公正的硬幣來說,出現正面和反面的機率皆是 50% ,這代表說:當我們丟 100 次硬幣,出現正面的次數一定會是 50 次嗎? 既然我這樣問了,代表不會剛好 50 次。但直覺上來說,似乎丟 100 次這樣的硬幣,我們得到 50 次正面的機率應該相當的高。實際上,恰好出現 50 次正面的機率只有 8% (雖然是最高的沒錯),出現 40 次正面的機率更低,大概是 1% ;不過要注意的是:出現正面次數在 40 次~ 60 次之間的機率卻高達 96% ! 舉另一個例子: 你看到一套防毒軟體,這個軟體聲稱會對你下載的所有檔案都掃描一次, 病毒偵測準確度達 99% 。 這個「 99% 」令你眼前一亮,心想︰「這個軟體看來相當可靠,準確度 99% 呢!!!」於是你便把它買下,並成功把它安裝了。 安裝了這個軟件一段日子,有一天,這個軟件突然響起警報,這個時候最正常的問題便是「我下載的檔案真的帶有病毒嗎?」又或者說,這個軟體誤鳴的機率有多高? 你認為誤鳴率就是 100% – 99% = 1% 嗎? 首先,我們要知道: 故事裡防毒軟體廣告中的 99% 是指,當有病毒入侵時,有 99% 的機率會響起警報 ß à 而不是當響起警報時,有 99% 機會是真的有病毒 ,這兩個概念是完全不同的。 如果下載的檔案有 0.005 的機會是帶有病毒(為了簡化問題,我們假設平均每 200 個下載的檔案中會遇見一個遭受感染的檔案)。 我們可以畫個表格來量化地說明這個問題: 警報響起 警報沒有響起 TOTAL 有病毒 99% × 0.005 = 0.00495 1% × 0.005 0.005 沒有病毒 1% × 0.995 99% × 0.995 0.995 TOTAL 0.0149 0.9851 運用貝氏定理,我們可以得出以下的結論。 當警報響起時,我們很不幸地下載到了有病毒的檔案的機率是: P ( 有病毒 | 警報響起 ) = 0.00495 / (0.00495+...

淺談條件機率(二)

( 三 ) . 保險像種精確的賭博 保險是這樣運作的:如果你本身很容易發生危險,你就需要支付很多的錢來說服別人保護你;換句話說:在保險公司看來,給你保障的成本(或說是風險)很高。另一方面,如果長期以來,你證明了自己需要保險公司支出的資源很少很少,保險公司保護你的成本很小,你所需要支付的保險費用當然就相應的低了。 以保險公司決定車險費率的模型為例: 現在考慮一個簡化的模型,在這個模型中,所有的人分為兩個群組,一個是 高風險群 ,平均每年發生一次意外;另一個是 低風險群 ,平均每年發生少於一次意外。如果你是個駕駛新手,你應該是屬於哪個風險群呢? 由於保險公司並沒有你的資訊,他們有可能根據一般新手的經驗值,認定你有三分之一的機會屬於高風險群、三分之二的機會屬於低風險群。這種情形下,你的保費就等於三分之一高風險群保費,加上三分之二低風險群保費。 經過一年觀察,保險公司就可以根據這個新數據來重新評估,修正三分之一與三分之二的比例,重新計算保費。隨後幾年,也可以依同樣的方式定期重新評估,看看收取多少才是恰當的保費金額。 Reference : 【精準預測】讀後感 3 ( 四 ) . 真正的賭博 – 21 點的故事 電影決勝 21 點,英文片名就叫作 21 ,改編自小說 “ Bringing down the house ” ( bring down , 有打敗的意思; house ,可以指稱為賭場)。 內容敘述一個 MIT (麻省理工學院)的高材生,獲得了哈佛醫學院的入學資格,但無法支付龐大學費。為了贏取獎學金,這位高材生必須有特別的經歷來讓口試老師驚艷。 有天,這位高材生被教授邀請,加入他領導的神秘的 21 點社團學習算牌。藉由算牌,這個社團贏遍了全美的賭城,而年青人卻漸漸地迷失在金錢世界之中 … 。 Bringing down the house 改編自現實事件,真實世界的主角還是位華人,是一位聰明的馬先生(父親是化工教授)。 在這部電影,為何主角會被教授選上,進入了秘密的 21 點社團呢?原因是,他有來上課!喔,這是必要的!沒有啦,真正的關鍵是教授在上課時,問了一個問題,只有他答對了。 這個問題其實就是有名的 Monty Hall Problem ( Monty Hall 是電視節目主持人的名字):假設有三...