跳到主要內容

極限::計算

瞭解微分(Differential)的概念之前,要先知道何為極限(Limit),但我們又可以反過來用微分來計算極限。本文以不太嚴謹的方式介紹極限計算常用的夾擠定理(Squeeze theorem)與羅必達法則(L'Hôpital's rule),閱讀本文妳需要有基本的微分能力。 文章難度:\(\spadesuit\)  \(\spadesuit\) / 5

淺談條件機率(五):貝氏定理的能力(III)


(). 貝氏定理的能力(III 趨近真實
呼應(二)的開頭,Nate Silver寫在他的書「精準預測」裡的話:這個定理(Bayes’s Theorem)卻要你接受,你對這個世界的主觀感知就是在趨近真理。至於趨近的方式,我們舉的例子發生在2011911日。
那天早上起床的時候,我們多數人幾乎都不會指派任何機率給像是:恐怖分子用飛機撞進曼哈頓的大樓這樣的事件。但是當飛機撞上曼哈頓下城區的世界貿易中心時,一切就改變了。第一架飛機撞擊的剎那間,遭受恐怖攻擊的機率從接近零急速升高;當第二棟大樓一被撞上,遭受攻擊這件事已經無庸置疑了。
現在我們試著用貝氏定理複製這個結果:
首先,我們需要事前機率來作為估計的初始值。
九一一事件之前的兩萬五千天之中,曼哈頓上空只出現過兩次這樣的意外:一次是1945年,一架美軍B-25轟炸機因天氣不佳撞入帝國大廈79樓;另一次就是隔年,華爾街四十號的川普大樓在濃霧中被美國海岸防衛隊所屬的飛機撞上。
因此,在特定的任何一天,這種意外發生的機率就是一萬兩千五百分之一,或是0.008%。其中可能有各種原因,最常見的是天氣因素,屬於恐怖攻擊的當然更低。現在,我們假定:在第一架飛機撞上之前,曼哈頓的高樓遭受恐怖攻擊的可能性大約是兩萬分之一,或是0.005%
假如我們把恐怖攻擊(Terrorist Attack)的事件叫做 A,飛機撞上曼哈頓區高樓(Airplane Crash)的事件叫做 C
… … … … 第一個時間點 … … … …
A1.    事前機率(或稱作先驗機率prior probability
恐怖份子會用飛機撞上曼哈頓的摩天大樓,其可能性初始估計:
P() = 0.005%
A2.    新事件發生:第一架飛機撞上世貿中心
                            i.    如果恐怖份子攻擊曼哈頓的摩天大樓,飛機撞上的機率:
P(C|) = 100%
                          ii.    恐怖分子沒有攻擊曼哈頓的摩天大樓,飛機因意外撞上的機率:
P(C|A’ ) = 0.008%
A3.    事後機率(或稱作後驗機率 posterior possibility
已知第一架飛機撞上世貿中心,對恐怖攻擊修正後的機率估計:
然而,貝氏定理背後的概念不是要我們只更新一次機率的估計就好。而是說:隨著新資訊的傳入(新的證據出現),我們就應該不斷地這樣做。因此,當第二架飛機撞上時,我們接著導入新的事前機率
… … … … 第二個時間點 … … … …
B1.     事前機率:
已知第一架飛機撞上世貿中心,對恐怖攻擊修正後的初始機率估計:
P() = 38%
B2.     新事件發生:第二架飛機撞上世貿中心
                            i.                如果恐怖份子攻擊曼哈頓的摩天大樓,飛機撞上的機率:
P(C|) = 100%
                          ii.                恐怖份子沒有攻擊曼哈頓的摩天大樓,飛機撞上的機率:
P(C|A’ ) = 0.008%
B3.     事後機率:
已知第二架飛機撞上世貿中心,對恐怖攻擊修正後的機率估計:
在修正之後,我們幾乎可以完全確定,911事件源於恐怖攻擊。而隨著事態一步步演進,加入的資訊越來越多,貝氏定理可以讓我們從一無所知迅速逼近事實。
… … … … 
一眼就能看穿他人職業是福爾摩斯最神奇的能力。福爾摩斯和華生第一次遇見是在「血字的研究」裡,見面後福爾摩斯就用肯定的語氣對華生說:「你好,你去過阿富和。」... 當場嚇了華生一跳!!
福爾摩斯曾經寫到:一個邏輯學家不需要親眼見到或者聽說過大西洋或是尼加拉瓜瀑布,他能從一滴水推測出他們存在的可能。整個生活就是一個巨大的鏈條,只要見到其中一環,整個鏈條的情況便可以推想出來了。
因此現在,我們試著練習從端倪窺探出某個結論。比方說一個有點邪惡的問題:在逛街時,看到一位身形佝僂,步履蹣跚的六十五歲老人,請問他得到癌症的機率有多少?
假定有得到癌症(Cancer)用C表示。
在對要推論的對像還一無所知時,我們只有一個先驗(事前)的結論:任何一個人得到癌症的機率P() = 1%,這是我們在還沒加入其他額外資訊前所擁有的結論。
因為身形佝僂,步履蹣跚不好量化,我們在這裡只討論新加入的資訊:65歲對於我們推論的影響。
假如我們把65歲(Age 65)用65表示,並且認為癌症和年紀是有關聯的。
根據一個地區人口分布的統計資料,假設我們在路上遇見65歲老人的機率P(65) = 0.2%。而公共衛生統計告訴我們:一位得到癌症的病人是65歲的機率P(65A |) = 0.5%
綜合以上敘述,當多加了年紀的新資訊後,我們要計算的機率就變成:
P(C |新資訊) = P(C |65) = P() P(65A |) / P(65) = 2.5%
日常生活中,我們往往不自覺地不斷進行著這樣的推論過程:
比方說家裡門鈴響了,門口會出現男生或女生的機率都是二分之一。
假如你媽讓你拿錢去門口接外送的披薩,那門口出現男生的機率就大很多了,因為在我們過去的經驗裡,送披薩的大部分都是男生。







留言

這個網誌中的熱門文章

淺談條件機率(三):貝氏定理的能力(I)

( 五 ) . 貝氏定理的能力( I ) 違反直覺 我們都知道:對於一枚公正的硬幣來說,出現正面和反面的機率皆是 50% ,這代表說:當我們丟 100 次硬幣,出現正面的次數一定會是 50 次嗎? 既然我這樣問了,代表不會剛好 50 次。但直覺上來說,似乎丟 100 次這樣的硬幣,我們得到 50 次正面的機率應該相當的高。實際上,恰好出現 50 次正面的機率只有 8% (雖然是最高的沒錯),出現 40 次正面的機率更低,大概是 1% ;不過要注意的是:出現正面次數在 40 次~ 60 次之間的機率卻高達 96% ! 舉另一個例子: 你看到一套防毒軟體,這個軟體聲稱會對你下載的所有檔案都掃描一次, 病毒偵測準確度達 99% 。 這個「 99% 」令你眼前一亮,心想︰「這個軟體看來相當可靠,準確度 99% 呢!!!」於是你便把它買下,並成功把它安裝了。 安裝了這個軟件一段日子,有一天,這個軟件突然響起警報,這個時候最正常的問題便是「我下載的檔案真的帶有病毒嗎?」又或者說,這個軟體誤鳴的機率有多高? 你認為誤鳴率就是 100% – 99% = 1% 嗎? 首先,我們要知道: 故事裡防毒軟體廣告中的 99% 是指,當有病毒入侵時,有 99% 的機率會響起警報 ß à 而不是當響起警報時,有 99% 機會是真的有病毒 ,這兩個概念是完全不同的。 如果下載的檔案有 0.005 的機會是帶有病毒(為了簡化問題,我們假設平均每 200 個下載的檔案中會遇見一個遭受感染的檔案)。 我們可以畫個表格來量化地說明這個問題: 警報響起 警報沒有響起 TOTAL 有病毒 99% × 0.005 = 0.00495 1% × 0.005 0.005 沒有病毒 1% × 0.995 99% × 0.995 0.995 TOTAL 0.0149 0.9851 運用貝氏定理,我們可以得出以下的結論。 當警報響起時,我們很不幸地下載到了有病毒的檔案的機率是: P ( 有病毒 | 警報響起 ) = 0.00495 / (0.00495+...

淺談條件機率(四):貝氏定理的能力(II)

( 六 ) . 貝氏定理的能力( II ) 倒果為因 你一定不會好奇給老師很多出題空間的貝氏定理為什麼會出現,以及「貝氏」是哪個惱人的傢伙,但我們還是先來談談貝氏乃何許人也吧: Thomas Bayes ( 1702-1761 ),貝氏定理有記載的發明人;他是英國的數學家,也是長老會的牧師。有天,他在「擺弄」條件機率的公式時,赫然發現這些公式都是 對稱 的! 對稱是什麼意思?如果你呼過別人巴掌,或是被呼過巴掌,你就能真正瞭解這個詞的意涵。在這裡我們要呼叫一下牛頓,牛頓的第三運動定律:「作用力與反作用力」敘述的是:當你一巴掌打在別人的臉上,別人也同時用臉打了你的手掌(不過相對於手掌,臉皮還是比較薄,所以能選的話還是用手打人比較好)。 現在我們把手掌換成事件的成因,臉換成結果(事件)。蒐集關於原因的資訊,我們可以計算出某項結果發生的機率,我們稱這是:「 正向機率 ( direct probability )」。而當我們有了發生的機率值,也相當於反向地透露出臉紅是因為被手掌打到(而不是因為害羞)的可能性。 原因暴露了可能結果的資訊;結果中隱含可能原因的資訊,像這樣原因結果互相糾纏,就是條件機率的對稱,用數學的語言來描述就是: … … … (1) 讓我們假設 A 是結果, B 是原因。 P ( A | B ) 就是某項原因引發特定結果的機率; P ( B | A ) 指的是特定結果由某個原因引發的機率。證明很簡單,重新整理條件機率的公式,我們有: … … … (2) A ∩ B 代表某個特定結果和某個特定原因同時發生。而因為 A ∩ B = B ∩ A ,所以把 (2) 裡面所有的 A 換成 B , B 換成 A ,就可以得到 (1) 的結論了。 在 18 世紀,學者們已經能夠計算正向機率。比方說這個例子:假設袋子裡面有 N 個白球與 M 個黑球,摸到黑球的機率有多大?這是個很直覺的問題,我們還在娘胎裡時就會估計了!但是,要回答所謂「正向機率」的問題,有個很重要的先決條件:我們自己必須是 全知 的上帝,掌握這世界上所有的資訊(包括某個亂七八糟袋子裡白球和黑球的數量)。 然而在現實中,我們比較可能碰到的問題是:面對某個很大的袋子,裡面裝了很多很多(真的非常多)各種顏色的球;而因為球太多了,袋子也太大了,我們無法...

淺談條件機率(二)

( 三 ) . 保險像種精確的賭博 保險是這樣運作的:如果你本身很容易發生危險,你就需要支付很多的錢來說服別人保護你;換句話說:在保險公司看來,給你保障的成本(或說是風險)很高。另一方面,如果長期以來,你證明了自己需要保險公司支出的資源很少很少,保險公司保護你的成本很小,你所需要支付的保險費用當然就相應的低了。 以保險公司決定車險費率的模型為例: 現在考慮一個簡化的模型,在這個模型中,所有的人分為兩個群組,一個是 高風險群 ,平均每年發生一次意外;另一個是 低風險群 ,平均每年發生少於一次意外。如果你是個駕駛新手,你應該是屬於哪個風險群呢? 由於保險公司並沒有你的資訊,他們有可能根據一般新手的經驗值,認定你有三分之一的機會屬於高風險群、三分之二的機會屬於低風險群。這種情形下,你的保費就等於三分之一高風險群保費,加上三分之二低風險群保費。 經過一年觀察,保險公司就可以根據這個新數據來重新評估,修正三分之一與三分之二的比例,重新計算保費。隨後幾年,也可以依同樣的方式定期重新評估,看看收取多少才是恰當的保費金額。 Reference : 【精準預測】讀後感 3 ( 四 ) . 真正的賭博 – 21 點的故事 電影決勝 21 點,英文片名就叫作 21 ,改編自小說 “ Bringing down the house ” ( bring down , 有打敗的意思; house ,可以指稱為賭場)。 內容敘述一個 MIT (麻省理工學院)的高材生,獲得了哈佛醫學院的入學資格,但無法支付龐大學費。為了贏取獎學金,這位高材生必須有特別的經歷來讓口試老師驚艷。 有天,這位高材生被教授邀請,加入他領導的神秘的 21 點社團學習算牌。藉由算牌,這個社團贏遍了全美的賭城,而年青人卻漸漸地迷失在金錢世界之中 … 。 Bringing down the house 改編自現實事件,真實世界的主角還是位華人,是一位聰明的馬先生(父親是化工教授)。 在這部電影,為何主角會被教授選上,進入了秘密的 21 點社團呢?原因是,他有來上課!喔,這是必要的!沒有啦,真正的關鍵是教授在上課時,問了一個問題,只有他答對了。 這個問題其實就是有名的 Monty Hall Problem ( Monty Hall 是電視節目主持人的名字):假設有三...