跳到主要內容

極限::計算

瞭解微分(Differential)的概念之前,要先知道何為極限(Limit),但我們又可以反過來用微分來計算極限。本文以不太嚴謹的方式介紹極限計算常用的夾擠定理(Squeeze theorem)與羅必達法則(L'Hôpital's rule),閱讀本文妳需要有基本的微分能力。 文章難度:\(\spadesuit\)  \(\spadesuit\) / 5

淺談條件機率(三):貝氏定理的能力(I)


(). 貝氏定理的能力(I 違反直覺
我們都知道:對於一枚公正的硬幣來說,出現正面和反面的機率皆是50%,這代表說:當我們丟100次硬幣,出現正面的次數一定會是50次嗎?
既然我這樣問了,代表不會剛好50次。但直覺上來說,似乎丟100次這樣的硬幣,我們得到50次正面的機率應該相當的高。實際上,恰好出現50次正面的機率只有8%(雖然是最高的沒錯),出現40次正面的機率更低,大概是1%;不過要注意的是:出現正面次數在40次~60次之間的機率卻高達96%
舉另一個例子:你看到一套防毒軟體,這個軟體聲稱會對你下載的所有檔案都掃描一次,病毒偵測準確度達99%
這個「99%」令你眼前一亮,心想︰「這個軟體看來相當可靠,準確度99%呢!!!」於是你便把它買下,並成功把它安裝了。
安裝了這個軟件一段日子,有一天,這個軟件突然響起警報,這個時候最正常的問題便是「我下載的檔案真的帶有病毒嗎?」又或者說,這個軟體誤鳴的機率有多高?
你認為誤鳴率就是 100% – 99% = 1% 嗎?
首先,我們要知道:故事裡防毒軟體廣告中的99%是指,當有病毒入侵時,有99%的機率會響起警報 ßà 而不是當響起警報時,有99%機會是真的有病毒,這兩個概念是完全不同的。
如果下載的檔案有0.005的機會是帶有病毒(為了簡化問題,我們假設平均每200個下載的檔案中會遇見一個遭受感染的檔案)。
我們可以畫個表格來量化地說明這個問題:

警報響起
警報沒有響起
TOTAL
有病毒
99% × 0.005 = 0.00495
1% × 0.005
0.005
沒有病毒
1% × 0.995
99% × 0.995
0.995
TOTAL
0.0149
0.9851

運用貝氏定理,我們可以得出以下的結論。
當警報響起時,我們很不幸地下載到了有病毒的檔案的機率是:
P( 有病毒 |警報響起) = 0.00495 / (0.00495+0.00995) = 33%
換句話說,當警報響起時,居然67%的機率是錯誤的!即便這個軟體偵測出錯的機率是那麼的低。
經過這個例子之後,你可能產生這樣的理解:「99%不代表什麼!!!原來這個機率是騙人的!!!我們不要理會它!!!」。
但不要忘記這是因為故事中病毒出現的機率是很小的0.005,所以才會造成這樣的效果。如果病毒出現率是5%10%,你會發現這個99%準確度的軟體的確是很準確的。



留言

這個網誌中的熱門文章

淺談條件機率(四):貝氏定理的能力(II)

( 六 ) . 貝氏定理的能力( II ) 倒果為因 你一定不會好奇給老師很多出題空間的貝氏定理為什麼會出現,以及「貝氏」是哪個惱人的傢伙,但我們還是先來談談貝氏乃何許人也吧: Thomas Bayes ( 1702-1761 ),貝氏定理有記載的發明人;他是英國的數學家,也是長老會的牧師。有天,他在「擺弄」條件機率的公式時,赫然發現這些公式都是 對稱 的! 對稱是什麼意思?如果你呼過別人巴掌,或是被呼過巴掌,你就能真正瞭解這個詞的意涵。在這裡我們要呼叫一下牛頓,牛頓的第三運動定律:「作用力與反作用力」敘述的是:當你一巴掌打在別人的臉上,別人也同時用臉打了你的手掌(不過相對於手掌,臉皮還是比較薄,所以能選的話還是用手打人比較好)。 現在我們把手掌換成事件的成因,臉換成結果(事件)。蒐集關於原因的資訊,我們可以計算出某項結果發生的機率,我們稱這是:「 正向機率 ( direct probability )」。而當我們有了發生的機率值,也相當於反向地透露出臉紅是因為被手掌打到(而不是因為害羞)的可能性。 原因暴露了可能結果的資訊;結果中隱含可能原因的資訊,像這樣原因結果互相糾纏,就是條件機率的對稱,用數學的語言來描述就是: … … … (1) 讓我們假設 A 是結果, B 是原因。 P ( A | B ) 就是某項原因引發特定結果的機率; P ( B | A ) 指的是特定結果由某個原因引發的機率。證明很簡單,重新整理條件機率的公式,我們有: … … … (2) A ∩ B 代表某個特定結果和某個特定原因同時發生。而因為 A ∩ B = B ∩ A ,所以把 (2) 裡面所有的 A 換成 B , B 換成 A ,就可以得到 (1) 的結論了。 在 18 世紀,學者們已經能夠計算正向機率。比方說這個例子:假設袋子裡面有 N 個白球與 M 個黑球,摸到黑球的機率有多大?這是個很直覺的問題,我們還在娘胎裡時就會估計了!但是,要回答所謂「正向機率」的問題,有個很重要的先決條件:我們自己必須是 全知 的上帝,掌握這世界上所有的資訊(包括某個亂七八糟袋子裡白球和黑球的數量)。 然而在現實中,我們比較可能碰到的問題是:面對某個很大的袋子,裡面裝了很多很多(真的非常多)各種顏色的球;而因為球太多了,袋子也太大了,我們無法...

淺談條件機率(二)

( 三 ) . 保險像種精確的賭博 保險是這樣運作的:如果你本身很容易發生危險,你就需要支付很多的錢來說服別人保護你;換句話說:在保險公司看來,給你保障的成本(或說是風險)很高。另一方面,如果長期以來,你證明了自己需要保險公司支出的資源很少很少,保險公司保護你的成本很小,你所需要支付的保險費用當然就相應的低了。 以保險公司決定車險費率的模型為例: 現在考慮一個簡化的模型,在這個模型中,所有的人分為兩個群組,一個是 高風險群 ,平均每年發生一次意外;另一個是 低風險群 ,平均每年發生少於一次意外。如果你是個駕駛新手,你應該是屬於哪個風險群呢? 由於保險公司並沒有你的資訊,他們有可能根據一般新手的經驗值,認定你有三分之一的機會屬於高風險群、三分之二的機會屬於低風險群。這種情形下,你的保費就等於三分之一高風險群保費,加上三分之二低風險群保費。 經過一年觀察,保險公司就可以根據這個新數據來重新評估,修正三分之一與三分之二的比例,重新計算保費。隨後幾年,也可以依同樣的方式定期重新評估,看看收取多少才是恰當的保費金額。 Reference : 【精準預測】讀後感 3 ( 四 ) . 真正的賭博 – 21 點的故事 電影決勝 21 點,英文片名就叫作 21 ,改編自小說 “ Bringing down the house ” ( bring down , 有打敗的意思; house ,可以指稱為賭場)。 內容敘述一個 MIT (麻省理工學院)的高材生,獲得了哈佛醫學院的入學資格,但無法支付龐大學費。為了贏取獎學金,這位高材生必須有特別的經歷來讓口試老師驚艷。 有天,這位高材生被教授邀請,加入他領導的神秘的 21 點社團學習算牌。藉由算牌,這個社團贏遍了全美的賭城,而年青人卻漸漸地迷失在金錢世界之中 … 。 Bringing down the house 改編自現實事件,真實世界的主角還是位華人,是一位聰明的馬先生(父親是化工教授)。 在這部電影,為何主角會被教授選上,進入了秘密的 21 點社團呢?原因是,他有來上課!喔,這是必要的!沒有啦,真正的關鍵是教授在上課時,問了一個問題,只有他答對了。 這個問題其實就是有名的 Monty Hall Problem ( Monty Hall 是電視節目主持人的名字):假設有三...