瞭解微分(Differential)的概念之前,要先知道何為極限(Limit),但我們又可以反過來用微分來計算極限。本文以不太嚴謹的方式介紹極限計算常用的夾擠定理(Squeeze theorem)與羅必達法則(L'Hôpital's rule),閱讀本文妳需要有基本的微分能力。 文章難度:\(\spadesuit\) \(\spadesuit\) / 5
(五). 貝氏定理的能力(I) 違反直覺
我們都知道:對於一枚公正的硬幣來說,出現正面和反面的機率皆是50%,這代表說:當我們丟100次硬幣,出現正面的次數一定會是50次嗎?
既然我這樣問了,代表不會剛好50次。但直覺上來說,似乎丟100次這樣的硬幣,我們得到50次正面的機率應該相當的高。實際上,恰好出現50次正面的機率只有8%(雖然是最高的沒錯),出現40次正面的機率更低,大概是1%;不過要注意的是:出現正面次數在40次~60次之間的機率卻高達96%!
舉另一個例子:你看到一套防毒軟體,這個軟體聲稱會對你下載的所有檔案都掃描一次,病毒偵測準確度達99%。
這個「99%」令你眼前一亮,心想︰「這個軟體看來相當可靠,準確度99%呢!!!」於是你便把它買下,並成功把它安裝了。
安裝了這個軟件一段日子,有一天,這個軟件突然響起警報,這個時候最正常的問題便是「我下載的檔案真的帶有病毒嗎?」又或者說,這個軟體誤鳴的機率有多高?
你認為誤鳴率就是 100% – 99% = 1% 嗎?
首先,我們要知道:故事裡防毒軟體廣告中的99%是指,當有病毒入侵時,有99%的機率會響起警報 ßà 而不是當響起警報時,有99%機會是真的有病毒,這兩個概念是完全不同的。
如果下載的檔案有0.005的機會是帶有病毒(為了簡化問題,我們假設平均每200個下載的檔案中會遇見一個遭受感染的檔案)。
我們可以畫個表格來量化地說明這個問題:
警報響起
|
警報沒有響起
|
TOTAL
|
|
有病毒
|
99%
× 0.005 = 0.00495
|
1%
× 0.005
|
0.005
|
沒有病毒
|
1%
× 0.995
|
99%
× 0.995
|
0.995
|
TOTAL
|
0.0149
|
0.9851
|
運用貝氏定理,我們可以得出以下的結論。
當警報響起時,我們很不幸地下載到了有病毒的檔案的機率是:
P( 有病毒 |警報響起) = 0.00495 / (0.00495+0.00995) = 33%
換句話說,當警報響起時,居然有67%的機率是錯誤的!即便這個軟體偵測出錯的機率是那麼的低。
經過這個例子之後,你可能產生這樣的理解:「99%不代表什麼!!!原來這個機率是騙人的!!!我們不要理會它!!!」。
但不要忘記這是因為故事中病毒出現的機率是很小的0.005,所以才會造成這樣的效果。如果病毒出現率是5%或10%,你會發現這個99%準確度的軟體的確是很準確的。
Reference:貝氏定理(下)–99%的準確度
留言
張貼留言