是湊巧還是機率?:巧合背後的數學與迷思

是湊巧還是機率?:巧合背後的數學與迷思
(圖片來源:pixabay)

安東尼.霍普金斯的故事

霍普金斯的故事只是同步性的例子之一。只要想一下:《鐵幕情天恨》可能在多少個地方取過景;在霍普金斯看到那本書之前,有多少人可能把那本書拿走;為何霍普金斯是因認出書名而找到那本書,此外,那還是特別的一本:作者喬治.菲佛的書。然後想想霍普金斯坐在那本書旁邊卻沒有留意到它的機率:相似版本故事——或許是更好的版本——的發生經過可能是一樣的,但霍普金斯永遠不會知道他曾看到那本書,我們也就不會聽到這個故事。這故事之所以這麼受矚目,原因之一是因為涉及特定的人,而且那還是一位公眾人物。怎麼看都令人嘆為觀止,主要是因為這件事發生在我們知道的人身上。霍普金斯的故事真的是這麼特別的巧合事件嗎?我們會覺得它是,但這感覺從何而來呢?這故事或許獨特,但我們有什麼資訊可以證明嗎?並沒有數據能讓我們對於抽象的可能性有所印象。

沒錯,故事的眾多發生原因可能是同步的,但若要釐清同步性與數學合理性之間的差異,我們得看一些數據:被遺忘在車站的書籍數量、倫敦市中心的書店數量以及每天進城來找特定書籍的人數。這個故事發生在一九七六年,時間點很重要,因為當時沒有網路,也沒有購書網站亞馬遜,為了找書而漫步閒逛是尋常的事。那時候,要省下大把時間親自去書店找書的最簡單方式,就是打電話到每家書店去問。

要分析霍普金斯的故事,我們得把倫敦城的尺寸考量進去。在寫作本書的這個網際網路時代,倫敦有一百一十一家小型獨立書店。為求生存,每家書店平均每天得吸引至少十位讀者購書。保守估計,這些書店加起來每天至少銷售一千本書。更接近實際狀況的估計值為大約三千本書。有些人只是隨意瀏覽,也有些人來尋找特定的、本來就想買的書,還有些人只是進來躲雨或是打發閒暇時間。讓我們假設,每天只有一百個人來買書名為X的書。

這一百個人之中,不太可能會有人在地下鐵車站的長椅上找到他們正在找尋的書,但讓我們藉此機會來思考,意外地把書留在公共場所的人有多少,而又有多少人在火車上及火車站內看完書後,會在他們搭的火車離開之前把書丟棄。

如果書籍X在首刷上市時還算有些人氣,至少第一個月可以賣出一千本。這些售出的書去哪裡了?有些書還沒有被讀過就直接放進某個人家裡的書架上了,有些會被賣到二手書店,還有些會被留在公共場所。

我猜測《鐵幕情天恨》賣出超過一萬冊。這使我們能用大數法則說明,霍普金斯事件的發生機率介於「微小」與「有合理發生機率」之間,至少可能發生在某個人身上。這會如何呢?假設在倫敦,被遺留在公共場所的書有十本,有些在公園的長椅上,有些在咖啡廳、等候室、飯店大廳等等——這是非常合理的推估。讓我們假設「到倫敦找書,找的書恰好為這幾本之一」的人數為N,這N個人比其他人更可能留意到被遺留在公共場所椅子上的書。那麼,問題就變成:這個人看到他/她正好在找的書的機率p為多少?我們如何求得p?不幸的是,這次不像擲骰子或者抽撲克牌,輕易地就能算出p的值。我們幾乎不可能得知確切的p值。

不過,還有一個辦法。我們可以建立一個電腦模型,模擬這些人與他們要找的書之間的距離。這不是件簡單的任務,因為把真實個體的思維與他們的經驗連結在一起的隱藏變數甚多。但這樣的模型能給我們一個與數學機率p相近的數字——一個隱藏的、到目前為止還不在我們理解範圍內的數字。更簡單的方法是在心裡創造出一幅畫面,依靠我們的直覺去猜想,人們在城市街道上漫遊,找尋某個東西時的行為表現是如何。這的確會因為主觀感受而有誤差的風險,但也確實能讓我們把這個問題想得更深入一些。

讓我們抽離開這個安東尼.霍普金斯與喬治.菲佛的真實故事,試想任何一個來到倫敦市中心找尋一本書的人,在公共場所的某處發現這本書的機率有多大。這個問題簡單多了。如果最後發現這個可能性非常地小,那麼我們就知道這個發生在霍普金斯與菲佛身上的真實故事發生的可能性相當低。我們用數學家常做的方式來做:為我們想找的數字設上界(upper bound)。在這個例子裡,機率的邊界為「尋找書的人會成功找到他/她正在找的書」。我們還會做其他數學家也常做的事:簡化、釐清問題,並認知到稍後要處理的真正問題可能要複雜得多。

倫敦是座全城遍布著六萬條街道、超過三千座小公園和花園廣場、八座大型皇家公園、一百一十一家書店和兩百七十六個地鐵站的大城市。然而,如果回顧一下霍普金斯的故事,我們可以限縮範圍,讓數字更好處理些。霍普金斯說自己在海德公園廣場附近的地鐵站找到這本書。菲佛證實自己贈書的友人是在接近海德公園廣場的某處遺失這本書。最接近海德公園廣場的地鐵站是大理石拱門站(Marble Arch),從這個站沿著威格莫爾街(Wigmore Street)直直走半個小時,就能到大英博物館,而在霍普金斯事件發生當時,大英博物館與倫敦最大家的書店相鄰。因此,若把搜尋與漫步的範圍設定為以大英博物館為圓心、半徑兩英里的圓,是很合理的。在這區域範圍內的街道有將近一千條,但其中的許多條街道不僅非常短,也幾乎不見書店,而偏離主要街道去找書的人數也不多。此外,遭遺棄的書較可能出現在人潮更多或更休閒的場所,像是地鐵站或是公園。

這個故事的核心不在於安東尼.霍普金斯,也無關《鐵幕情天恨》,而是有人在特定的日子於極為不可能出現的地方發現這本他正在找的書。

那麼,讓我們假想有N個人進出書店找尋著這本他們不抱太大期待能找到的書,並把他們分布的範圍定在以大英博物館為圓心,半徑兩英里的範圍內。此外,再假設於這個範圍內,有十本書遭棄置於公共場所。這N個人裡面,會有任何人碰巧在這十本遭棄置的書之中找到他們正好在找的那本書嗎?如果N的數值很小的話,或許無法。這是一個非常粗略的思想實驗模型,但不如你所想的那麼粗略,因為在倫敦的找書人所走的路徑並不是隨機決定的,而且這些人也比一般人更可能在不尋常處發現遭棄置的書。現在,假設N為一個還算大的數字,我們預期在一天的漫步結束之前,k ≦ 10 本遭棄置的書會被發現,我們因此應該可以得出概略的成功率為k ⁄ N。換句話說,在N次嘗試裡,會成功k次。弱大數法則告訴我們,如果N的值大,這個推估出的成功率就會相當接近p。那麼,問題就會變成:N要多大才夠?當然,N = 10,000時,k有很大的機會大於零。儘管大倫敦的人口數超過八百六十萬人,也不會有人認為會有哪一天出現一萬個為了找書在倫敦街道上隨意亂逛的人。然而,如果我們把時間限制拉長為一
年,假設每天都有一百個人在找書,其中的許多人重複找書,那麼就能得到N
=36,500。兩年的話,N = 73,000。如果N的限制更為寬鬆些,73,000 個人中,應該很可能會有超過一半的機率,某個人會找到他/她正在找的書。理當會令人納悶的是,為何設定兩年?怎麼不是十年?而又為何只限倫敦?我們也可以把範圍設定在共有22,500家書店的美國,或是全世界。這美妙的大數法則教導我們,不要低估世界的規模。

這是一個創新的模型,但無法道盡整個完整故事。隱藏變數無所不在。甚至在找特定某本書的人可能就在他們要找的書附近,卻沒有看見它。此外,我們可以想見,相對「N個人之中的任一人與他們在找的那本書配對」這件事而言,N非常巨大,遠超過73,000。所以,的確,這事件發生的可能性肯定遠小於我們所能想像的k / N值。

然而弱大數法則告訴我們,如果N的值夠大,p 與k / N 之間的差異就會如我們所想要的那般小。我們可以直觀地猜想,如果N=73,000(等同於兩年的尋書人數量),那麼k起碼會是1,接著大膽地假設N大到足以假設P〔|k/N–p| < 0.001〕> 0.5。這告訴我們,有大於一半的機率,某個人找到他/她正好在找的書的可能性接近0.000014,勝率為71,427 比1,這非常接近玩撲克牌時拿到同花順的勝率!

這一切說明了真實機率的上界並非低得誇張。這個真實故事發生在某個特定人士身上的機率又更加地低。因此,儘管我們無法用確切的數字說明原本故事的發生機率有多麼稀罕,但我們也掌握了些概念,知道像這樣的故事並非那麼地罕見。重點不在於霍普金斯找到一本《鐵幕情天恨》的書,而在於那恰好是菲佛的書!

我們時常會被世界的尺寸給欺騙。它既比我們想像的大;也比我們想像的小。一百年前,人們的生活與居住的城鎮及村莊很緊密,我那住在波蘭的叔伯祖父、叔伯祖母肯定不會走得離他們的猶太小鎮(shtetl)太遠。而今,因為國際交流便利,就算巧遇朋友或親戚也不至於太過驚訝。從紐約飛到香港只須十五小時,使得我們難以真正理解世界有多大。如果問,在你讀這一段文字的時間裡,世界上有多少人自殺,你很可能會答「零個人」。但為了讓你對於世界的真實大小有點概念,我告訴你,根據世界衛生組織的估計,平均每四十秒,世界上的某個地
方就有人自殺而亡。也就是說,平均每天都有二千一百六十個人自殺!自殺率因國而異,在視自殺為違法行為的印度,自殺率幾乎是全球自殺率的兩倍。

從定義上來看,巧合是沒有顯然成因的事件。「顯然」是對誰而言呢?世界的運作原理通常就是因與果的關係。之所以說通常,是因為在物理、心理學與宗教的範疇,存在非因果(acausal)現象。但「顯然」一詞告訴我們,在我們學到巧合外在現象有其成因的那刻,其狀態就削減為單純的時間-空間事件。這必然意指,巧合與受其影響的人們之間相關聯,也含有「存在不明顯的成因,等待被發掘」之意。如果完全不存在任何成因,那麼事件的發生與否就只會是機率問題。
在一副正常、洗乾淨的牌中抽到黑桃A的勝率為51比1,意思是有五十一種不會抽到那張牌的機會,以及有一種機會可能會抽到該牌。抽到任意花色A的勝率為12比1,這只是說,如果抽十三張牌,很可能其中會有一張是A。至於實際狀況究竟為何,那就是機會問題了。

假設你抽到了黑桃A,把它放回牌堆中,然後再洗一次牌,那麼你再抽到同一張牌的勝率依然是51比1,雖說連續兩次成功地抽到這一張牌的勝率為2703 比1。這說的是,再抽中一次黑桃A的話,得發生兩個事件,而個別事件的勝率為51比1,所以連番抽到這張A的機率為(1 / 52)(1 / 52) = 1 ⁄ 2704,因此抽到這張牌兩次的勝率為2703 比1。這可能會令人覺得有些矛盾,因為這麼說來,第二次抽中這張牌的挑戰性,不會比第一次來得更大。

儘管機率很低,但第二次抽中黑桃A的可能性依然存在。由經驗來看,我們知道這發生的頻率其實很高。你可以押注自己會連續抽中兩次黑桃A,但別把賭金都梭進去了。聰明的做法是,在「會再次抽中黑桃A」這事件上,賭一塊錢,期望獲得的報酬將不會低於2,703 比1。

這麼一來,如果你還有幾千元可供下注,可以玩幾千次,然後結果⋯⋯哈哈哈⋯⋯很可能至少會贏一次。

當然,如果要連續三次或四次抽中黑桃A,就更加困難了。連續抽中四次的機率是(1 / 52)(1 / 52)(1 / 52)(1 / 52) = 1 / 7,311,616,勝率為7,311,615 比1。機率相當低,但並非不可能。這一回,連一塊錢都別押了。當然,連續抽中同一張A五十次、一百次甚至更多次的機率也還是存在。

如果接連四次都抽中黑桃A,你可能會懷疑這牌堆是否暗藏機關。但機會這件事情很有趣,機會法則中,並沒有說「接連抽中四次黑桃A」的事件不會發生,雖然這發生的機率不會比﹁丟到空中的音符,在落地後恰好組成一首貝多芬奏鳴曲﹂的機率還來得高。你就不會想要賭自己把音符丟到空中,然後恰恰就能夠寫出如貝多芬般的音樂吧。不過如果把音符丟到空中的頻率夠高,就這樣產生出新的奏鳴曲調一類的情況,當然可能發生。

現在,假設你與另外十名玩家一起玩牌。抽中最大同花順——假設為梅花的A、K、Q、J、10好了——的勝率為2,598,959 比1。為什麼?因為抽第一張牌有52種可能性,第二張有51種,第三張有50種,第四張49種,而第五張有48種。所以,抽五張牌的話,共會出現52×51×50×49×48 種可能。不過這個數字太大了。假設這五張牌是以特定的順序排列的,但指的是什麼順序呢?這並不重要。可以是先抽到A,也可以是第二次、第三次、第四次或第五次抽到A。固定A被抽中的次序,K就只剩下四種次序的可能性,Q則剩下三種,J剩兩種,而10只剩一種。所以,計算這五張牌有多少種被抽中的方法,就得把(52×51×50×49×48)除以(5×4×3×2×1),得到2,598,960。這意指有2,598,959 次機會不會抽到梅花的A、K、Q、J、10,一次機會會抽中。但是抽中其他價值更低五張牌的勝率也相當。譬如:黑桃3、紅心6、梅花8、方塊J和黑桃Q——應該任何人都會同意拿到這五張牌沒什麼用處。這一手用處不大的牌,其勝率也是2598959 比1。換個方式思考吧:「你」拿到梅花的A、K、Q、J、10的勝率,比任何一個人剛好拿到同樣一手牌的勝率小得多。

我們都知道世界很大,但卻難以想像它真正的浩瀚程度。我的女兒凱瑟琳還只有八歲時,我時不時會在遊戲之中灌輸她對於地球廣闊程度的印象,以及對於數量規模的概念。有一次,她打了一個噴嚏,我順勢要她猜,世界上有多少人碰巧也剛打完一個噴嚏。她猜的數字是兩百,雖然低了些,但是就一個八歲孩子而言,還不算猜得太差。我的猜測是數萬人,這令她很驚訝,但考量到世界人口總數已經七十多億了,或許這還比實際數字少上好幾位數。今天,我們要問一個關於讀條碼——那些你在超市結帳時會不斷聽到的逼逼聲——的問題,這困難得多。大略猜想一下,在你讀這個句子的同時,全世界一共掃描了多少次條碼。我猜你一定大大地低估了這個數量。全世界每天掃描條碼的次數超過五十億次。也就是說,在你閱讀這個句子之際,便出現了十萬次購買行為,而線上購物還不包含在內。現在,對於世界的規模,我們應該更能掌握個大概了。儘管每秒條碼掃描次數的數量還算是很小的,還有更微觀的層級可以與之相較。

在這個原子與分子的真實世界裡,沒有什麼是百分之百絕對的。因此,我們必須找出判斷的準則,與其說是找出篤定無誤的事實,倒不如說是找出很可能為真的事實。想當然耳,我們會毫無疑問地接受地球轉動及太陽明天會升起的觀念,但是我們之所以接受世界上大多預期會發生的現象,都是來自人類集體的經驗談。理論數學中的一對理想骰子,可以用來預測真實的人擲真實骰子的行為。骰子是不完美的白色圓邊立方體,其各個面上內凹的黑點無疑地並不妨礙它的旋轉對稱。製造商必須考量到,挖掉六個內凹黑點的材料,可能導致這個立方體向一點的那面傾斜。賭場用的骰子做工精細,誤差範圍極低,遠比桌遊用的一般骰子的期望平均值更接近3.5。

以上內容由臉譜出版授權刊登,未經允許請勿轉載。
◎更多精彩內容,請見:《是湊巧還是機率?:巧合背後的數學與迷思