福爾摩斯推理小說的金句,正是「貝氏統計學」與「邏輯哲學論」的最佳註解

福爾摩斯推理小說的金句,正是「貝氏統計學」與「邏輯哲學論」的最佳註解

我們想讓你知道的是

「我曾設想過七種不同的解釋,每一種都適用於到目前為止我們所知道的事實。但它們當中哪一種是正確的,只能在得到無疑正在等著我們的新消息後才能做出決定。」這兩句話,可以視為貝氏統計學的絕佳註解。福爾摩斯在聽過亨特小姐的敘述之後,經過深思,已經用他擅長的「回溯推論法」發展出七種可以推論出已知事實的解釋。

很多人從小就把福爾摩斯的故事讀到滾瓜爛熟了,我近年來用貝氏統計學與維根斯坦《邏輯哲學論》的觀點來重讀這些故事,別有一番意趣。這兩個閱讀角度,其實也適用於閱讀其它的偵探故事,包括美國1930年以來影響廣泛的冷硬派推理小說。如果說貝氏統計學是推理小說的方法論,那麼《邏輯哲學論》就是推理小說的形上學。本文把兩者綜合起來論述,探討推理小說的邏輯結構。

推理小說的方法論:貝式統計學

我之前發在個人部落格的文章〈回溯推論法、貝氏定理、及推理小說〉,就福爾摩斯使用的貝氏推理方法論已有詳細論述。除了該文所舉〈皮膚變白的軍人〉一案外,收在《冒險史》系列中的〈銅山毛櫸案〉更是絕佳的貝式推理辦案例子。(銅山毛櫸是一種樹木,英文Copper Beech,這種樹的葉子像擦亮的金屬。這個故事中犯罪現場的住宅外種了很多銅山毛櫸,因此以「銅山毛櫸」名之。)

這個故事的客戶亨特小姐得到了一個待遇奇高、雇主又有些不尋常要求的家庭教師工作。她受高薪吸引,但雇主要她剪短長髮、穿他女兒衣服等奇怪要求卻令她不安,因而來貝克街221B尋求諮商。福爾摩斯也覺得其中必有蹊蹺,答應她在遇到危險時去幫助她。

福爾摩斯在聽到亨特小姐的初步陳述之後,並未立即說出他心中的想法。他坐下來蹙眉深思。華生忍不住問他,他只是不耐煩地嚷道:「資料!資料!資料!」(Data! Data! Data!)。他又說:「沒有黏土,我做不出磚頭!」

不久之後,亨特小姐果然來電要求福爾摩斯前往協助。在搭火車前往「銅山毛櫸」所在的溫徹斯特途中,福爾摩斯終於向華生透露了他的想法:

我曾設想過七種不同的解釋,每一種都適用於到目前為止我們所知道的事實。但它們當中哪一種是正確的,只能在得到無疑正在等著我們的新消息後才能做出決定。

這兩句話,可以視為貝氏統計學的絕佳註解。福爾摩斯在聽過亨特小姐的敘述之後,經過深思,已經用他擅長的「回溯推論法」發展出七種可以推論出已知事實的解釋。在這個階段,這七種解釋都是可能的,換句話說:七種解釋都有不等於零的機率。這個機率分布,就是貝氏統計學的「先驗機率」。

貝氏統計學的功能,便是在獲得進一步的資料之後,用貝式定理算出「後驗機率」的機率分布。後驗機率更新了先驗機率。如果新資訊是有用的,後驗機率分布通常會比先驗機率有較小的標準差,也就是更集中在較少的解釋上。如果一開始資料不足,貝式統計學家可能會假設所有的解釋都有相同的機率為真,這就是統計學所謂均勻分布(uniform distribution)。

將有用的資料考量進去之後,如果有些解釋因為與新資訊不盡相符,其機率降低,甚至可以完全排除。如此,後驗機率就變成集中在少數幾個解釋的分布了。

這個故事中,福爾摩斯與華生與亨特小姐在溫徹斯特見面,亨特小姐報告了她在雇主家中的見聞。這些新資料已經足夠讓福爾摩斯把後驗機率分布全部集中在單一解釋上了。他向亨特小姐說:

當然,只有一個說得通的解釋,你是被請到那裡去冒充某個人,而那個人實際上被囚禁在那間屋子裡,這是一清二楚的。至於這個被囚禁的人是誰,我可以斷定就是那個女兒艾麗絲.魯卡斯爾小姐。如果我沒記錯的話,她是被說成已經到美國去了。毫無疑問,你所以被選中是因為你的高度、身材和你的頭髮的色澤和她的一樣。

好的頭髮被剪掉很可能是因為她曾經患過什麼病,因而,自然也必須要你犧牲你的頭髮。你瞧見那綹頭發完全是碰巧。那個在公路上的男人無疑是她的什麼朋友,很可能是她的未婚夫。而且無疑,正因為你穿著那個姑娘的衣服,而且又那麼像她,所以每當他看見你的時候,他從你的笑容中,以後又從你的姿勢中,相信魯卡斯爾小姐確實很快樂,並認為她不再需要他的關懷了。

當後驗機率百分之百集中在單一解釋上,在福爾摩斯心中,案件已經破了。然而,他仍然需要得到法庭可以接受的證據,那才能將罪犯訴之以法。

Statue_Of_Sherlock_Holmes-Marylebone_Roa
由 Lonpicman - 自己的作品, CC BY-SA 3.0
英國倫敦的夏洛克.福爾摩斯雕像

推理小說的形上學:邏輯哲學論

推理小說中偵探用邏輯探案,最終還是要上法庭用語言陳述,並接受事實證據的檢驗。看過厄爾.斯坦利.加德納 (Erle Stanley Gardner)《梅森探案》(Perry Mason)的小說讀者或電視觀眾對這點一定印象深刻。這裡要談的是:推理小說中語言與事實的關係,就是早期維根斯坦《邏輯哲學論》中語言與事實的關係。

在《邏輯哲學論》中,維根斯坦主張語言由命題組成,而命題是世界上事實的「圖像」。維根斯坦所謂「圖像」就是「模型」。他在《邏輯哲學論》2.12寫道:「圖像是事實的模型」(The picture is a model of reality.)。

其實,維根斯坦用「圖像」及「模型」這兩個字來描述命題與事實的對應關係,正來自於法庭上的實際作法。原來他在報上讀到巴黎法庭在審判時使用模型來呈現交通事故現場,便想到可以用圖像與事實的對應關係來描述命題與事實的對應關係。

世界由基本的事實組成,這些基本事實反映在語言中就是他所謂的「原子命題」。在語言中,這些原子命題組成了較複雜的命題。複合命題可以用邏輯真值表來判斷其真偽。

邏輯不但是語言的結構,也是世界的結構。語言中可以用邏輯推導出的命題,在世界上必然也有相對應的事實。反過來說,只有在世界上有對應事實的命題,才是在語言中有「意義」的命題。維根斯坦的這個理論,一般稱作「語言的圖像理論」或「意義的圖像理論」。

這個「邏輯哲學論」,就是福爾摩斯推理的基本原則。他的名言:

當你把一切不可能的情況都排除之後,那剩下的,不管多麼離奇,也必然是事實。(《四簽名》)

這就是說經過邏輯確立的假說,必然是案情唯一的解釋。不論這假說有多不可能,也必然可以找到事實證據來支持它通過法庭的檢驗。

這種推理方法當然不是福爾摩斯的專利。雷曼.錢德勒(Raymond Chandler)透過筆下的偵探馬婁(Marlowe)也說:

有些事情是事實:在統計的意義上、寫在紙上、錄在帶上、作為證據的事實。而有些事情之所以為事實是因為缺少了它其它的事情就無法解釋了。(《回播》)

達許.漢密特(Dashiell Hammett)的《瘦子 》也有這一段偵探尼克(Nick)與他太太諾拉(Nora)的對話:

諾拉:「所以你並不確知他搶了威年特?」

尼克:「我們當然知道。不是這樣事情就無法接榫。」

諾拉:「所以你並不確定他——」

尼克:「不要這樣說。我們當然確定。只有這樣事情才能接榫。」

換句話說:推理的結論並不是已知的事實,而只是邏輯推論得到的命題。然而,依據《邏輯哲學論》的形上學,這個命題在世界上必然會有相對應的事實,只有這樣才能跟其它已知的事實「接榫」。「接榫」(click)就是邏輯的連結;少了這個連結,案情就無法解釋。