一刻新闻

信息过载时代的新闻精选

因果關係很重要,但並非一望可知

絕大部分醫學科普文章,其實都沒有把因果關係講清楚,大部分讀者關注的,也僅僅是結論部分,而醫學專業出身的人,因爲缺少必要的數學基礎,真要較真因果關係的算法,往往也是一頭霧水,我經常看到不少醫學作者在文章中說,相關不等於因果,那麼如果我們在此基礎上追問一句,有因果關係的兩個變量,它就一定相關麼?‍‍‍‍

我相信見到後面的問題,很多人可能當場就懵了。

這並不奇怪,因果關係雖然非常重要,但它的複雜程度,確實遠遠超出一般人的想象,不但定義困難,更重要的是,找出因果關係的方法也沒有任何一種是放之四海而皆準的,往往是適用於解決一個問題的方法,換個問題它就立刻失靈了。‍‍

舉一個極端一點的例子,我們在評價藥物療效的時候,經常會使用隨機對照的方法,這個方法換到降落傘測試領域就肯定行不通,試問,如果想證明降落傘是不是對從飛機上跳下來的人有保護作用,誰想去當那個不用降落傘的對照組去?

我曾經也低估了這個問題的複雜程度,妄想通過一篇短文就能講清楚,實在是少年輕狂無知無畏,現在碰了壁了,只敢說帶大家看看因果關係的門縫而已,至於日後能走進去多遠,要看各位的造化了。

我們不妨順着幾個問題看看因果關係的光怪陸離吧

  • 第一個問題:因果關係爲什麼很重要。
  • 第二個問題:怎樣找到因果關係。
  • 第三個問題:如何利用因果關係進行決策。

一、因果關係爲什麼很重要

我們只有準確理解了一些基本的因果關係,才能更好地生活,在尋常動物的眼中,火就只是一種光焰,但人類掌握了火之生滅的原因,就可以將火爲我所用。

諸如此類的例子,歷史上和生活中俯拾皆是。

除了這些現實、實用的例子而外,人們對因果關係的探究也源自一種與生俱來的好奇心,可有些因果關係掩藏的太深根本找不到怎麼辦?

那就瞎編一個。

比如月食產生的原因,中國古人認爲那是天狗喫月亮。

類似的還有,印加人的故事裏說,月食一隻美洲虎攻擊了月亮,而美索不達米亞人相信月亮遭到了惡魔的襲擊。古人的思維方式是極其相似的,誰也沒比誰更博大精深。

利用這個瞎編的原因,好像也能有點兒用,古人們大吼大叫敲盆打鼓一頓操作猛如虎,嘿,你看天狗嚇跑了吧,月亮它又圓了了。

但如果利用這個 虛構的原因去解決更復雜的問題,它就失靈了,比如,天狗下一次啥時候喫月亮?

要解決這個問題,就需要那個真實的因果關係和精確的歷法知識了。‍‍

二、怎樣找到因果關係

人類最早使用的尋找因果關係的方法,肯定是觀察。

原因總在結果前面。

有人可能說你這不是廢話麼?

我們來看這樣一個研究。

2001 年,研究人員做了一組隨機雙盲對照研究,驗證祈禱是否會提升病人的治療效果,試驗共整理了 3393 名感染的成年病人,分成了祈禱組和對照組,結果顯示,祈禱組病人的住院時間縮短了,在統計學上具有顯著性。

那麼,你能不能據此結果就認爲祈禱是有效的呢?

你看,分組隨機,還用上了盲法,統計結果也有顯著性,這個試驗會不會讓你的固有觀點有那麼一絲絲動搖?

但你要看了這個研究過程,都得氣樂了,這簡直就像一齣惡作劇,設計這個試驗的人是 21 世紀的,而這些病人和住院資料卻來自 20 世紀(1990 年-1996 年)。‍

當下的原因(祈禱)能夠導致某件事情在過去發生(病人好轉),一個人得瘋成什麼樣才能相信這樣的因果關係?

但我想強調的重點並非是這個試驗有多麼離奇,而是時間上的先後,有時候會直接主導我們對因果關係的認知。

比如還是上述的試驗方法,假如祈禱在前好轉在後且統計學上有顯著性呢?

這就不知道有多少人要一頭扎進神祕主義的懷抱了。

一般而言,找到因果關係的方法有兩種:觀察法,實驗法。‍‍

舉個常見的觀察法的例子,假如你在某天出門診時,忽然出現一大批疑似食物中毒的病人,那麼,你如何證明這些人確實是食物中毒呢?

第一步,得找到這些人近期喫的東西有沒有相同的部分,第二步,纔是去檢測這部分東西有沒有問題。

但現實生活中的更多問題,遠比上述的例子要複雜。

19 世紀,John Stuart Mill 提出過穆勒五法來尋找類似的規律性,這些方法包括:契合法,差異法,契合差異並用法,剩餘法,共變法。‍‍‍‍‍

契合是指某個原因是導致某種結果的必要條件,除非出現這個原因,否則不會出現這個結果。‍

比如作爲公司主管,你發現遲到的員工都是談戀愛的,那麼,戀愛就是遲到的必要條件。(在這個虛擬的例子裏,不是說戀愛的全遲到,否則,戀愛就成遲到的充分條件了)

如果我們要考察出現某種結果和未出現某種結果之間有什麼不同,這就是差異法。

比如你發現凡是頭一天出去跟對象約會的,第二天上班都很疲憊,而那些沒約會的,第二天就很精神,那麼,跟對象約會就是次日疲憊的充分條件。‍‍‍

如果將契合法與差異法聯用,找到的原因就可能是某結果的充分必要條件。

剩餘法就是排除法,對於某結果只剩下一個可能的原因,那麼就是這個原因導致了該結果。‍‍‍

但這個方法有個重要前提,就是假定我們已經知道了所以其他可能得原因導致的所有結果,且一個原因只會導致一個結果。‍

比如你週一到週五都是很規律地跟 ABCDE 五個對象分別約會,但只有週五那天腦袋疼,如果除外了 ABCD 四種可能,那麼 E 就是致病因素。

可實際情況要複雜的多,比如有沒有可能 ABCD 也是致病因素,但是產生症狀的過程有時間延遲?又或者只有當 ABCDE 五者相互作用時才讓人頭疼?‍‍‍‍

在共變法中,原因和結果之間存在劑量效應——隨着原因劑量的增加,結果的劑量也隨之增加——典型例子,啤酒喝得越多尿得就越多。‍‍‍‍‍

還是那句話,實際情況要更復雜,如果啤酒喝得足夠多,那人就會死於酒精中毒,死人是不會產生尿液的。

在醫學史上使用穆勒五法找到原因的例子有很多,最著名的一例是 John Snow 發現了倫敦爆發霍亂的原因。Snow發現死於霍亂者都可能使用過寬城街水泵裏的水。‍‍‍‍‍‍‍

還有一個例子是吸菸的危害。

1951 年有一項前瞻性的研究,研究者向 6 萬名英國醫生髮放調查問卷,採集關於吸菸習慣的信息,在短短 5 年的時間裏,重度吸菸者患肺癌死亡的概率是不吸菸者的 24 倍。‍‍‍‍‍‍‍‍‍‍‍

美國的癌症協會也在同一時間裏發起了類似的研究,美國的研究者發現,吸菸者死於肺癌的概率是不吸菸者的 29 倍,而重度吸菸者死於肺癌的概率是不吸菸者的 90 倍。‍‍‍

另外,曾經吸菸後來戒菸的人,其患病風險降低了一半。(劑量-響應效應)

吸菸有害健康在今天似乎已經是盡人皆知的常識了,但最初關於吸菸是否有害健康的爭論曾經非常激烈,這裏處理菸草公司利益攸關的因素而外,也跟這其中因果關係的確證極其複雜有關,很多醫界人士和統計學專家都不相信吸菸致癌這個結論,因爲這個致病的時間太漫長了。‍‍‍‍‍‍‍‍‍‍

比如你懷孕了,總賴不上兩年前親了一次嘴兒。‍

上世紀 60 年代,美國專門成立了一個顧問委員會(10 位成員中,5 位吸菸,5 位不吸菸)來討論這個問題,後來該委員會發布了一份報告,明確了吸菸與肺癌的關係。‍‍‍‍‍

值得一提的是,路易斯·費瑟,這位每天要吸 4 包煙的重度吸菸者在委員會的報告發布之後一年內被確診爲肺癌,他在給委員會的信中寫道:‍‍‍

雖然吸菸致癌的證據已非常充分,但你們可能還記得在委員會的討論會上,我仍在不停地吸菸,還東拉西扯了所有那些吸菸者一貫使用的藉口……對我個人而言,我被確診爲肺癌,這一事實比任何統計資料都更有說服力。‍‍‍

在接受了摘除一葉肺的手術之後,他終於戒菸了

但觀察法的侷限也是非常明顯的,當只有觀察數據時,我們永遠都無法確定是否存在隱藏的共同原因,從而導致了一些表面上的因果關係。‍‍‍‍‍‍

比如數據顯示學習時間長者學習成績好,那麼我們能不能據此認爲學習時間長這個因就會導致學習成績好這個果?‍

有沒有可能這兩者的共同原因其實是學生天資聰明,而這個聰明纔是導致學習時間長和學習成績好的共同原因。(我在這裏沒打算給出結論,只是提醒讀者注意,不要被表面上的關係誤導)

因此,對於更復雜的因果關係,我們只能通過實驗法來明確。

很多時候,我們之所以想找到原因,就是因爲我們系統通過操縱原因來實現對結果的控制,在這個範疇裏,發現病因並找到治療方法就是最典型的例子了。

《心外傳奇》中提及了許多通過實驗來找到因果關係的案例,這些故事都說明,尋找因果關係的過程經常都是非常曲折的,由於人類認知的侷限性,還經常被表面現象引入歧途。‍‍‍‍

更讓人難過的是,那些科學家心血的結晶還經常被公衆誤解,以至於很多有價值的結論,在造福社會的過程中還是會步履維艱困難重重。‍‍‍‍‍

三、如何利用因果關係進行決策

正確的決策需要依賴可靠的因果關係,這似乎是不言自明的,但在實踐中,卻並非易事。‍‍‍‍

比如就在林德發現防止壞血病的方法之後的一百年後,英國還有兩支極地探險隊慘遭壞血病的侵襲,他們爲什麼會忘記 100 年前的教訓呢?

1875 年,當北極探險隊的水手們在飲用了檸檬汁的情況下仍然患上了壞血病,醫界陷入了極大的困惑,他們同時還發現,那些喫了鮮肉的水手並沒有得壞血病,而那些喫了罐頭肉的人卻得了壞血病,於是就有醫生得出結論醃肉纔是壞血病的罪魁禍首(這一推理過程參見前述穆勒五法)。‍

結果在後來1911 年的一次南極遠徵探險中,隊醫就沒建議儲備足夠的柑橘或橙子,而是帶上了未經污染沒有腐壞跡象的乾肉……‍

可真相其實是,他們喫的鮮肉——北極熊的肝臟裏含有維生素 C,而他們喝的檸檬汁則是烹煮過的。

1929年,聖捷爾吉·阿爾伯特(Albert Szent-Györgyi,1893-1986)成功分離出己糖醛酸,此物質即後來大名鼎鼎的維生素 C,至此,壞血病才徹底被征服,由於天然食物中富含維生素 C 者很多,以至於壞血病幾乎都快要從人類疾病譜中被抹去了。

還有一個例子也很發人深省,美國田納西州曾有一個小規模的隨機試驗發現,被分到小班(人數較少)的學生在標準化考試中的成績比那些分到大班的學生要好。

這是不是提示我們,如果我們把大班拆分成小班對學生的學業成績應該是有利的?

基於這個試驗結論,加州實施了一個項目來縮小班級規模,結果,卻並未收到預想中的效果。

爲什麼?

因爲很多時候,我們都無法孤立地只操縱一個因素而其他條件都保持不變,加州的新政策只是縮小了班級規模,可學生總數並沒有減少,這就導致需要更多的教師,結果,這些新招聘的教師中,有 20%以上沒有教師資格證。‍‍‍

上述兩個決策失誤的例子,前者是因爲確切機制不明(並沒有真的弄懂柑橘橙子爲什麼會起作用),後者是因爲一個幹預因素的改變引起了後續預料之外的連鎖反應,還有一個失誤的例子,簡直讓人哭笑不得。

大家現在都知道是蚊子傳播的,有些地方不是窮麼,好吧,俺們捐蚊帳給你們防蚊子……有個項目後來發現瘧疾在當地的發病率也沒降啊?

你要不是提前知道答案的話,估計你想破頭也想不出來是因爲啥。

當地人發現,嘿,這個蚊帳可太好了,能用來撈魚。

他們把蚊帳當漁網來使了,因爲實在太窮了啊,缺乏食物的威脅遠比感染瘧疾來得迫切……

大家看,即使理論正確,方法正確,也不敢保證一定出現預期中的理想結果,真實的世界,複雜到讓人想罵孃的地步。

既然因果關係這麼複雜,那麼算了,愛咋咋地吧,瞎活。

但,命運會區別對待知識水平不同的人。往宏觀了說,命運也會區別對待是否尊重理性和常識的民族、國家。‍

我們講過那麼多誤用因果關係的例子、教訓,絕不是說乾脆不思考因果關係反而是對的,正確的理論在執行層面當然有可能出現不良結果,但理論層面就是錯的,還想收穫更好的結果,那他媽的就是癡人說夢。‍‍

有些地方的人一夢就是上千年。

我們不能指望有一種一勞永逸的方法直接就能解決所有的因果關係,比如把一堆數據扔進一個黑箱子,取出來就是個確切的結論。‍‍

每一種尋找因果關係的方法,都只能在特定的條件下才好用,就像我們開頭提到的,在人的身上做隨機雙盲對照試驗是驗證一種藥物是否有效的好方法,把這個方法平移到驗證降落傘的保護效果上面就明顯不適用。

如果非要爲尋找因果關係的方法給出一個標準答案,那麼這個答案就是:我們需要利用多種不同的方法。

如果你只會一種方法只會用一種思維方式看待這個世界,那麼一定會因這樣的侷限性而在現實世界裏撞的滿頭都是包。‍‍

當然,這些講的的全都是如何做具體的事,至於做人,那就複雜到難以評價了,因爲,「人永遠都無法知道自己該要什麼,因爲人只能活一次,既不能拿它跟前世相比,也不能在來生加以修正。沒有任何方法可以檢驗哪種抉擇是好的,因爲不存在任何比較。」

(因果關係感興趣的讀者,推薦閱讀這幾本書:《別拿相關當因果!因果關係簡易入門》《爲什麼:關於因果關係的新科學》《因果革命:人工智慧的大未來》)