2015年1月17日 星期六

聰明學統計的13又½堂課 Naked Statistics: Stripping the Dread from the Data

聰明學統計的13又½堂課
每個數據背後都有戲,搞懂才能做出正確判斷
Naked Statistics
Stripping the Dread from the Data
Charles Wheelan──著
愛荷──譯
先覺──出版

統計就像是高性能武器:
正確使用就有所幫助,錯誤使用就可能造成災難。
這本書不會讓你成為統計專家,但它會讓你對這個領域保有足夠的審慎及尊重。
換言之,這檔事你多少得懂一些,免得被炸死了,還不曉得自己是怎麼掛掉的。

博客來內容連載:前言
我愛統計,統計可以用來解釋從DNA檢驗到玩樂透的愚蠢行為;可以幫助我們辨識出和癌症、心臟病等疾病有關的因素;可以幫助我們觀察到標準測驗中的作弊行為,甚至可以幫助你在遊戲節目中獲勝。我小時候有個出名的節目叫做《讓我們做個交易》(Let's Make a Deal),它有個同樣有名的主持人蒙提.霍爾。在每一天節目的結尾,優勝者會站在蒙提旁邊,面對三扇大門:一號門、二號門,以及三號門。蒙提.霍爾會解釋有一扇門的後面是眾所企盼的獎品,例如一輛新車,其他兩扇門後面則是一隻羊。玩法很直截了當:優勝者選一扇門,就會獲得門後的獎品。
因為優勝者和主持人一起面對門,他有三分之一的機會選中那扇大獎的門,不過這個節目有一點變化,這點一直都讓統計學家覺得很有趣,同時也讓其他人覺得很困惑。當優勝者選擇一扇門之後,主持人會打開剩下兩扇門中的一扇,後面永遠是一隻羊。舉例來說,假設優勝者選了一號門,蒙提會打開三號門,就會看到一隻活生生的羊站在台上。其他一號門及二號門仍然關著。如果大獎是在一號門後,優勝者就贏了;如果大獎是在二號門後,優勝者就輸了。接下來,事情變得更有趣了:蒙提會問優勝者要不要改變心意,選擇另一扇門(在這個例子是從一號門改成二號門)。要記得這兩扇門都還是關著,優勝者唯一得到的新訊息是,他沒選的兩扇門中有一扇後面是一隻羊。
他應該換嗎?
答案是應該。本書的第5又½章會提到。
統計的弔詭是它們無所不在—從打擊率到總統民調都是—但是這門學問本身卻以無趣及難搞著稱。許多統計書籍與課程都充斥著數學與術語。相信我,技術細節非常重要且有趣,但是如果你不了解它的直覺,那統計對你來說就是希臘文了;而且如果你不相信有學習它的理由,那你連直覺也不用在乎了。本書的每一章都保證會回答我問過高中微積分老師的基本問題:學這個要做什麼?
這本書講的是直覺。它只簡短提到數學、方程式,以及圖形,而且我保證在提到時一定會有明確、啟發的目的。另一方面,這本書會費盡唇舌舉例說明,好讓你相信學習統計的確事關緊要。統計真的很有趣,而且大部分的內容並不難搞。
有一天,老師試著教我們將一組無限系列的總和匯集成一個有限數目的情況。一組無限系列指的是一個無止境的數字模式,例如1+½+¼+⋯…結尾的點點點表示這個模式持續到無限。
然後,我突然靈機一動。
想像你站在離牆剛好二呎的地方。
現在移離牆一半的距離(一呎),因此你現在距牆一呎遠。
從一呎開始,再移向離牆一半的距離(六吋,亦即二分之一呎);然後從六吋開始,再移一次(移三吋,亦即四分之一呎);然後再一次(移一又二分之一吋,亦即八分之一呎);然後再一次……
你會逐漸緊靠近牆(如當你離牆「一○二四分之一」吋時,再移向離牆一半的距離,亦即「二○四八分之一」吋),但你永遠不會撞到牆,因為就字面來說,你每次只移動離牆一半的距離。換句話說,你會無限接近牆,但永遠不會撞到它。如果我們用呎來計算你移動的距離,這個系列就可以這樣表示:1+½+¼+⋯⋯
道理就在這裡:雖然你會繼續移動前進,每一次移動都會讓你更靠近離牆一半的距離,但你移動的全部距離絕不會超過二呎,這正是你一開始離牆的距離。就數學而言,你移動的全部距離可以約略算是二呎,計算起來非常方便。數學家就會說這個無限系列(1+½+¼+⋯⋯)加總起來就是二呎,這就是老師那天想要教會我們的。
現在我已經證明統計的核心工具其實可以更合乎直覺與更易上手,接著我要提出一個看似相反的觀點:統計可能會過度容易上手,因為任何人只要有一台電腦和一些數據,敲幾下鍵盤,就可以完成複雜的統計過程。問題是如果數據不正確,或是不當使用統計技巧,結論就可能嚴重誤導,甚至造成危險。想像你在網路搜尋時,跳出下列這個假設性的新聞標題:工作時短暫休息的人更容易死於癌症。根據一項針對三萬六千名白領階級的驚人調查,那些習慣於上班時離開辦公室去休息十分鐘的員工,在未來五年內罹患癌症的可能性,要比上班時間不離開辦公室的員工高出百分之四十一。顯然我們針對這項發現應該採取一些行動,例如發起全國性運動來阻止工作時的短暫休息。
又或許我們只需要想想許多員工在十分鐘休息時做的事情。我的專業經驗告訴我,許多上班時短休的員工都聚在建築物入口外面一起吸菸(製造出一片煙霧,讓其餘的人必須走過煙霧才能進出建築物)。我的進一步推論是,導致癌症的有可能是香菸而不是短休。這個例子是我編造出來以凸顯其荒謬,但是我向你保證,許多真實生活中的統計惡行一經解構幾乎就是這麼荒謬。
這不是一本教科書,因此涵蓋的主題範圍及說明的方式比較隨意。這本書意在以最生活化的方式來介紹統計觀念。科學家如何判定致癌因素?民調如何進行(哪些地方會出錯)?誰「拿統計騙人」,他們如何做到的?你的信用卡公司如何利用你的購物內容數據,來預測你是否會錯過繳費期限(他們真的做得到)?
如果你想要了解新聞背後的數字及欣賞數據神奇的力量,這本書正符所需。最後,我希望能說服你相信瑞典數學家及作家唐克爾斯的創見:用統計說謊很容易,沒有統計要找出真相卻很困難。
但我還有更大膽的期望,我認為你說不定會喜歡上統計,它背後的想法既絕妙有趣也十分實用,關鍵就在於將重要的概念從難解的技術細節中分離,不要讓它們妨礙你,這就是《聰明學統計的13又½堂課》。
  1. 為什麼要學統計?
  2. 誰是史上最佳球員?—描述性統計
  3. 「他的個性還不錯」及其他非謊言但嚴重誤導的敘述—誤導式統計
  4. 線上租片公司怎麼會知道我喜歡什麼電影?—相關性
  5. 不要為99美元的印表機加買延長保固—機率入門
    • 5又½. 門後會是一隻羊,還是你企盼的獎品?—蒙提霍爾問題
  6. 看看過度自信的數學怪咖如何差點摧毀全球金融系統—機率的問題
  7. 「垃圾進,垃圾出」—數據的重要性
  8. 統計學的詹姆斯大帝—中央極限定理
  9. 為什麼統計學教授懷疑我作弊?—推論
  10. 我們如何得知64%的美國人支持死刑(樣本誤差為正負3%)—民調
  11. 奇蹟仙丹—迴歸分析
  12. 強制警告標示—常見的迴歸錯誤
  13. 就讀哈佛會改變你的一生嗎?—方案評估
為什麼學統計?
2014 Gini Index World Map, income inequality distribution by country per World Bank
via wiki
「基尼指數」(Gini coefficient)是經濟學上用來測量貧富不均的標準工具。它是用來將複雜的資訊濃縮成單一數字的方便工具,它具有大多數描述性統計的優點,也就是它提供一個容易的方法,可用來比較兩國的收入分配狀態,或是單一國家在不同時期的收入分配狀態。
基尼指數是從0到1的差距內,測量一個國家的財富或收入分配程度,這數字可用來計算財富或是年收入,還能夠以個人或每戶為單位來計算(這些統計數字都高度相關,但並不完全一致)。它沒有真正的意義,只是用來比較的工具。如果一個國家的每戶財富都一樣,基尼指數就會是0。相對的,如果一個國家的財富都集中在一戶人家之中,它就會是1。因此,當國家的財富分配越不平均,基尼指數就會越接近一。根據中央情報局的資料,美國的基尼指數是0.45。有時候,基尼指數會被乘上一百,讓它成為整數,美國的基尼指數在這時就是45。
基尼指數當然不會是衡量財富不均程度的最佳方式,但它以一個簡便的形式,提供我們一些社會重要現象的重要資訊。
《紐約時報》(The New York Times):「數據只是知識的原料。」
學統計是著眼於統計可以幫助我們處理數據,數據其實只是一個用來稱呼資訊的名詞。有時候數據在事情的全貌上微不足道,例如運動比賽的統計;有時候由數據則能洞察人類現象的特性,正如基尼指數。
描述性統計本身有簡化的目的,因次也意味著會失去一些差異和細節。這也表示,過度依賴任何描述性統計可能會誤導結論。

統計學的一項重要功能,就是針對無法取得全部資訊的大問題,利用我們擁有的數據做出知性的判讀。我們利用「已知世界」的數據,對「未知世界」做出知性的結論。
統計的目的就是要學習那些會影響生活的事情。

迴歸分析是一種工具,可讓研究人員在保持(或「控制」)其他重要變數(如飲食、運動、體重等)的作用不變的情況下,將兩個變數之間(如吸菸與癌症)的關係分離出來。
但我們雖可利用統計分析分離出兩個變數中的強烈關聯,卻未必能解釋這種關聯為何存在。在某些情況下,我們也無法確知這種關聯是有因果作用的,亦即一個變數的改變真的能引起另一個變數的改變。

那麼,學統計的目的何在?
  • 將巨量資料做出摘要。
  • 做出較好的決定。
  • 解答出重要的社會問題。
  • 辨識出能提升做每一件事效果的模式,從賣紙尿布到抓罪犯皆然。
  • 糾出作弊者及起訴罪犯。
  • 評估政策、計畫、藥品、醫療過程與其他創新事項的效用。
  • 發現那些利用這些強有力的工具達到邪惡目的的惡棍。
描述性統計

我們當然希望在一項調查中,獲得所有的資訊,但諷刺的是,愈多的數據往往愈不清晰,我們利用運算把一連串的數據減少到幾個數字來描述。這些描述性統計給我們一個容易處理且有意義的摘要,可以一窺根本現象的全貌。但是,任何簡化都會引致濫用,描述性統計就像是網路交友的個人簡介,技術性方面都很正確,卻很容易誤導。

第一項描述性工作通常是去找到一組數據的「中間量數」,也就是「集中趨勢」。一個分配最基本的「中間量數」是平均數,但平均數容易被「偏離值」扭曲,偏離值是指遠離中心的觀察值。因此,我們有另一個統計數字可以代表一個分配的「中間量數」,就是「中位數」,中位數是將一個分配區分成兩半的那個點,代表一半的觀察值位於中位數的上方,另一半在下方。
平均數和中位數都不難算出,關鍵在於在特定情況下,需要決定哪一個「中間量數」比較正確。
這類描述型統計說明了一個特定的觀察值與其他觀察值比較時的位置。
另一個有助於我們在一堆雜亂數字理出頭緒的統計值是標準差,它是用來衡量數據以平均值為中心時,是如何分布的,也就是所有觀察值的範圍有多廣。標準差這個描述性統計值給我們一個數字,反映出觀察值在平均值周遭的分布情形。
變異數是將每一個觀察值與平均值之間的差平方,再將這些差平方數的總和除以觀察值的數目。因為每一觀察值與平均值之間的差都被平方,也意味著變異數的公式將較大的權重置於落在離平均值較遠的觀察值,亦即偏離值。
變異數很少單獨用來作為描述性統計值,它在計算一個分配的標準差之前置作業時最為有用,標準差用來作為描述型統計時,是一個更能一目了然的工具。
許多典型的數據中,會有高比例的觀察值落在平均值的一個標準差之內。
常態分配是統計學上最重要、最有用且最普遍的分配之一。常態分配的數據是以對稱的方式圍繞著平均值,形成你所熟悉的鐘型。
via wiki
常態分配之美來自一個事實,就是我們準確地知道,觀察值中落在平均值的一個標準差之內(68.2%)、兩個標準差之內(95.4%)、三個標準差之內(99.7%)等的比例各為多少。
平均值是一條中線,通常以μ來代表,標準差則以σ代表。每一波段代表一個表準差。
2014 Human Development Index
via wiki
「指數」把許多複雜的資訊整合成一個單一數字,就可以將本來無法簡單比較的東西加以排序。然而,把許多複雜的資訊整合成單一數字也正是指數的缺點。有無數的方法可達到這個目的,每一種都可能產生不同的結果。
任何指數對於整合其各項統計值都高度敏感,對各項統計值所占的權重也很敏感,因此指數可以是有用卻不完美的工具,也可以是用來蒙騙的工具。
「聯合國人類發展指數」(Human Development Index)是用來衡量經濟福祉的數值,要比國民所得來得周全。國民所得是構成「聯合國人類發展指數」的項目之一,但這指數還包括平均餘命及教育程度的測量值。以每人經濟產出來計算,美國在全球位居十一,但在人類發展方面則位居全球第四。如果將「聯合國人類發展指數」的組成項目重新編排的話,排名的確會稍微變化,但是也不至於讓辛巴威的名次超越挪威。這是個用來快速一覽全球生活水準的便利且不失正確的工具。
描述型統計有助於表達議題,而針對議題該做什麼,則是意識形態與政治問題。

誤導式統計

任何對約會有過仔細觀察的人都知道,「他的個性還不錯」這句話通常會讓人有所警覺,不是因為這樣的描述一定有問題,而是因為沒有說出來的事實可能是這個傢伙有前科,或者他的離婚尚未生效。我們不懷疑這傢伙的個性好,但擔心的是「個性還不錯」這個真實敘述被用來遮掩或模糊其他資訊,造成嚴重誤導。
統計也是如此。統計的範疇奠基於數學,數學是門精確的學問,但使用統計來描述複雜的現象卻是不精確的,會留下許多遮蔽事實的空間。
There are three kinds of lies: lies, damned lies, and statistics.
——Mark Twain
「精確」是指我們表示某件事的準確性;「正確」用來衡量一個數字是否大致符合真相,因此精確性與正確性會有混淆的危險。如果一個答案是正確的,那麼愈精確通常愈好;但是再怎麼也無法取代正確性。事實上,精確性都可能給我們一種錯誤的確定感,因而遮掩其不正確性。
即使最精確的測量或計算,都應該經過常識的判斷。
分析單位是統計學上用來比較的實體,但不同的分析單位所帶來的統計意義可能截然不同。
《經濟學人》指出:「如果你考量的是人民,而不是國家,那麼全球不均的現象正迅速減輕。」

在前面就提過的,平均數與中位數同樣會造成誤導。中位數的特色,在於它不強調觀察值落在離中間點多遠之處,而是觀察值落在中間點的上方或下方,因為它沒有平均數對偏離值的高敏感性,因此會有遮掩作用。平均數則受到觀察值分布形態的影響。從講求正確的觀點而言,平均數與中位數圍繞的問題重點是,一個分配的偏離值是否扭曲,亦或反而是全貌中重要的一部份。當然,任何周全的統計分析很可能兩者都會呈現,如果只有出現中位數或平均數,也許是為了精簡,也有可能是某人想用統計值來「說服」別人。
1980年由Harold Ramis執導的電影《瘋狂高爾夫》(Caddyshack)裡,有這麼一段對話:
「你打幾桿?」
「哦,我沒怎麼記。」
「那你怎麼和別人比較?」
「比身高啊。」
同樣的,在比較各年代的幣值時,會因為通貨膨脹有所差異,在美國國內史上的票房及銷售總收入榜就會看出差距,這些賣座電影並未經過通貨膨脹的調整。經濟學家有專門的名詞來稱呼是否經過通膨調整的幣值,「名目幣值」代表未經通膨調整,「實質幣值」則是經過通膨調整的數字。

統計的一個重要角色是用來描述數量隨著時間的變化。我們通常用百分比來表示這些變化,因為可以獲得規模與背景的概念。百分比雖不會說謊,卻可能誇大,其中一個手法是運用百分比的變化來描述比較基數非常低的變化。

一項統計指標會存在任何描述性統計的所有潛在陷阱,還要加上因為結合多項指標而形成單一數字導致的扭曲。依照指標的定義,它應該對構成的因素都有敏感度,會受到形成指標的各個衡量因素,及每個因素的權重的影響。
就如「人類發展指數」而言,在一個與平均國民所得相關的指數裡,應該如何計算一個國家識字率的權重?
濃縮許多指標形成單一數字帶來的簡易性,是否過於著重過程中既有的失真性?有時答案可能是否定的。

統計惡行非關數學好壞,如有任何關連,那就是厲害的計算可以模糊邪惡的動機,你正確無誤地算出平均數這件事,並不會改變中位數是更正確的指標這個事實,令人驚訝的是,判斷與誠實反而重要得多。對統計學知之甚詳未必會轉變錯誤的行為,就像對法律知之甚詳未必會轉換為犯罪行為。

相關性

相關性用來衡量兩個現象彼此關聯的程度。例如,夏天氣溫與冰淇淋的銷售之間有相關性,氣溫上升,冰淇淋的銷售就上升。如果兩個變數之間朝相同的方向變化,這就是正向相關,就像身高和體重之間的關係。反之,就是負向相關,就像運動和體重之間的關係。
這類關聯的棘手之處在於並非每種觀察直都符合這個模式,有時候矮的人體重大於高的人;有時候不運動的人比一天到晚都運動的人來得要瘦;然而,身高與體重、運動與體重之間還是有顯著的關係。
另外,所謂「統計顯著性」,其概念是由分析發現兩個變數之間有某種關聯,而這種關聯不太可能因為湊巧而發生。
相關性的力量在於,我們可以用單一的描述性統計來代表兩變數之間的關聯,也就是相關係數。
相關係數有兩個迷人的特質。第一個特質 ,它是一個介於-1與1之間的單一數目。相關係數是1的連結往往被形容是完美的相關,代表一個變數的每個變化與另一變數朝相同方向產生完全相等的變化之間有關連。反之,相關係數是-1的連結則是完美的負相關,代表一個變數的每個變化與另一個變數朝反方向產生完全相等的變化之間有關連。相關係數愈接近-1或1,關聯性愈強。相關係數是0或接近0,則代表兩者之間沒有顯著的關係。
第二個特質是,它沒有單位的限制。例如身高是以公尺為單位,體重則以公斤為單位,但兩者之間還是可以計算它們的相關係數。
相關係數就像個奇蹟,它將一堆錯綜複雜、單位不同的數據濃縮成單一、漂亮的描述性統計值。
Pearson product-moment correlation coefficient
via wiki
如果一個變數離平均值的距離大致符合另一個變數離其平均值的距離(像樣本人口的身高離平均身高往上或往下都很遠,其體重大致離平均體重的同一方向也很遠),就會預期兩個變數之間有強烈正相關。
反之(如樣本人口的運動時間離平均運動時間多得多,其體重大致離平均體制少得多),就會預期兩個變數之間有強烈負相關。

但有個至關緊要的重點,那就是相關性並不意味著因果關係
兩變數間正向或反向的關聯,未必代表一個變數的改變會引起另一個變數的改變,例如學生SAT成績與家中電視機的數目可能呈現正向關係,但這並不表示父母多買幾台電視機擺在家中後,小孩的成績就會因此暴升,當然也不表示花很多的時間看電視有利於學業。
這樣的相關性最合理的解釋是,教育程度高的父母買得起較多台電視,他們小孩的測驗成績也傾向比平均成績比較好,電視機的數目與測驗成績之間的變化可能是因為第三個變數造成的,也就是父母的教育程度。根據大學委員會的數據,家庭收入超過二十萬美元的學生,SAT數學平均是586,相較之下,家庭收入等於或少於二十萬美元的學生,SAT數學平均成績是460。另外,收入超過二十萬美元的家庭住處的電視機數目也很可能多過收入等於或少於\二十萬美元的家庭。

The Pragmatic Theory solution to the Netflix Grand Prize

機率

機率是研究牽涉到不確定因素的事件及結果的學問。

「大數法則」這個重要的定律告訴我們,隨著試驗次數增加,結果的平均值會愈來愈接近期望值。

對於牽涉到在不同時間點會發生許多偶發事件的複雜情況,期望值可以幫助我們化繁為簡,做出決定。
一株決策樹可以有助於組織這類資訊,如果每一個結果相關的機率正確無誤,還可讓你得到可行性評估。決策樹列出每個不確定因素來源及跟每個可能結果相關的機率。在樹的末端會給我們所有可能的報酬與其各自的機率,如果將每一報酬乘上其可能性,再將所有可能性加總,就會得到這項投資的期望值。

機率是供我們對付生活中不確定性的工具。你不應該玩樂透;如果你預備長期投資,就應該投資股市(股票通常具有最佳的長期投資報酬率);你應該為某些情況買保險,除此之外無須購買。

「蒙提霍爾問題」(Monty Hall problem)是電視遊戲節目《讓我們做個交易》中跟機率有關的著名難題。每天節目結尾會邀請一名參賽者,和主持人蒙提一起站在三扇大門前:一號門、二號門,以及三號門。蒙提會向參賽者解釋有一扇門後是眾所期盼的獎品,另外兩扇門後則是一隻羊。參賽者挑選一扇門,就會獲得門後的獎品。

獲勝的機率在一開始是直截了當的。有兩隻羊和一輛車。參賽者和蒙提一起面對三扇門時,他有三分之一的機會選到的是一輛車。但這個節目有點變化,當參賽者選了一扇門之後,蒙提會打開參賽者沒有選的兩扇門之中的一扇,後面永遠都是一隻羊。這時蒙提會問參賽者要不要改變心意,從他原先選擇的那扇關著的門,換到另下另一扇關著的門。

參賽者應該換門嗎?

答案是應該。參賽者如果堅持原來的選擇,有三分之一的機會贏得大獎,轉換選擇則有三分之二的機會。

答案在於,蒙提清楚每扇門的後面是什麼。
如果參賽者選擇一號門,門後是一輛車,蒙提可以打開二號或三號門,後面都是一隻羊。
如果參賽者選擇一號門,車子是在二號門後,蒙提就會打開三號門。
如果參賽者選擇一號門,車子是在三號門後,蒙提就會打開二號門。
在一扇門打開後改變選擇,參賽者就有了兩個選項而非只有一個選項的好處。

假設遊戲規則稍微修改,參賽者一開始仍比照原來的方式,在三扇門中選擇一扇;但是接下來在任何一扇門打開出現一隻羊之前,蒙提會先說:「你願不願意放棄原來的選擇,改選那兩扇你沒選擇的門?」

這並非是一個很難的決定,你顯然應該放棄而改選另外兩扇門,那會讓你獲勝的機率從三分之一增加到三分之二。基本認知是,如果你可以選擇兩扇門,無論如何兩扇中都有一扇後面一定是羊,當他問你是否改變心意前就打開一扇後面是羊的門,他等於是在幫你一個大忙。

因此擬在下面兩個情況贏得大獎的機率是相同的:
  • 選擇一號門,而在任何一扇門打開前,同意改選二號或三號門。
  • 選擇一號門,而在蒙提打開三號門出現一隻羊後改選二號門(或在蒙提打開二號出現一隻羊後改選三號門)。
從蒙提霍爾問題我們可以得知一件事情,機率方面的直覺有時會指引你走錯方向。

《紐約時報》專欄作家喬·諾切拉曾概述尼古拉斯·塔雷伯的看法:「最大的風險從來就不是你所能預見和衡量的,反而是你無法預見,因此也絕不可能衡量的,它們是那種看似遠在正常發生機率之外,以至於你無法想像會發生在你有生之年的風險,它們的確會發生,而且是比你願意知道的更常發生。」
現實是,沒有什麼人會著墨於「末端風險」(名稱來自統計分配圖的兩個末端),那個可能帶來災難性結果的小風險。

錯估這些風險可能是犯了幾種基本錯誤:首先,我們混淆了精確性與正確性,錯誤的精確性導致人們相信他們掌控著風險,事實上卻沒有。其次,潛在機率的估計不正確。第三,忽視了「末端風險」,那些被認為幾乎不可能的事還是會發生,事實上,經過一段夠長的時間,它們甚至不會如此不可能發生,就像世界上一直都有人被雷擊中,也總有人中樂透頭彩。

機率提供一套強而有用的工具,使用得當可以了解世界,使用不當則會造成巨大混亂。
「機率不會犯錯,是應用機率的人犯錯。」
下列有一些和機率有關的普遍錯誤、誤解,以及道德困境:
  • 當事件並不是「獨立事件」時,卻假設它們是。
  • 當事件屬於「獨立事件」時,卻未能發現。
  • 群集的確會發生。
    • 你可能會在報上看過這樣的資料:在某一特定地區有一群數目不合常理的人都罹患某種罕見的癌症,那一定是因為水質或當地發電廠,或手機基地台。當然,這些因素美一樣都可能引發健康問題,但在這種病例的聚集也可能純粹是偶發關係。當我們看到諸如此類異常事件的發生,,卻沒看到發生的背景,就會假設一定是有不湊巧的因素。
  • 檢方的謬誤。
    • 假設你在法庭上聽到下列結果的證詞:一、犯罪現場找到的DNA樣本與被告DNA樣本相符;二、犯罪現場找到的DNA樣本與被告以外的人的DNA樣本相符的機率只有百萬分之一。基於這些證據,你會不會認定被告有罪?
    • 當統計證據的背景故事被忽略時,就會發生檢方的謬誤。
  • 均值迴歸。
    • 你也許聽過《運動畫刊》詛咒,個別運動員或運動團隊只要登上畫刊封面,接下來的成績就會下滑,有個解釋是,登上該雜誌封面會對接下來的表現有不利影響。統計學上合理的解釋是,團隊及運動員在一連串表現傑出異常的時期後登上封面,接下來的表現只是回歸正常,或是平均現象,這是所謂均值迴歸現象。機率告訴我們,任何偏離值離──平均值兩端特別遠的觀察值──的後面都可以跟著與長期平均值更一致的效果。
    • 馬麥迪爾與泰德寫道:「我們的研究結果顯示,媒體引發的超級巨星文化所導致的行為扭曲超過均值迴歸現象。」
  • 統計歧視。
    • 何時可以根據機率顯示可能發生的結果來採取行動?什麼時候又不宜呢?
    • 我們每天都得到愈來愈多事情的各類資訊,如果數據指出我們對的時候比錯的時候更多,是不是就可以產生歧視呢?用來判定購買鳥飼料的人比較不會付信用卡費用這類分析,也可以用在生活中的每個地方。到什麼程度是可以接受的呢?如果我們建立了一個模式,在一百次裡有八十次可以正確辨識出毒品走私者,那剩下百分之二十的傢伙會如何──因為我們的模式會一而再、再而三地騷擾他們。
    • 不論機率有多簡練與精確,都不能取代我們必須考量要做的是何種計算,及我們為什麼要做。
數據的重要性

數據之於統計正如同一個好攻擊鋒線之於明星四分衛。每個明星四分衛的前面都有一群好的阻擋球員,他們通常不會得到太多功勞,但沒有他們,就沒有明星四分衛。

通常數據要能達到三個條件之一。首先,我們要求數據樣本能代表某個較大群體或母體。如果我們打算評估選民對某個特定政治候選人的看法,就需要訪問一些潛在選民樣本,這些選民足以代表相關選區的所有選民。統計最有力的發現之一,是從適當選取、規模合理的樣本中獲致的理論,可能就跟嘗試從整個母體獲致的同類資訊完全相同。
從一個較大的母體取得代表性樣本最容易的方式,就是雖機選擇那個母體裡的一些子集合。這個方法的關鍵在於相關母體裡的每個觀察值都必須有相同的機會被包括在樣本裡。

民調公司與市場研究公司承天都在思考如何以最具成本效益的方式,在各種母體中得到具有代表性的數據。現在應該思考幾件重要的事情:
  1. 樣本具有代表性是一件極其重要的事情,因為它會打開大門,讓你用到一些統計學最強力的工具。
  2. 獲得好的樣本知易行難。
  3. 許多事態嚴重的統計結果推論,是將好的統計方法應用在壞樣本造成的,而非反過來。
  4. 規模很重要,愈大愈好。
一個重要的注意事項是,較大的樣本並不足以彌補樣本本身的組成錯誤,即所謂「偏差」。事實上,一個大而偏差的樣本大概比一個小而偏差的樣本更糟,因為它會讓人對結果產生錯誤的信心。

第二個條件是數據能提供一些比較的來源。新藥物是否比目前的治療更有效?接受職業訓練的更生人是否比未接受者較不容易回到監獄?上私立學校的學生是否比上公立學校的學生表現得更好?
在這些例子,我們的目的是要找出兩組條件大略相似,只是接受我們所關注的「處理」不同的受試者。在社會科學理,「處理」這個字的範圍含括從性行為受挫的果蠅到接受所得稅退稅都是。就像任何其他科學方法的應用,我們想要分離出某個特定措施或特質的影響,這就是果贏實驗的天才之處,研究人員想出產生控制組(交配過的雄果蠅)與處理組(被拒絕的雄果蠅)(處理組亦常被稱為實驗組)的方法,接下來其飲食行為的不同就能歸因於是否在性行為上被拒。
以人類為受試者反覆面臨的一向研究挑戰,是所產生的實驗組與控制組之間「唯有其中一組」得到處理,另一組則否。因為這個原因,做研究時的「黃金準則」就是隨機化。在過程裡,人類受試者必須隨機被指派到實驗組或控制組。我們不會假設所有實驗受試者都完全一樣,而是假設隨機化會均衡地劃分兩組之間相關的特質──不單是我們可以觀察到的特質,例如種族或收入,還包括無法衡量或未曾考慮的複雜特質,例如毅力或信心。

第三個是,有時候我們對於拿到的資訊沒什麼特別的想法,但是認為到了某個時候就會派上用場。如果我們能準確地知道哪些是有用的,可能一開始就不用調查了。
縱向研究室諄對一大組群的對象在許多不同時間點蒐集資訊,譬如兩年一次,當探討需要數年或數十年才能獲知因果關係時,這種數據就顯得特別珍貴。
橫斷面數據集,就是在單一時間點蒐集的證據。比方說,流行病學家在尋找一種新疾病的起因時,他們或許會從所有已感染的人身上蒐集資料,希望找出某種能溯至源頭的模式。他們吃過什麼?去過哪裡旅行?有什麼共同點?研究人員還可能蒐集沒被感然的人的資料,以突顯兩個族群之間的對比。

以下是一些常見的數據使用不適當的案例:
  • 選樣偏差
    • 如何選出評估的樣本?如果相關母體的每一分子被選入樣本的機會並不均等,從該樣本獲致的結論就會有問體。選樣偏差會以許多其他方式出現。調查機場消費者會有的偏差是,旅行的人可能比一般大眾富裕;在九十號州際公路休息站的調查面臨的則可能是相反的問題。兩項調查還可能有一個共同的偏差,那就是願意在公共場所回答調查的人,不同於那些不願被打擾的人。
    • 每當個別自願者出現在實驗組的時候,就會產生一種相關的偏差來源,稱之為自我選樣偏差。譬如說,自願參加戒毒治療的犯人不同於其他人,因為他們是自願加入戒毒計畫的,如郭這些參與者在出獄後較其他犯人不易再入獄,那當然很好,但對這了解這項戒毒計畫的價值完全沒有助益。我們無法將一個因素的因果影響與另一個人切割。
  • 刊登偏差
    • 正面的發現比負面的發現較可能被刊登,因而可能扭曲我們看到的結果。這種現象的最終效應就是曲解我們看到或沒看到的研究。統計學裡有一個一再浮現的重要觀念是,不尋常的事情每隔一陣子就會出現一次,純粹是機會的緣故。如果你進行一百項研究,其中可能會有一項的結果十分荒謬,例如玩電動遊戲與較低大腸癌罹患率之間的統計關聯。問題是:那些九十九項發現電腦遊戲與大腸癌之間沒有關係的研究不會被刊登,原因是這樣的內容不夠有趣。唯一一個確實發現有統計關聯的研究會被刊登出來,然後得到大量關注。這種偏差不是來自研究本身,而是來自大眾實際接受到的扭曲資訊。
  • 回憶偏差
    • 記憶是個迷人的東西,雖然未必都是漂亮數據的最佳來源。我們會有一種自然的人性衝動,認為現在就是過去發生的事合理結果,亦即所謂的因果關係。問題是當我們試著解釋在某一特別好或不好的結果時,記憶往往變得「系統性失靈」。以一個探討飲食與癌症關係的研究為例,一九六三年有一位哈佛學者彙集一個數據集,包刮一組罹患乳癌的女性及一組年齡相當未被診斷罹癌的女性,兩組女性都被問到早年的飲食習。研究產生明確的結果:罹患乳癌的女性明顯可能在年輕時較常食用高脂肪食物。
    • 但這實際上並不是調查如何影響罹癌可能性的研究,這是一個調查罹癌如何影響女性對她早年飲食記憶的研究。所有受調女性數年前在任何一位被診斷出罹癌之前,已經做過一份飲食調查,結果是,罹患乳癌的女性在自己的飲食記憶中食用的脂肪比實際實用的高得多。
    • 回憶偏差是縱向研究比橫斷面研究更受偏愛的原因之一。在縱向研究裡,蒐集的是訪問當時的數據資料。受調者五歲時會被問到他當下對學校的心態,十三年後我們可以再度受訪同一位受調者,判斷他是否已經自高中輟學。在橫斷面研究裡,所有的資料都是在某一個時間點上蒐集的,我們必須問一名十八歲高中中輟生在五歲時對學校的感覺,這種資料在本質上就不太可靠。
  • 存活者偏差
    • 假設有一位中學校長報告:具有某種特性的學生群連續四年考試成績都穩定提升。這一班二年級的成績較其一年級時好,三年級時更好,四年級時是最好的。我們假設沒有作弊行為,甚至沒有將描述性統計做任何創意的運用,從每一個可能的指標來看,無論是平均數、中位數、學生成績及格比率等,每一年這一群學生的成績都比前一年好。
    • 當有一些或許多觀察值從樣本排除後,剩餘樣本組合已遭改變,乃至於會影響任何分析的結果。假設這位校長真的很糟,每年有一半的學生退學,這就可能大大美化學校的測驗成績,即使沒有任何一名學生的測驗成績變得更好。
  • 健康使用者偏差
    • 固定服用維他命的人可能比較健康──因為他們是那種會固定服用維他命的人!維他命對健康是否有影響是不同的問題。思考下面這個想像的實驗,假設公共衛生官員提倡一個理論,所有新手爸媽應該讓孩子穿著紫色睡意睡覺,因為有助於刺激孩童大腦發育。二十年後,縱向研究證實從小穿紫色睡衣的確和日後成就有極大的正面關聯。
    • 當然,紫色睡衣並不重要;重要的是擁有那種會要小孩穿紫色睡衣的父母。即使我們試著控制如父母教育之類的因素,在那些執著於要小孩穿紫色睡衣的父母與不會如此做的父母之間,還是會有我們觀察不到的差異。
中央極限定理

對許多運用一組樣本來為廣大母體作出推論的統計活動而言,中央極限定理就是「電源」。
中央極限定理所根據的核心是:一個龐大、適當選取的樣本會近似它所來自的母體。樣本與樣本之間顯然會有差異,但是任一樣本與其母體大不相同的機率則很低。

  • 如果我們擁有某一向母體的詳細資訊,就可以針對自那個母體適當抽選的樣本做出有力的推論。假定一個學校校長擁有期學校所有學生標準測驗分數的詳細資料,亦即相關的母體。現在,假設那個學校所屬學區的官員下星期將來學校,給一百名隨機選取的學生類似的標準測驗。這一百名樣本學生的成績,將會用來評估學校整體的成績。根據中央極限定理,這一百名隨機選取學生樣本的平均測驗分數,通常不會偏離整體學生平均測驗分數太遠。
  • 如果我們擁有某一適當抽取樣本的詳細資訊,就可以針對樣本的母體做出準確得嚇人的推論。這個推論的方向和上個例子相反,是將我們放在學區官員的位置上,來評估學區各個學校的表現。不同於學校校長,官員沒有校長手中其學校所有學生的標準測驗資料,亦即相關母體。他將在每間學校隨機選取一百名學生,進行一項類似的測驗。這位官員仍可合理確定,僅憑著一百名學生樣本的測驗分數,就可以公平評估該學校整體成績。樣本結果很足以代表全部母體的結果。

如果第一點是真的,第二點也就一定是真的,反之亦然。
  • 如果我們有描述某一特定樣本的資料,也就是描述某一特定母體的資料,就可以推論,該特定樣本是否與可能出自特定母體的樣本一致。中央極限定理讓我們得以計算一個特定樣本是從一個特定母體中選取出來的機率。若機率很低,我們就有高度信心判斷這個特定樣本不是從那個特定母體中選取出來的。
  • 如果我們知道兩個樣本的基本特色,就可以推論其是否可能選自同一母體。
這類分析都來自中央極限定理,任何母體的樣本平均數會圍繞著母體平均數約略形成一個常態分配。
中央極限定理讓我們更進一步,預測哪些不同的樣本平均數會聚集在母體平均數的附近。母體的分配形狀如何無關緊要,其樣本平均數的分配不會偏斜。樣本的數目愈大,分配形狀就會愈接近常態分配。

2015年1月16日 星期五

為什麼我們需要公共哲學 Public Philosophy: Essays on Morality in Politics

為什麼我們需要公共哲學
政治中的道德問題
Public Philosophy
Essays on Morality in Politics
Michael J. Sandel──著
蔡惠伃、林詠心──譯
麥田──出版

我們所處的時代,人民被賦予及享有的權利擴張了,公民的參政權也擴張了,卻對於政治現狀、對於自己的生活愈來愈感到困頓無力,這是因為,在這個媒體氾濫失控的年代裡,我們對政府的評價總是仰賴它所投射出來的形象。

政府以總體經濟為名的陳腔濫調,對今日貪得無厭的資本主義難以受民主政治約束的事實視而不見,任憑在市場運作的表面下所潛伏的各種道德欠缺問題,摧毀我們的公民組織、縮減我們的公共領域,而這種公共責任的轉向與公民習慣的改變,另一方面也使人們丟失了彼此互為關聯繩結的共同體認同。
倘若我們不再相信自己能夠形塑自己的命運,忽視個人在社會中所扮演的舉足輕重的角色,恐怕只會帶來一次又一次選舉過後的悲觀結果。

桑德爾這本書的核心,正是圍繞在如何恢復此種瀕臨垂危的社群意識上,也就是自我治理。
「自我治理,是一種選擇自我目的之能力,以及尊重他人也有選擇自我目的之權利,還需要對公共事務有一定的認知,並且對於這個與我們的命運休戚與共的社會整體感到歸屬感、關懷與道德使命。」
桑德爾藉由美國的政治傳統,以及這十幾年來炙手可熱的道德議題為例,引導讀者思考上述問題;其論述簡明清晰,無疑地對我們當代的公共生活多所裨益。

本書收錄了桑德爾繼其代表作之後十餘年來發表的文章,與我們熟悉的作者一貫重視的議題相同,內容主要在探索道德和公民難題,論述風格則維持了他一貫的清晰簡明。這些文章既面向公民,也面向學者,且對於在政治政策及執行面上仿效美國的台灣來說,反映了我們諸多的政治社會狀況。

內容分為三部分

American Civic Life
美國公民生活|桑德爾首先藉由美國的政治傳統揭示至今仍懸而未決的道德缺失問題。例如,選舉過程與道德價值的拉扯、政治人物的謊言,以及缺乏道德共鳴的政治論述如何使人民對政府感到幻滅。

Moral and Political Arguments
道德與政治辯爭|把近二十年來一些最熱門的道德與政治議題搬上檯面,其中包括優惠性差別待遇、醫助自殺、同志權利、幹細胞研究、污染許可證、犯罪懲治、市場的道德限度、個人權利與社群主張等,藉此探討市場運作和商業壓力是如何摧毀公民組織、縮減公共領域,以及在各種機會、榮譽與報酬的公平分配爭議的表面之下,經常出現的道德問題。

Liberalism, Pluralism, and Community
自由主義、多元主義和社群|著重在將前面所討論的各種主題連結起來,用以檢視當代較為突出的自由主義政治理論,並且評論它們的強項及弱點。

邁可.桑德爾 Michael J. Sandel
英國牛津大學博士,哈佛大學教授,世界知名學者。曾榮獲哈佛大學教學卓越獎、美國政治學會「特別成就獎」。2002至2005年,擔任美國「國家生命倫理諮詢委員會」委員。
桑德爾於80年代初期發表的作品《自由主義與正義的局限》,奠定了他的學術地位,公認為批判羅爾斯與自由主義的代表作。一般都將桑德爾視為社群主義的擁護者,他本人則於其代表作第二版開頭表示對此標籤感到不快,他是這麼說的:「只要『社群主義』(communitarianism)為多數決主義的別名,又或為不論所屬的社群、時間為何,權利皆依據某種優越價值思考的別名,那就不是我想擁護的見解。」因而傾向以「公民共和主義」(civic republicanism)取代之。
著有《自由主義與正義的局限》、《民主的不滿:美國在尋求一種公共哲學》、《正義:一場思辨之旅》、《反對完美:科技與人性的正義之戰》、《錢買不到的東西:金錢與正義的攻防》等書。

儘管強調價值是對的,用激勵言論彌補價值缺失的作法仍相當生硬,也說服不了多少人。其理由有二:首先,民主黨提出的社會和經濟政策以經濟正義為基礎,但他們始終無法清晰、堅定的描繪出經濟正義的願景。其次,即使提出強而有力的論述支持經濟正義,也不足以構成一套國家治理的遠見。提供人民平等的機會以共享富裕社會的成果,確實是良善社會其中一種面向。但光有平等還不夠,人們渴望一個意義更廣博的公共生活,這是平等無法回應的需求。欲達到自我治理(self-government),平等是其中一項價值,但平等無法滿足人們想要兼善天下而不僅是獨善其身的意念。(序, p.11)
本書中的文章主要在探討當代美國社會所面臨的道德與公民困境。第一部分「美國的公民生活」針對美國的政治傳統做了一番概述:自由派人士發現他們面臨「道德價值」困境,但這現象其實象徵了某種思潮逆轉;保守派不一定每次都能獨佔政治論述中以信仰為基礎的層面。在美國歷史上,針對道德與政治改革的大型運動──從廢奴運動到進步時代(Progressive era,此一時期約自十九世紀末至二十世紀初。當時美國出現了許多社會、政治和經濟方面的改革實踐,政府權力逐漸擴大。),再到一九六○年代的民權運動──其中幾次就利用道德、宗教和心靈的力量有效的促成改變。藉由追溯美國自湯瑪斯.傑弗遜(Thomas Jefferson)以降的政治辯論脈絡,這些文章揭示了自由主義如何喪失其道德與公民的立場,並且提問:在我們這個年代,自我治理的計畫能不能恢復活力?
第二部分「道德與政治爭辯」則把近二十年來一些最熱門的道德與政治議題搬上檯面,包括了優惠性差別待遇、協助自殺、墮胎、同志權利、幹細胞研究、污染許可證、總統撒謊、罪犯懲治、市場的道德限度、容忍與禮儀的意義、個人權利與社群主張,以及公共領域的宗教角色。一覽這些論戰的內容,有幾個問題多次浮現:在當代的道德和政治範疇中,個人權利與選擇的自由是最為鮮明的理想,然而單靠它們就能鞏固民主社會的根基嗎?我們可以忽略何謂良善生活的爭議,直接投入公共領域中道德難題的辯論嗎?如果(正如我的主張)我們的政治論述無法避開何謂良善生活的問題,那麼我們怎麼能夠應付當代社會中包含此問題的諸多爭議?
探討過這些道德和政治方面的特定爭議之後,第三部分「自由主義、多元主義和社群」退後一步,檢視當代較為突出的各種自由主義政治理論,並且評估它們的強項與弱點。這些政治理論公開且明確地描繪出道德和宗教上的理想,但同時又保有對於多元主義的承諾。第三部分的文章將貫串本書的這些主題連結起來,它所辯護的是一種更強調公民身分、社群和公民德行的政治,這種政治將更直接地面對有關美好生活的問題。自由主義人士經常擔憂,若是將道德和宗教的辯論帶進公共領域,將會面臨偏狹與壓迫的危險。這一部分的文章對於這種擔憂也做出了回應,它說明了實質的道德論述並不會與進步的公共目標產生矛盾;一個多元主義的社會並不需要逃避其公民在公共生活中所實踐的道德信念和宗教信仰。
在本書中,有許多文章模糊了政治評論和政治哲學之間的分界。它們為公共哲學開創了一個冒險事業,其意義有二:在今日的政治與法律論戰當中,它們為哲學找到了位置;此外,它們代表了在公領域中實踐哲學的嘗試──將道德和政治哲學搬上檯面,面對當代的公共論述。(序, p.12~14)

2015年1月15日 星期四

聆聽疼痛 Listening to Pain

聆聽疼痛
為痛苦尋找話語、慈悲與寬慰
Listening to Pain
Finding words, compassion, and relief
David Biro──著
彭榮邦──譯
木馬文化──出版
疼痛的時候,我們都是孤獨的。
聽疼痛說話,為存於體內的無聲戰場,找尋療癒的出口。 

Neoptolemos:
What’s this new agony suddenly? All these groans and sighs, what is it, Philoctetes?

Philoctetes:
Ahhh! You know what it is, my boy. You know!

Neoptolemos:
I know what? What is it?

Philoctetes:
You know what it is, you know. Ahhh!

Neoptolemos:
No, old man. I don’t know. What is it?

Philoctetes:
Of course you know. How could you not know?

Neoptolemos:
Your pain! It must be unbearable!

Philoctetes:
Unbearable, yes! Awful! Ahhh! Mercy!
Come, my boy take pity on me!

Neoptolemos:
What do you want me to do for you?

Philoctetes:
Don’t betray me, my boy! Don’t feel frightened by this pain and leave me behind, my boy. It comes and goes and then, when it’s tired of wandering about it comes back again. A dreadful pain!


──Sophoklēs《Philoktētēs》

《菲洛克忒忒斯》(Philoktētēs)是希臘劇作家索福克勒斯(Sophoklēs)的作品,內容描述希臘神話中神箭手菲洛克忒忒斯的故事。
Philoctetes (Sophocles)
via wiki
疼痛是很難表達的,語言和疼痛似乎就如電流的正負極一樣相距遙遠。雖然語言可以捕捉各式各樣的經驗,但是疼痛卻讓語言無能為力,我們嘗試尋找貼切的話語,但卻往往一無所獲。最後,我們只好使勁地擰著手,讓自己蜷縮在沈默之中。(p.12)
疼痛是如此真實地影響我們的生活,但因其強烈的「內向性」,讓我們往往找不到合適的話語形容、分享,從而陷入孤絕的處境。然而即使如此,史上諸多偉大的文學藝術心靈,甚或是平凡如你我的真實臨床病患,企圖碰觸、面對、克服這個令人難堪又無力的狀態者,卻不在少數。
我們究竟是基於什麼理由和動機,勢必挑戰這場巨大又無聲的內在戰爭?
透過本書,看疼痛如何表述、如何作用,如何在隱喻中偷渡,當我們願意聆聽,運用創造力和想像力回應來自身心的吶喊,話語的力量便能連結整個世界,讓我們從孤獨中突圍,在痛中分享、終而療癒。

痛 該怎麼說?

從演化觀點來說,疼痛是人類基本的生存機制,我們藉由疼痛警訊來保護生命、維持生存。然而弔詭的是,雖然我們不可避免會經歷各式疼痛,但其實並不了解它,這種內在的經驗無法言傳。當疼痛來襲,我們只能握拳咬牙,束手無策地等待一波波的折磨過去。

疼痛當然是一種生理現象,然而,當它發作時語言的派不上用場,無疑加劇了疼痛的威力。當我們無法精準地對醫生描述,也無法與親密伴侶分享這麼實質的苦難,那種孤單或不被理解就彷彿被拒於世間之外,只能任由巨大痛感吞噬自我及所有感知,只餘下疼痛本身。幸運的是,我們得以在書中見識到偉大的文學藝術哲學思想家們,是如何運用巧妙貼切的隱喻話語和論證,將這種經驗傳達出去,從中,我們也能學到這類溝通的可能性,讓話語成為一帖具體而有效的良藥。

我們或多或少都經歷過各種疼痛,但是透過文藝作品的語彙,以及真實臨床受苦者的描述,由身兼醫生與病人的作者來探討疼痛的多元本質,則是令人動容的閱讀體驗。當我們傾聽疼痛並努力說出來,你會發現:藉由與周遭的交流,痛楚在無形中被轉移、分擔了!語言讓我們走出黑暗,重新找回與世界的連結,意識到原來我們並不孤單;同時也讓我們更有信心,這場永無止境的「內在戰爭」終將平息,苦痛都會過去,黑暗的盡頭定然有等待已久的曙光。

大衛·畢羅以切身經驗,檢視吳爾芙、喬伊斯、狄金生、傑克‧倫敦等文學作品中的疼痛篇章,試圖探討疼痛的本質;同時列舉維根斯坦、梅洛龐蒂與古德曼等哲學家,如何從語言實踐的私人性與公共面著手,進行精彩的辯證;至於藝術家芙烈達卡蘿和孟克等藝術家,則透過畫布傳達無法言說的劇烈痛楚。當然其中最重要的,是真實如你我的普通病患,竟也藉由語言中的隱喻、偏移和聯想,來表述各種疼痛經驗。因此他發現,為了面臨疼痛時「有話可說」,人類發展出特定語言策略(隱喻)來指認、回應、轉譯這個對象,藉此建立人我連結,創造出與世界的「同在感」,從而緩解獨自受苦的寂寞,得到一種能寬慰我們的治療良方。
「疼痛這個永恆的生命磨難,給了我們一個非比尋常的機會。它促使我們在極端的時刻,以極端的方式回應和表達出我們自己。」
Edvard Munch, Skrik (1893)
via wiki

美國當代學者Elaine Scarry認為,挪威畫家孟克的作品<吶喊>最能完美傳達疼痛的意象。
畫作中的人用雙手從兩側擠壓著自己的頭,嘴巴張著碩大,一副要將痛苦吶喊出來的樣子。然而,他卻什麼聲音都發不出來。
沒有一個人──不僅船夫沒有,背向離去的那兩個人沒有,連觀看這幅畫的人們也沒有──聽見他的吶喊。

FACES Pain Rating Scale
via images.frompo

醫療人員常使用的,是以簡單的表情圖樣排列出來的「表情疼痛量表」(Faces Pain Scale):這個量表完全不使用描述性語彙,只把焦點放在疼痛的一個向度:它的劇烈程度。伊蓮·史蓋瑞認為疼痛會讓我們退化到「一種前語言的狀態,一種人在還沒學會說話之前的哭泣與吶喊。」事實上,不管在診所還是在急診室裡,早就沒有人在說自己的疼痛了,我們就是用手指一下表情圖樣,然後把疼痛的感覺吞進肚子裡。
女詩人艾蜜莉‧狄金生(Emily Dickinson)曾寫道,疼痛「有某種空白的元素。」而詩人奧登(W. H. Auden)在〈外科病房〉(Surgical Ward)裡描述的病人,他們活在繃帶的層層包覆之下,再也無法與人以言語溝通:「我們的真理用宣說,他們的是壓抑著不呻吟。」即使是文筆最抒情的散文作家維吉尼亞‧吳爾芙(Virginia Woolf)也不例外,她在1925年夏天的流感發作中,發現了自己的詞窮。於是她翻箱倒櫃,想從以前的名家作品中找到一些蛛絲馬跡。她驚訝地發現,生命中這麼平常的部分,居然被描寫得這麼少。她因此認定,文學關切的是人的心靈,而不是身體每天上演的戲碼。一說到疼痛,語言就變得匱乏:「試著讓一個受苦者描述他的頭疼,語言馬上就乾涸了。」(p.15, 16)

本書分為兩個部份。第一個部份探討了疼痛和它對人的影響,指出疼痛如何引發危機,逼著我們往內走,造成一種孤立無援的個人經驗,在我們和外在世界之間築起了一道高牆。與此同時,疼痛也讓我們無法將這樣的經驗與他人交流,藉以打破這道高牆的阻隔。儘管疼痛的存在(presence)讓人無處可逃,但它也有一種難以捉摸的不在感(quality of an absence),不僅缺乏描述語彙(亦即,語言的不在),而且也難以思索(概念的不在)。
只要找到疼痛引發危機的原因,我們就有可能找到解決的方法。在本書的第二個部份,我們會認識到,當我們面對難以捉摸的事物時,只有一條路可走:隱喻(metaphor)。隱喻就是用「已知」來說明「未知」,讓語言的「在」取代事物難以捉摸的「不在」,藉以照亮生命中那些難以通透的幽黯面向。這不僅適用於諸如疼痛之類的私人經驗,也適用於我們對上帝的信仰,甚至適用於科學上解釋客觀世界如何運作的各式新穎理論。在這些例子裡,隱喻不是用來裝扮語言的修辭裝置,而是想像力在為我們開拓一個共享世界時,不可或缺的強大資源。
從「隱喻」這個回應疼痛的一般性原則,我們將逐步指認出更為特定的回應方式。我會提出三種回應疼痛的隱喻策略,它們分別使用了三項我們熟悉的事物:武器、鏡子和X光。到目前為止,最常被運用的策略是伊蓮‧史蓋瑞所謂的「肇因式語言」(language of agency)。在這個策略裡,受苦者想像有一個肇因在體內移動,並且對身體造成傷害。當病人用「戳痛」或「刺痛」來形容疼痛時,就是使用了這一類的隱喻。第二種策略,是把疼痛投射到其他對象,包括周圍的人或非人物體,例如動物或樹木等。投射式隱喻(projection metaphors)可以讓受苦者藉由外界事物的驗證而更明白他們的疼痛。在第三種策略裡,人們藉由語言創造出身體內部的影像,我們將稱之為解剖式隱喻(anatomic metaphors)。我們可以這麼說,受苦者是以想像來穿透身體的皮囊,在體內為他們的感受找到某種根源。這些隱喻策略的共通之處在於,它們都有一種以「外在的、直接可感的事物」來取代「內在的、無法通達的事物」的欲望。
經過我們的抽絲剝繭,有一件事情變得愈來愈明顯,那就是「疼痛」這個生命的磨難,其實也給了我們一個非比尋常的機會,促使我們在極端的時刻,以極端的方式回應和表達出我們自己。透過隱喻來鍛造出新的想法和語彙,使得我們這些平常人也成了創作者,與孟克、狄更生和吳爾芙等藝術家沒有太大的差別。反過來說,在這樣的時刻裡與我們同在的那些人,就成了某種語言誕生之際的見證者。(p.18, 19)

在本書中談論疼痛的方式,可能會讓人以為它是被清楚界定的實體,雖然實情與此相距甚遠。十九世紀的法國小說家阿爾封斯‧都德(Alphonse Daudet)在回憶錄《傷痛之地》(In the Land of Pain)寫道:
關於疼痛,其實沒有一般性的理論。每一個病人都會有自己的設想,而且疼痛的性質也變化多端,就如同歌者的聲音,會隨著音樂廳的音響效果而變化。
都德是位三期梅毒的患者,指出在「疼痛」之下,其實包含了各式各樣的經驗,有急性疼痛和慢性疼痛,身體疼痛和心理傷痛,也有上述疼痛的不同組合(例如,身體疼痛造成的心理傷痛)。人們對疼痛的體驗各有不同,即使是同一個人,在不同的情況下對疼痛的體驗也不盡相同(依照『音響效果』或脈絡而有所不同)。我們也知道,不同文化的人賦予疼痛不同的意義,而在某些狀況下,疼痛甚至可能被視為正面的經驗。
然而,即使有這些差異,我認為疼痛在根本上有一個相同的結構。以最簡單的界定方式來說,疼痛是一種耗盡心力的內在經驗,除了它自身之外,每一件事情都面臨被摧殘殆盡的威脅──家庭、朋友、語言、世界、思維,最後是一個人的自我。疼痛發作時,就如同孟克筆下的受苦者從畫布向我們吶喊,除了疼痛之外什麼都不存在。如果用這個方式理解,即使疼痛的劇烈程度和特性可能不一樣,但本質上並沒有差異。(p.22)
Alphonse Daudet
via wiki
毫無疑問的,我設定的是一個理想的目標。然而,儘管我相信疼痛可以被語言表達,但是認定語言的交流總是行得通,卻是非常不切實際的。在最劇烈的時候,疼痛真的會耗盡它自己之外的所有一切。我在醫學院和研究所的階段,開始思考疼痛的問題,因為當時身體無恙,所以理所當然的,我只做一些抽象性的思考。不過,當我的疼痛教育開始要轉向實際,因為我不得不進行骨髓移植時,我天真的為這個機會感到雀躍不已。為了確保在兩個月的住院時間裡,不會錯過任何記錄疼痛的機會,我帶了紙、筆、電腦,甚至錄音機,以防我可能會因為太過衰弱而無法寫字。然而,儘管我有這麼遠大周詳的計畫,當疼痛終於開始襲擊時,即使嗎啡穩定注入我的血管,我還是像孟克畫作裡的受苦者,瘖啞無聲。我只想鑽到洞穴裡,閉上眼睛,直到疼痛,或是我,消失為止。
我無話可說。事實是,當一個人在劇烈疼痛時,他是無話可說的。在那樣的時刻裡,我們完全孤立、與世隔絕。只有在事後——幾個小時、幾天、幾週,某些例子甚至是幾年之後——語言才重新變得可能。都德在他最憤世嫉俗的時刻,對於用話語描述疼痛感受有沒有用,出現很大的質疑:「話語的出現,總是在事過境遷、塵埃落定之後。它們所指涉的不過是記憶,因此話語即便不是無力回天,也是虛偽不實。」
儘管我同意都德的看法,疼痛會將語言摧殘殆盡,但我不相信疼痛也消滅了說話的欲望。我也不相信事過境遷的話語總是無力回天或虛偽不實。相反地,這些話語是非常重要的。疼痛不會總是這麼劇烈,它往往是一波接著一波,而我們對於疼痛的覺察和回應也是如此。或許在疼痛高漲的時候,語言變得不太可能,但是當疼痛稍微低盪時,它會鬆開手,讓我們稍做喘歇。在那樣的時刻裡,受苦者迫切地想要逃離瘖啞無聲、孤立無援的洞穴,重新回到那個與他人共享的世界裡。蒂蒂安(Joan Didion)在先生過世九個月後感受到這樣的欲望,因此開始寫作《奇想之年》(The Year of Magical Thinking)。都德,即便有所保留,也以最動人的話語描述自己的疼痛。其他許多人也是如此,他們覺得自己必須要以任何他們想得到的方式,來填補疼痛所鑿開的空洞,不管是透過寫作,在支持團體裡向其他的病人吐露真言,還是在網路聊天室與人交流。在那樣的時刻裡,語言,這個我們最自在的表達方式,真的能夠療傷止痛,成為一種有能力寬慰痛苦的治療。(p.24, 25)

2015年1月14日 星期三

符號帝國 L'empire des Signes

符號帝國
L'empire des Signes
Roland Barthes──著
江灝──
詹偉雄──導讀
麥田──出版

當欲望跌進一條死巷,東京打開了千百個出口。

via 博客來

日本是書寫的國度,羅蘭·巴特在日本邂逅了最貼近他理念與狂熱的符號系統。
日本最能遠離西方符號驅力在我身上引發的一切厭惡、惱怒、拒斥。
日本的符號很強烈:令人激賞地井然有序、安排得宜、標示清晰,保有自主,從不西化或理性化。
日本的符號是空的:它的符徵逃逸了,在這些無償支配一切的符徵深處,無神、無真理、無道德意義。
值得一提的是,在日本,到處揭示著這種符號呈現出來的優越特質、高尚的自我肯定及情欲魅力,
一切表露在物品及最微不足道的舉止(那些我們通常視為毫無意義或庸鄙不堪的行為)之中。
因此,符號場域將不會透過它的制度面來探求:
重點不在於藝術、民間傳說,甚至是「文明」(我們不會將封建日本與現代科技的日本互為對比)。
我們要探索的主題,是都市、商店、戲劇、禮儀、庭園、暴力;我們要探索的主題,是幾個動作、幾道菜、幾首詩;
我們要探索的主題,是臉孔、眼睛,還有畫筆。
這一切,乃是運筆寫下,而非畫下來的。
──羅蘭·巴特
一九七○年,巴特宣稱日本將是符號產製與消費的終極國度。
如今,將此書置於日本戰後重新崛起、各類商品風行全球的脈絡,
會發現巴特或許無心插柳,卻極為精準地預言了日本當代文化經濟的核心構成:
操作符號、製造意義、深植人心。
這對與日本有著深刻複雜關係的我們來說,
正是重新探究日本有別於歐美、「另類現代性」的一個閱讀起點。

「文學的挑戰是:這作品如何關注我們、驚嚇我們、充填我們。」
──Jonathan Culler, Barthes: A Very Short Introduction (Oxford University Press, 2002), p.76.
「文學像是磷,即將死去之際會散發最大光輝。」
──Roland Barthes, ‘Writing Degree Zero, A Roland Barthes Reader, ed. Susan Sontag (Vintage, 2000), p.51.

《符號帝國》後的巴特,開始將寫作的主體和客體合而為一,他的「書寫」不僅要講述他想闡明的意旨,也同時就是意旨本身,換言之,當他要告訴讀者:「愉悅」pleasure太普通,你應該追求「狂喜」jouissance, Roland Barthes, The Pleasure of the Text (Hill and Wang, 1975), pp.4~5.之時,他此刻就必須「寫出狂喜」來。(導讀 p.18, 19)
「我」,你說而且你驕傲於這個詞眼,但是,更偉大的事物—你不願相信的—其實是你的身體,它有巨大的才智,它不說「我」,它執行「我」(performs ‘I’)!
──Friedrich Nietzsche, Martin Jay, ‘Roland Barthes and the Tricks of Experience’ , The Yale Journal of Criticism, (vol14, no2, 2001), pp.469~476.

如果要我憑想像虛構出一個民族,我可以幫它取個新的名字,宣稱它為小說裡的對象,開創新的卡哈邦(Garabagne,出自Henri Michaux的作品《Voyage en Grande Garabagne》,指架空的幻想國度。)。如此,就不必將真實國度折衷於我的幻想之下(但我在文學符號中所折衷之物,正是這種幻想)。我也可以──我並不想展示或分析任何與現實相關的東西(這是西方論述的主要模式)──在世界的某個角落(那裡),抽拉出一些特徵(此乃繪圖、語言學術語),透過它們特意創立一個系統。我將稱這個系統為:日本。(p.64
《符號帝國》書寫的對象是日本,包羅著二十六篇短小的散文,對應著巴特一九六六至六八年三次的日本旅行,雖然巴特因旅行而寫作了這本書,但它卻完全不是一本遊記,沒有可供讀者參照的旅行景點探訪,缺乏政治、經濟、社會的觀察分析,當然也沒有旅行文學的啟蒙老梗(我∕出發↓失去我∕旅程↓完成新我∕歸來)。巴特在第一篇〈遠方〉中就坦承,他無意去寫一個真實的日本,相反地,是「日本將作者推入寫作情境」,在對日本禪的領略裡,巴特體認到書寫就是一種「開悟」(satori),「是一種頗為強烈的震盪,搖撼知識及主體:它創造一種不言之境(an emptiness of language)」,這種脫離西方語言特徵的書寫,掏空了物件的意義,卻反而讓物飽含著單純的魅力,是這種照耀著他的繽紛光華,促使作者嘗試以一種「開悟」的理解,模擬著禪,來書寫他旅次所見的庭園、姿態、房舍、花束、臉孔、暴力。
二十六篇短文,切入的是日本的文化生活,從語言、食物、柏青哥、包裝、手繪地圖、木偶劇、鞠躬、文具、身體、俳句、筷子、身體、市中心到匪夷所思的眼臉、「這樣」(日語So)和車站。
單從閱讀的過程觀察,巴特要求讀者參與的,是一種「作者式」而非「讀者式」的閱讀(Roland Barthes, S/Z (Hill and Wang, 1974), p.5.),《符號帝國》沒有隱約共識的寫作套路、沒有預期中起承轉合的理解階梯,更無結論或啟示,讀者必須化身為作者,在閱讀的過程中「艱險」地建立起自身的況味。因而,尋常讀者往往會覺得意義不明,即便某些段落具有著淋漓盡致的閱讀快感,但習慣了傳統閱讀方式的中文讀者總會問:我讀到了什麼?在讀與非讀之間,我因它而改變了什麼?(導讀 p.20, 21)
在本書,我們不將東方與西方視為「真實」,而在雙方的歷史、哲學、文化、政治等層面貼近或對立。作者並非熱切地將目光停駐於東方的某種質素上,東方只是單純匯集了某些特徵,由於這些特徵所催動的那套互動模式,讓作者「沉醉」於一種前所未見,與法國文化大異其趣的符號系統概念中。在思考東方時,最重要的,不是尋找另一種符號、另一種形上玄思、另一種智慧(儘管這種智慧讓人滿意),而是追求符號系統正統規範之外可能出現的差異、轉化及革命。

陌生語言
我有一個夢想:認識一門外國(奇怪的)語言,卻不理解它;觀察它與母語之間的不同,卻無法透過言語的語詞、溝通或庸言俗語等社會表面因素破除差異;在新奇語言的投射之下,實際地認識母語之不足;領會那些難以想像事物的運作;在其他句法、結構的影響之下,拆解我們自身的「真實」;在言談中,發掘主體未測知的位序,挪動主體的拓樸結構;總之,進入那不可解釋的境界,感受那股震撼甚至不用削弱它,直到我們內在的每一分西方性步履蹣跚,且父權語言開始顫抖。這種語言從父執輩傳承而來,現在輪到我們也成為父親一輩,保有自身文化,精確地說,歷史將我們轉變為「自然天性」。我們知道,希臘語的主要結構,在某種程度上限制住亞里斯多德(Aristote)哲學的重要概念。反過來想,若是一種極為遙遠的語言閃現微光、深化視野,讓我們窺探到那些必不可少的歧異,那將頗為有益。(p.68)
這些事實及其他現象讓我們深知,不考慮語言的限制(語言的工具性質)而想藉此批判我們的社會,是多麼荒謬的一件事!這就像是想要消滅惡狼,卻舒服地躺臥在牠的血盆大口裡。這些悖離語法常規的實踐,至少有這樣的優點:試著去質疑西方語言的意識形態。(p.70, 71)
文具店 
日本的書寫文字豐繁,不再寫成一排,而是捲在卷軸中。這種書寫方式讓人想到繪畫,表意文字四方揮灑,細膩鑲嵌在紙面上。一言蔽之,刻劃在整個空間之中。如此一來,至少就其潛在意義而言,這種運筆風格延伸了真正的書寫藝術,它將不再是孤獨文字的美學勞動,而是符號破壞,使它奮力一揮、斜拋出去、揮灑滿篇。(p.184, 185)
書寫暴力
有人認為戰鬥者複誦的那些口號,不應該說出行動原因及目的(人們是為了贊成或反對之事而戰)──這樣會使語言再度成為表明理由的方式、行駛正當權力的保證──而應該只說出行動本身(「全學聯將抗爭到底」)。因此,行動再也不用依賴語言鞏固、遮掩、引導方向:讓自己變得純真無邪──那種外在的神正面貌超過戰鬥本身,就像一位頭戴飛尖帽(bonnet phrygien,俗稱弗里吉亞帽,又稱自由之帽,一種圓錐形軟帽,帽尖前彎,紅色乃其典型色彩。歐洲曾流行一種說法,在古代,獲釋的奴隸會配戴此帽,從此它便象徵解放,在法國大革命中,亦成為自由標誌廣為流傳。)的馬賽女人──配上純粹的聲音操作,行動感加倍,卻只是在暴力的容納空間之中,增加一抹姿態,讓它多一塊肌肉。(p.207, 211)

2015年1月10日 星期六

宇宙的鐘擺 The Clockwork Universe

宇宙的鐘擺
從天使魔鬼、煉金術走向科學定律,現代世界的誕生
The Clockwork Universe
Issac Newton, the Royal Society & the Birth of the Modern World
Edward Dolnick──著
黃珮玲──譯
夏日出版社──出版
via amazon

The universe is but a watch on a larger scale.
──Bernard de Fontenelle, 1686

少有時代像17世紀晚期般,讓人開始夢想秩序完美的世界。後來的歷史學家稱之為「天才的時代」(Age of Genius),卻鮮少著墨這也是個騷動的時代。這個莎士比亞的世紀到了尾聲,自然和超自然仍然密不可分,疾病是上帝所命定的懲罰,天文學尚未與占星術分家,認為天空中仍瀰漫著徵兆。 
眾所矚目的歷史舞台上,我們所見盡是危機和災難。德國在這個世紀初,遭逢後來我們所稱的三十年戰爭。此一平淡無奇的戰爭名稱,掩蓋了這場宗教戰爭所帶來的種種恐怖行徑,一批又一批燒殺擄掠的軍隊接踵而至,隨之而來的則是飢荒和疾病。一場內戰撼動了英國,1649年在倫敦,震驚的群眾看著皇室劊子手高舉斧頭,砍下國王的頭顱。1650年代,席捲了整個歐洲的瘟疫,在1665年來到了英國。 
在暗處,即將改寫世界的事件仍舊無人注意。很少人知道,更少人關心,有一小群受好奇心所驅使的人,正研究著天空,並在筆記本上塗寫著方程式。 
人類早已認識大自然大致運行的模式──日升夜落、月有陰晴圓缺、星星構成人們所熟悉的星座、四季更迭。但是人類也注意到,沒有兩天是相同的。「人類知道太陽會升起,」一如阿弗瑞德·懷德海(Alfred North Whitehead)寫道,「卻捉摸不住風向。」(Men expected the sun to rise, but the wind bloweth where it listeth.)人類援引這類「自然法則」時,心知肚明這並非全然正確的規則,而比較像是有例外存在、需要額外詮釋的經驗法則與指導方針。 
然後,在17世紀的某個時間點上,一個新的想法誕生。認為自然世界並不只遵循草率的模式運行,而是依照精確的、正式的、有數學規律的法則。雖然它看起來很隨意,有時甚至是混亂的,但宇宙其實是一個結構複雜並且運作完美的鐘錶機械裝置。 
宇宙大大小小的環節都受到精心安排,上帝不僅創造了世界,設計各種功能,還持續不懈地監督著。祂讓群星運作,並照顧每一個角落;祂為地球選擇了完美的自轉率和理想的地殼厚度。 
自然法則儘管無所不包,條列卻很少;上帝的操作手冊裡只有一、兩行字。比方說,當牛頓了解到引力如何作用,他所宣告的不是一項新發現,而是適用在所有事物上的「普世定律」。是這條定律讓月球軌道圍繞地球,讓箭鏃射向天空,讓蘋果從樹上掉下,而且這條定律將運動精準量化,而非僅用一般性的字眼來描述。17世紀的科學家堅信,上帝是一名數學家,上帝用數學符號撰寫祂的律法,而科學家的任務是找到解開符碼的關鍵。 
所有這些思想家有兩項共同特色:他們是天才,並且絕對相信宇宙是以無懈可擊的數學所設計出來的。本書接下來要說的,是一群科學家如何解讀上帝心意的故事。(p.16~18
via Deviant Art
將這群天才、社會不適應和古怪的人一把抓的正是「倫敦皇家自然知識促進學會」(The Royal Society of London for the Improvement of Natural Knowledge)的皇家學會(The Royal Society),這是世界上第一個正式的科學組織。這個嶄新的概念出現時,「科學」這個詞甚至還不存在。早期這段日子裡,幾乎所有啟人疑竇的科學問題如:火為什麼燃燒?山如何升高?岩石為何落下?……要不引發茫然的眼神回應,要不就是熱切的爭論。 
英國皇家學會的成員並不是世界上最早的科學家,早在此之前,科學巨人包括笛卡爾、開普勒和伽利略,都交出不朽的成績。但是在很大程度上,那些科學先鋒們是孤獨的天才。隨著英國皇家學會的興起──當然也要接受牛頓這個超級例外──早期科學發展的故事裡,相互合作遠多於孤獨的沉思。 
牛頓沒有參加學會最早的會議,但他註定有一天將擔任學會主席(他會以獨裁的方式治理學會)。西元1660年,他還只是一名鬱鬱寡歡的十七歲少年,備受煎熬地在母親的農場工作。不久之後,他起程開創他在劍橋的大學生涯,但即使在那裡,他也是默默無聞。隨著時間的推移,他將成為第一個科學名人,如同他那個時代的愛因斯坦。 
沒有人搞得懂牛頓這個人。作為一個奇特的歷史人物,「他的脾氣是我所知道最可怕、謹慎、可疑的」,一個同時代的人這麼說他。他一生對自己的生活守口如瓶、獨來獨往,從未與人發生親密關係,一直到他八十四歲過世為止。高度緊張的偏執狂如他,總是在瘋狂的邊緣搖搖欲墜,也曾一度陷入瘋狂。 
牛頓在個性上與皇家學會的其他成員相距甚遠。但是,所有早期的科學家有著共同的心靈景觀。他們飄搖在兩種世界之間,一個是他們出生成長的中世紀;另一個則是他們尚且只能窺見一角的新世界。這是一群聰明、雄心勃勃、充滿困惑又矛盾的人,他們一方面相信天使、煉金術和魔鬼;另一方面也相信宇宙遵循著精確的數學法則運行。 
假以時日,他們會推開通往現代世界的大門。(p.22, 23

煉金術,是科學追尋的神奇目標,它提供了可能是新舊觀念並存最突出的例子。煉金術的目標是要找到一種叫做「賢者之石」(philosopher's stone)的物質,儘管它不過是種液體,所擁有的魔力能將普遍的物質變成銀和金,任何人喝下去都將長生不死。17世紀,人人篤信煉金術,但沒有人比牛頓更堅持。他小小潦草的字跡佈滿一本又一本的筆記本,記錄他的煉金實驗。牛頓關於煉金術的大量紀錄約有五十萬字,差不多為《戰爭與和平》一書的字數。

「不管他的目的為何,我都不能夠理解,但是他在這段時間的痛苦與努力,讓我覺得他的目標超出了人類的藝術與工業所能及。」與牛頓一起研究的助理說。

在推崇進步概念的領域中,諸如此類對過往的藐視是很常見的。與其說這是反智,不如說是因為不耐煩。我們為什麼要研究古代的錯誤?所以,科學家忽略大多數前輩的研究,或將他們貶低為愚蠢的。只有極少數的天才例外,他們被視為是從今日穿越時空回到過去,就跟我們一樣,只是莫名其妙地發現自己戴上了假髮。

但是,他們與我們並不相同。

許多偉大的數學家都像牛頓一樣難懂。他們對絆倒身後的追隨者不屑一顧,援引山繆·強生(Samuel Johnson)的言論:「我已經為你找出論點,我沒有責任讓你了解這個論點。」有時候,展示成品、精煉修辭是出於審美的動機,就好像藝術家精心利用畫格子的方式幫助他找到對的比例。

而牛頓特意將《數學原理》一書寫得深奧難懂,他寫道,這樣他就不會被「對數學一知半解的人所打斷。」弄不懂的人無從批評。至於能夠理解他推理的人則將看到它的優點。

Nullius in Verba」或許是皇家學會的正式座右銘,但該學會成員高尚的性格只是曇花一現。他們都明白高爾·維達爾(Gore Vida)所說:「成功並不足夠,其他人還必須失敗」。

在講求實際的英國,「實用性」和「常識」是人們推崇的最高美德,喬納森·斯威夫特(Jonathan Swift)對數學的不屑態度廣泛受到知識份子同儕的贊同。但他不知道的是,他尖銳針對數學家的這一點是對的。這些愛作夢的人正如斯威夫特的直覺所顯示,是最危險的科學家。顯微鏡和望遠鏡是吸引眾人目光的精彩發明,《格列佛遊記》一書見證斯威夫特著迷於它們揭示新世界的能力,但新器具的發明只是這個時代一部份的故事。人們很快就會看見改變世界不需奇特的工具,只需一枝筆。

1913年,亞伯特·愛因斯坦(Albert Einstein)和他的妻子艾爾莎,在人們夾道歡迎下來到加州威爾遜山的天文台,那裡有世界上最大的望遠鏡。有人告訴艾爾莎,天文學家利用這個宏偉的望遠鏡確定宇宙的形狀。「嗯,」她說,「我丈夫利用的是一個舊信封的背面。」

科學家看待自己的工作是向上帝表示敬意的一種方式,但批評者不這麼肯定。天文學激起人們最多恐懼,當我們已經從最權威的書上知道天堂和人間的故事,誰還需要更新的天文學知識?進一步探討等於視聖經不過是資訊來源之一,可以像任何其他資訊來源一樣受到檢視與質疑。17世紀有個通俗的順口溜捕捉住科學家的觀點:「摩西五經不過是假設」(All the books of Moses / Were nothing but supposes)。
「還有什麼會是更荒謬和不恰當的,」一位神職人員厲聲說道,「比起發現有人將全副心思放在象限、望遠鏡、火爐,以及虹吸管和空氣幫浦,而非準備迎接死後永恆的生命?」(p.95)
科學就這樣激怒了那些認為它華而不實和荒謬的人,也得罪了認定它顛覆的人;而同樣重要的是,它幾乎困惑了每一個人。

伽利略堅持,「一本用數學符號寫的書」他說,任何不能用方程語言表達的「都不過是虛有其名。」
受伽利略影響的後代知識份子在今日仍擁護相同的觀點。「那些不了解數學的人很難體會自然之美,最深層的美麗,所引發的真實感受……」物理學家理查·費曼(Richard Feynman)寫道。「如果你想了解自然,欣賞自然,你必須要了解她所使用的語言。」

伽利略說,剝開世界的外觀,你會發現掩蓋之下的真正世界。世界單由運動粒子組成,就像撞球在廣大的球台上相互碰撞。這個單純的事實構成我們周圍所有複雜的事物。

科學史家C.C.Gillispie寫道,在伽利略和牛頓之後,科學「用度量數量的數學語言溝通,」這種語言「之中不存在好或壞,善良或殘酷……或是意志、目的和希望。」以「力量(force)」一字為例,「不再意味著『個人權力』,而只是『質量乘以加速度。』」

那簡樸、幾何的世界擁有自己的美麗,由伽利略和他的追隨者保持。問題在於大多數人無法理解。數學家熱切地認為他們的工作一如任何的音樂作品一般優雅、細微、豐富。每個人都可以欣賞音樂,即使他們完全看不懂樂譜。對數學圈外的人而言,也就是幾乎對所有人來說,高等數學是一首沉默的交響曲,只能昏昏沉沉地看著舞台上滿滿的音樂家賣力演出無聲的曲目。

在科學革命之後的幾世紀,隨著新的世界觀越來越站得住腳,詩人呼天搶地抱怨科學家讓世界失去神秘、變得荒蕪。「所有迷人之處飄逝/當我們用冷漠的哲學方式思考?」英國詩人約翰·濟慈(John Keats)這麼詰問。美國詩人與散文家華特·惠特曼(Walt Whitman)和許多人一樣,態度更加尖銳。「當我聽到博學的天文學家,」他寫道,他們談論數字、圖表和圖形讓他「疲憊又不適。」
一直以來,人類理所當然是宇宙的中心,世界為了我們的利益運行。這樣的想法已經不復可行。在新的世界圖像中,人不再是創作的巔峰,而是後來添加之物。少了我們,宇宙仍將以幾近完全相同的方式繼續運行下去。天空中的星星依循著軌道,無論人們是否曾經注意到,這些軌道都不會改變。在這場宇宙大戰中,人類的角色是一隻嗡嗡作響的蒼蠅,圍繞著華麗的古老大鐘打轉。(p.100)
亞里士多德的質疑解釋了世界,伽利略的追問則描述世界。 (p.100)

亞里士多德堅持人們並不「理解事情直到他們知道『為什麼』」,但伽利略完全不做此想。他宣稱,問事情為什麼發生「並不是調查的必要部分。」

伽利略、牛頓和他們的革命夥伴立即放棄另外一個令人重視的觀念。這次,他們要放逐的對象是眾所周知的常識。世人長時間所熟悉的事物一直被喻為是防止妄想最可靠的保障,新興科學家拒絕這個陷阱。「天空並不如表面上所見,天體運行也是,」一位現代歷史學家複述笛卡爾的意見。「整個宇宙都不是我們所見到的樣子。我們看見一個有品質和生命的世界。但這些都僅只是外在。」(p.102)

「新的哲學思維質疑一切,」身為詩人和牧師的約翰·多恩(John Donne)在一首詩歌中寫道。「將一切拆解成碎片,不復理解。」

Lost Cause / Beck


Jodie (portrayed by actress Ellen Page)
Beyond: Two Souls(video game for the PlayStation 3)

Your sorry eyes cut through the bone
They make it hard to leave you alone
Leave you here wearing your wounds
Waving your guns at somebody new

Baby you're lost
Baby you're lost
Baby you're a lost cause

There's too many people you used to know
They see you coming they see you go
They know your secrets and you know theirs
This town is crazy; nobody cares

Baby you're lost
Baby you're lost
Baby you're a lost cause

I'm tired of fighting
I'm tired of fighting
Fighting for a lost cause

There's a place where you are going
You ain't never been before
No one left to watch your back now
No one standing at your door
That's what you thought love was for

Baby you're lost
Baby you're lost
Baby you're a lost cause

I'm tired of fighting
I'm tired of fighting
Fighting for a lost cause

2015年1月2日 星期五

精準預測 The Signal and the Noise

精準預測
如何從巨量雜訊中,看出重要的訊息?
The Signal and the Noise
Why So Many Predictions Fail—but Some Don’t
Nate Silver──著
蘇子堯──譯
三采──出版
數據不會說話,是你在為它說話。
奈特.席佛 Nate Silver
他精通統計學,是美國當代知名的統計與預測鬼才。他從小就對數字與思考展現興趣與天分,六歲便開始預測棒球賽事。高中時代曾拿過密西根州辯論冠軍,後來進入芝加哥大學主修經濟學,並在大三前往倫敦政經學院研修一年。大學畢業後,進入安侯建業事務所(KPMG)擔任顧問。利用工作之餘,研發出一套創新的棒球賽事預測系統PECOTA,因為精準至極,甚至吸引棒球界聖經 Baseball Prospectus 於2003年向他收購。席佛也將他統計與預測的天賦應用於德州撲克,曾經短期內就讓他贏得上千萬元財富。

他在2008年美國總統大選之前成立了「五三八」網站,發表他的選情預測,獲得廣泛注意,隨後他在這個網站公布預測,成功預測歐巴馬勝選,而且是在50州的個別選舉結果中,49州預測正確,35名參議員選舉更完全命中。2012年的總統大選,他再度成功預測歐巴馬勝選,這次50州全部命中。2009年《時代雜誌》並將他列入「世界最有影響力的百大名人」。許多人對於他的統計模型與精準預測的技術都十分折服與好奇,本書是他首度公開自己的預測祕訣,以及他對各領域預測的研究與思考。

身處「巨量資料」(big data)時代,照理說我們擁有空前充足的資料,去做各項預測。但各行各業掌握最多資料的專家與決策者,卻都還是不斷做出失敗的判斷,這是怎麼回事?作者奈特.席佛指出,人的解讀比數字更關鍵,而預測最難的部分在於:人要懂得分辨出哪些是無意義的雜訊,哪些才是關鍵的訊號。誤把雜訊當訊號,做出來的預測,自然不會準確,甚至會造成嚴重的謬誤與損失!
數據導向的預測會成功也會失誤,要求更多數據之際,人更應該自我要求。 
  • 預設立場或過度自信,對預測來說,是非常可怕的事。
  • 預測不是在追求是與非,而是估算事情發展的「機率」。有精準的機率,才能做出有利的決策。
  • 做預測時,最怕一看見「有相關」就解釋成「因果關係」。(冰淇淋 vs. 森林大火)
  • 預測時不能忽略「誤差」,並要勇於承認有「不確定性」。 不然你會過度解釋,變成不精準的預測。
  • 根據預測出來的機率,做了最有利的選擇,即使最後結果不好,仍然是好預測。
  • 在很多情境中,不是一定要追求終極完美的預測,只要預測比競爭對手好,你就贏了。
  • 當大家不免被雜訊迷惑時,問問自己,你有什麼法寶,能讓自己更接近真相?跟著法寶走,不要跟著群眾走。
  • 有新的重大資訊進來時,能保持客觀,隨時更新的預測,才有可能是精準的預測。

這本書談的是資訊、科技,以及科學的進步。這本書談的是競爭、自由市場,以及思想的演變。這本書談的,是讓我們比任何電腦都還要聰明的東西,也是本探討人為錯誤的書。這本書談的,是我們如何一步步學會掌握客觀世界的知識,而我們為何有時又會倒退。
這本書談的是預測(prediction),也就是上述這一切的交集。這本書研究的是為什麼有些預測可以成功,為什麼有些會失誤。我希望,對於如何規劃我們的未來,我們可以得到多一點的了解,比較不會去重蹈覆轍。(前言, p.14)
最早的資訊革命不是微晶片出現後才到,而是因為印刷術。約翰尼斯·古騰堡(Johannes Gutenberg)於一四四〇年的發明,這也是一七七五年工業革命的起因之一。印刷術也早成了歐洲的啟蒙運動,以及美國共和政體的建立。
資訊總量快速增加,速度之快,讓我們對如何處理資訊的理解,還有我們分辨有用的資訊和假事實的能力都跟不上。矛盾的是,多了這麼多共享的知識,結果卻是加深了國家與宗教之間的隔閡。我們擁有「太多資訊」的時候,本能會採取的簡便作法就是選擇性處理,挑出我們喜歡的部分、忽略剩下的部分,找和我們做相同選擇的人結盟、與其他人為敵。(前言, p.16)
最熱中於印刷術的早期客戶是用印刷來傳教的那些人。馬丁·路德(Martin Luther)的《九十五條論綱》(Disputatio pro declaratione virtutis indulgentiarum, 拉丁語)並沒有這麼激進;類似的觀點早已經過人們反覆辯論。伊莉莎白·愛因斯坦(Elizabeth Eisenstein)寫道:真正造成革命的,是路德的論綱「不是只在教堂的門上釘著」。相反的,這些論綱用古騰堡的印刷術複製了至少三十萬次。
一五二四年到一六四八年,路德的宗教改革造成的教會分裂很快就讓歐洲陷入戰爭中:德國農民戰爭(German Peasants' War)、施馬爾卡爾登戰爭(Schmalkaldischer Krieg, 德語)、三十年戰爭(Thirty Years' War)、法國宗教戰爭(Guerres de religion, 法語)、蘇格蘭內戰(Scotland Civil War)、愛爾蘭同盟戰爭(Irish Confederate Wars)還有英國內戰(English Civil War)。一四七八年開始的西班牙宗教審判(Inquisición española, 西班牙語)或一五〇八年到一五一六年的康布雷同盟戰爭(The War of the League of Cambrai),雖然跟新教的傳播沒那麼相關,但也不可忽略。單是三十年戰爭就殺死了德國總人口的三分之一,而十七世紀或許是歷史來最血腥的一個世紀,只有二十世紀初期參堪比擬。

But men may construe things after their fashion, Clean from the purpose of the things themselves.
「人總是照自己的意思解釋事情,完全錯失了這些事情本身真正的意義。」

──莎士比亞(William Shakespeare)《凱薩大帝》(Julius Caesar
但是,莎士比亞的《凱薩大帝》可能讓人想起古代對預測的概念,我們可能詮釋它,讓我們可以從之得到好處,卡修斯(Cassuis)說:「有些時候,人是自己命運的主人。」(Men at some time are masters oftheir fates.),希望說服布魯斯特(Brutus)參與對抗凱薩的密謀。
「人是自己命運的主人」這樣的想法開始廣泛傳播。預測(predict)和預料(forecast)這樣的字眼今日多半能交互使用,但在莎士比亞的時代是不一樣的。預測是預言者對你說的話;預料則比較像是卡修斯的想法。
預料來自英語的日耳曼語字跟,預測則來自拉丁文。預料反映出的是全新的新教俗世觀,而不是神聖羅馬帝國的理想世界關。做出預料通常意謂著要在不確定的狀況下做出規劃。這就表示要能深謀遠慮、有智慧且勤奮刻苦,比較像是今日的「遠見」(foresight)。
這些特質跟新教的工作倫理緊密相關,馬克思·韋伯(Max Weber)認為這一點促成了資本主義和工業革命。