2013年11月12日 星期二

【每日分享】資料新聞學的舊與新




文/wolf

任何新的事物,都有可追溯的歷史源頭,現在廣受矚目的「新型態新聞報導」--資料新聞學(data journalism, 或 data-driven journalism)也不例外。資料新聞學最經典的早期例子不是發生在二十世紀的電腦時代,而是一百五十年前的英國,而報導者正是鼎鼎大名的弗羅倫斯.南丁格爾(Florence Nightingale)。

一般人都熟悉南丁格爾作為護士精神的代表,但可能不知道她的數學統計長才,並且被認為是第一位資料新聞記者。南丁格爾最有名的事蹟是投入克里米亞戰爭,參與英軍醫院的醫護事務。戰後她投身推動增進英軍的健康狀況,對於戰時的英軍的醫護統計數據進行了縝密的研究整理。

南丁格爾擅長使用圖表來表現數據,在報告中均能善用長條圖、圓餅圖,做出簡易明白的數據表現,用以說服不懂傳統統計報表的人士。其中最有名的例子,是利用她自身改良後獨特的「玫瑰」圖(因為誤會,也常被人誤稱為「雞冠花」圖),來表現英軍參戰頭一年當中士兵的死亡率。圖形以順時針環繞的十二個區塊表示一整年,各區塊表示死亡的士兵數量,不同的顏色則分別表示不同類別的死因。

透過這張圖表,南丁格爾呈現出一件荒謬的事實:絕大多數的死亡士兵並不是戰場上戰死(紅色區塊),而是死於原本可預防卻疏於照顧的傳染病(藍綠色區塊)。圖表中還呈現出另一項統計趨勢:自從英國衛生委員會於1855年3月前往庫斯台軍營改善飲水與通風狀況之後,士兵死亡率(圖片左側的環狀圖)隨即大幅降低,這顯示出軍營衛生與死亡率的直接關係。這些數量的趨勢,不是光去追蹤一、二位士兵死亡案例能夠獲知的,但是透過統計與適當的圖表呈現,卻可以讓人一目了然,這就是資料新聞學的威力所在。

這些士兵死因的資料有上萬筆,我們不難想見,一百五十年前的南丁格爾如何安排大批人力一筆一筆去計算,再用紙筆標尺辛苦地繪製出相應尺度的圖表。過去這種大型數據資料的整理與呈現,需要動用龐大的資源才能進行。但是現在透過至為普及的電腦與網路科技,個人也可以憑一己之力整理統計數據並且呈現出來。至於更多活潑的視覺效果呈現、讓讀者視個人需要微調圖像等即時互動,就更是過往沒有的嶄新可能性了。但是,資料新聞學從大型數據資料上去洞察難以個別察知的趨勢狀態,以及如南丁格爾般對人群的關懷,依然是歷久彌新。


沒有留言:

張貼留言