2014年11月12日 星期三

《大數據》-席捲世界的資訊化革命

MBA103/柯淯仁
書本簡介
(圖片引用自)
 本書著重在帶領讀者探討巨量資料所創造出的不可測度價值,及巨量資料引爆科技革命時衍生的道德問題。隨著資訊科技不斷的突破,人們在日常生活中越來越依賴電子商品,也正因如此,科技技術為我們收集完整的資料,我們可以將得到的資料加以運用,透過資料的收集找出相關性。書中舉出透過巨量資料的分析,找尋疫情最嚴重的地區以及預測機票票價的漲跌情況幫助旅客省下一筆旅費。資訊科技不再只是提供人們溝通效率與生活便利,資訊科技也將給予人們更多的相關性的預測,但也同時帶來更多個人資料風險與人們間彼此的信任,因此巨量資料除了將帶領人們重新認識資訊科技的威力,也考驗資訊把關者的智慧。

巨量資料的魅力

 透過歷史資料的呈現,世界不再全然未知,資訊的組合帶來更多的價值,資料的「選項價值」註一一直是本書認為巨量資料的魅力之所在。選項價值可經由重複使用資料或是集合許多資料,找出有用的資訊及雙向解讀的方式,透過人類更多創新的想像,將平凡的資料創造出更大的價值,例如透過人們搜尋字眼推測出今年最流行的服飾,或是利用監視錄影器同時監督商品與了解消費者行為,都是藉由資訊結果幫助公司增加更多競爭優勢。

 巨量資料的核心在於可以透過過去收集的資料進行預測,就如亞馬遜書店網路商城的行銷手法,運用消費者的歷史購買資料,評估消費者喜歡的類型並加以推薦相關書籍,增加完成交易的可能性;而現今最新操作模式是將大量的數據搭配雲端功能進行演算,得到更多相關性的數據,如Google搜尋引擎每日紀錄來自世界各地使用者的搜尋紀錄。倘若能將這些資料加以利用便可創造巨大商機,如同書中提及Google的語音辨識、垃圾郵件過濾器、語言翻譯,其幕後最大功臣便是「資料廢氣」註二的概念,透過過往留下的使用資料,創造出更多人性化且更具效率的生活。

 科技所帶來的數據使我們有更多可運用的空間,我們不用受限於樣本數不足;換言之,現今許多資料的收集是樣本等於母體的概念,我們可以直接獲得整個母體的資料,更加了解消費者想要什麼進而滿足他們的需求。同時,我們也能透過資訊的預測創造出更多的需求讓消費者非買單不可,書中舉例來說,APP的遊戲軟體便是運用此原理,藉由用戶購買虛擬網路商店寶物資料,推估消費者喜歡的款式加以開發,提供用戶持續購買寶物金額,而成為網路排行榜上熱門遊戲軟體。因此,巨量資料的熱潮正影響許多產業未來獲利來源,它正改變許多公司原有的商業模式,而巨量資料未來的威力也是不可小覷,無法推測它究竟能發展到什麼境界。

潛在的道德風險

 資訊始終考驗人性,巨大資料的革命的確帶給人們許多效益,但更多時候伴隨而來的風險也是不可測度。在這場資訊革命中,潛藏著許多人與資訊的問題,許多時候道德、信任與否常是一體兩面,資訊所帶來的信任感與隱私權之相關議題,一直都被社會大眾議論著,是我們讓資訊科技監視我們,也讓它成為我們決策的重要依據;然而,一旦加入人的隱私權、自主權時,就變成一個沒有結果的死局,
沒人可以斷定何者較為重要。

 讓資訊科技成為決策工具是我們習以為常的事情,如果資訊的推測若真的如此有用,那我們是否就等於否定人的自主性,透過信用卡公司的資料推測去衡量一個人的信用程度,以降低借貸風險,形成資料獨裁的現況;我們賦予資料本身的權力成為決策的依據,我們寧可相信數據結果卻遺忘人性的自主權,不願相信人與人間的信任。因此,信用公司透過許多數據分析,將借貸者的過往消費紀錄進行運算,預測出未來的還款能力,但數據卻不能完全保證是否有無能力還款,過度依賴推測的結果可能使人與人間的信任逐漸消失,失去借貸原先的本意。

 此外,巨量資料是建立在使用者過去的資料,許多時候資料是採匿名化或在一開始便徵求使用者的同意,但事實上,卻常出現反匿名化或是資料被轉為其他用途,因此根本無法真正保障人們的隱私權。舉例來說,現今社群網站的普及造成許多人曝露過多個人資料在網路上,網站公司將用戶資料匿名化賣給對資料有興趣的公司進行潛在消費者分析,但大多時候由於我們提供太多資訊與高科技的網路,即使匿名化依然可以找出原始用戶的名字。資訊科技帶來的隱憂真的比我們想像的複雜困難許多,是我們必須刻不容緩地去面對的議題,因為它確實存在我們的生活中。

 資訊科技的運用越是發達,帶來的風險與考驗也是越發嚴峻,隱私權最終還是必須依靠使用者對資料用途負責,才能真實抑制資料被濫用的疑慮。此外,當我們越是依賴資訊預測便會讓我們的行為失真,書中以著名的麥納瑪拉註三為例,說明錯誤的依賴數據所帶來的下場,因此最終還是須依賴使用資訊者的智慧。

人性是領導科技的關鍵

 在巨量資料未成形前,我們信奉隨機抽樣,相信只要能夠落實隨機便可以真實預測結果;然而隨著樣本等於母體的世代來臨,我們必須承認資訊科技正面臨一場革命。在這場革命中我們以技術進步為傲,且享受數據帶來的爆發性優勢,但無可厚非的是,我們也需花費更多時間探討高科技下所付出的代價,凡是被量化的對象是個人,便牽扯到如何衡量一個人的價值,即使在強大的運算系統也不能準確算出個人價值、預測人的行為。因此。在科技背後的是人性,唯有正確的態度與信念,才能帶領人類繼續前進。

註一
選項價值:資料的價值在於使用者選擇其指定用途作為資訊呈現方式時,所創造出的價值總和。

註二
資料廢氣:使用者線上互動時所留下的數位足跡,如搜尋字眼、網頁停留的時間或是滑鼠點擊的紀錄,皆是資料廢氣的代表。

註三
麥納瑪拉是二十世紀中期管理者的代表,過度依賴數據只專注量化的結果,不在乎其他情感因素,二戰後被外聘到福特公司裡待任高階主管,在福特公司裡要求零件零庫存,最終導致員工將零件全倒入河流中丟棄。


沒有留言:

張貼留言