請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

大數據——數碼經濟的新石油

傳統經濟學形容生產有三個基本要素,即土地、勞動力及資本,這些物理要素促進生產,推動經濟增長。工業革命後,知識、企業家精神等成為非物理生產要素。自上世紀末,互聯網闖進人類生活,現已有如電力、汽車般成為生活不能缺少的基本配置。當下的數碼經濟時代,越來越多人相信「得數據者得天下」,數據成為關鍵的生產要素,而大數據更被譽為21世紀數碼經濟的新石油。

所謂大數據(Big Data)並非只是形容數據的數量龐大,而是有特殊涵意的。在我們身處的年代,大部份人都有手機,攝像鏡頭和傳感器無處不在,無時無刻都在產生數據。這些數據有眾多不同形式,大部分屬非結構化,組織散亂。面對如此龐大的數據,傳統數據處理軟件根本無法應付,只好忽略這些數據。

隨着近十年的技術突破,儲存及運算成本已大減,處理巨量數據不再是複雜又昂貴的事。透過大數據技術,我們可觀察、研究及追蹤行為及事件,在分析及應用後掌握未來趨勢,作出更精準、更全面的決策。大數據產業正是這種以數據生成、採集、存儲、加工、分析、服務為主的新興產業。

大數據特徵:數量速度種類

面對來自不同源頭、海量的碎片化數據,大數據分析在初期集中解決數據的三大難題──龐大的數量、快速的產生及多樣化的格式,這亦是大數據的3V特徵:Volume(數量)、Velocity(速度)及Variety(種類)。大數據的數量已不能用Megabyte(MB, 兆字節)、Terabyte(TB, 太字節)形容,而是達到Exabyte(EB, 艾字節)及Zettabyte(ZB, 澤字節)的級數。我們每日上傳至雲端的檔案量以十億份計算,相片量則以億計算,這已不包括音頻、視頻及交易等。每天全球創造的數據量高達2.5EB(即100萬兆,10的18次方)。

根據數據機構Statista的報告,全球數據量增速由2010年2ZB(10的21次方)增長至2020年64.2ZB,複合年增長率41%。Statista預測到了2025年數據量更達到180ZB。除龐大外,數量增速亦非常驚人,由最初一組組的數據發展至實時發生的數據也包括在內。由於每分每秒都在產生量數據,過了數年的數據已用處不大。現時要求做到即時分析並立即回應,才能發揮數據的最大價值。

中國大數據產業五年增兩倍

種類方面更是包羅萬有,無論是人類製作的表格、報告、音頻、視頻以及互聯網的所有事物,甚至由人工智能自動生成的數據亦已出現。這些多樣化的數據既有結構化的,亦有非結構化,甚至半結構化的,要在數據之間進行交互分析及尋找關聯性,難度甚高。

大數據的發展一日千里,除了最基本的「3V」外,近年加入兩個公認的新「V」──Veracity(真實性)及Value(價值)。Veracity關心的是數據是否造假、即使真確但紀錄是否準確、數據有無異常值等問題。至於Value,着重的是可否將數據轉化為有價值的東西。海量的數據價值密度低,要通過強大的機器算法挖掘價值。

「5V」之後,出現了Variability(可變性)、Visualisation(可視化)、Viscosity(黏度)、Validity(有效性)等「V」,甚至出現「7V」、「8V」,最誇張的是「42V」。其實,這些「V」是隨着大數據發展引伸出的問題,新「V」便是解決這些問題的方向。面對繁多的「V」,中國推動大數據產業發展,便訂下以「容量大、類型多、速度快、精度準、價值高」的「5V」作為大數據的主要特徵。截至2020年,中國大數據產業規模超過1萬億元。到了2025 年,目標是提升至超過3 萬億元,年均複合增長率約25%。

多國立法保障用家數據私隱

隨着社交媒體和各類流動軟件成為生活一部分,除了人臉圖像外,不少軟件都收集個人資料,如本地IP、GPS定位等。由於個人資料有價有市,互聯網企業洩露個人私隱時有發生,更曾出現在網上平台公然兜售「人臉數據集」。在多個國家,除了商業用途外,政治亦利用大數據,最著名例子是劍橋分析通過社交平台,收集個人資料從而影響選民的投票意向。

私隱一直是大數據時代要面對的問題,各國政府近年更重視保護數據私隱。歐盟2018年生效的《通用數據保障條例》(GDPR)是現時覆蓋面最廣的全球性數據私隱法規,任何處理歐洲公民個人數據的組織都要遵守,違反者最高2000萬歐元或4%年營業額的罰款。至於美國,雖然已訂立嚴格的數據私隱法,但沒有政策限制轉移,現時關於數據轉移只由州份各自規管。中國近年亦積極頒佈一系列數據保護法例。繼2017年《網絡安全法》後,2021年9月實施《數據安全法》,限制未通過安全評估的跨境數據轉移。《個人信息保護法》亦在同年11月生效。三法聯動開啟了中國數據安全及保障私隱新時代。

大數據時代來臨已是無法改變,個人隱私亦已無處遁形。除了政府加強法例保護外,個人必須提高警覺,養成個人資料「非必要不提供」的習慣,不要貪方便,令個人資料任人取用。大數據發展最重要的是思維方式,是一種「用數據說話、用數據決策」的精神,如果未能從數據中獲得有價值的洞悉,再多的數據也是無用的。

作者:香港中國商會常務副會長陳亨達

查看原始文章