由於晶片效能不断地提升,数位科技处理资料的能力也跟着水涨船高,因此大数据(big data)的应用越来越广泛,许多决策与行为都依赖大数据与演算法来实施。这是一个可悲的现象,也是一个迷信的时代,光是探究谁会拥有大数据?谁在制定演算法?民众就应该集体觉醒,切莫成为资料独裁(dictatorship of data)者的奴隶。只有人们不迷信大数据,并懂得如何反向操作还原真相,大数据才能成为你可使用的工具。

图为川普团队高级法律顾问Jenna Ellis,在11月19日的新闻记者会上,向美国民众说明采取法律行动的第一步。
(https://www.youtube.com/watch?v=vRoQPnsX6yA&t=263s)
图为川普团队高级法律顾问Jenna Ellis,在11月19日的新闻记者会上,向美国民众说明采取法律行动的第一步。

根据《大数据》一书作者麦尔荀伯格的定义,大数据要的是大杂烩的巨量资料,也就是搜集全部的资料,使得资料处理的样本等於母体。过去还无法搜集与处理巨量资料的时期,多是使用随机抽样的方法来预测,根据数学统计的原理,那麽误差只会在3%的范围之内,是一项相当可靠的科学方法。然而时至今日,各项抽样调查也屡屡失误,甚至与结果完全相反,民调已成为刻意操控的工具,客观的环境不复存在。

到了大数据时代,这项缺失可以改善吗?答案是或许可以,或许不可以,完全取决於人心。一般以为大数据是实在的,人心是空泛的,其实刚好相反,大数据才是空泛的,人心才是实在的,这样来处理大数据才可能回归本质。《大数据》一书提到:「巨量资料的一个核心概念,就是要以相关性,做为预测的根据。」找到相关性等於找到「缘」,事物的确是靠缘来运行或媒合,所谓:「有缘千里来相会,无缘对面不相识。」缘很不可思议,但没有「因」就什麽都不是。

大数据的相关性(correlation)是更为物化的概念,它不须要强调因果关系(causality),就能八九不离十预测事物的发展。虽然这很有科学根据,所谓:「同声相应,同气相求;水流湿,火就躁。」或是「近朱者赤,近墨者黑。」但你可能没有想过,事物也可以「出污泥而不染」或是「火焰化红莲」。大数据的相关性都来自於既有结果(data)的分析,然而没有种子(因),只有阳光、水、土壤等众缘,会长出花草吗?会有意义吗?

所有的根本正因来自於「心识」,这是近来科学界渐渐得出的结论与方向,所以不强调因果关系等於走向物化的不归路。每个人都有独立的心识,因不同,结果就会不同;意念改变,结果就会改变。当把事物的结果都资料化(datafication)後,可能把人心都蒙蔽了,变愚昧了,任由资料来操纵了。

所以,大数据有四种天生的缺陷,一是数据可能造假或不实,也就是所谓的因地不真,果遭迂曲,垃圾进则垃圾出,这是最大的问题;二是未来并非科技决定论,不仅测不准,实际还有无限可能;三是演算法只是一种面向,容易演变成先射箭再画靶;四是数据永远不可能完整,在无限的概念下,所有大数据都是小数据。

孟子说:「人之所不学而能者,其良能也;所不虑而知者,其良知也。」良知良能是人的根本,不需要大数据你也能做出判断,想想蚂蚁在大水来临之前就知道迁移准备,这不用靠Google,也不用问Siri。这次美国的大选,极有可能就是一场大数据的大诈欺,从荒谬的民调风向、主流媒体的偏颇报导、社群平台的操纵痕迹,到Dominion投票系统的数据疑云,以及最後显示的拜登突变曲线,种种违反常识的作为,有良知者不可能视而不见,这是数据操控者的傲慢,也是对人类智慧的挑战。

未来,在大数据时代,资料独裁者或许会遍布在金融巨鳄、科技集团、主流媒体与政党政客里,那麽世界的黑暗就会来临,这也是受听大众甘受资料化的结果,唯有放下对大数据的迷思,才有可能脱离物化,改变命运,走向光明。

图说

图为川普团队高级法律顾问Jenna Ellis,在11月19日的新闻记者会上,向美国民众说明采取法律行动的第一步,誓言将对本次选举是非曲直进行全面审判。同时也对主流媒体掩饰事实的傲慢提出了铿锵有力的批判。(https://www.youtube.com/watch?v=vRoQPnsX6yA&t=263s)