如果没下雨但起风,要不要出门去玩?发折价券能让多少客人回流?为什么脸书好像都知道我最近想要做什么?近年来耳熟能详的“大数据”,其实就是要解决我们日常生活中会碰到的各种问题,差别只在大数据背后,靠的完全是数学运算的力量。

数学跟电影《露西》最后的结局一样,“无所不在”。今年年初轰动武林,惊动万教的 AlphaGo ,就是这个概念最新的体现,透过四种技术向人类学习智慧:云端运算、大数据、人工智能、以及机器学习。

云端运算就是分散式的平行运算,借由云端上分散于各处的 CPU 跟 GPU 综合运算,打败单兵作战的单机电脑或个人。大数据分析则是借由熟读十几万个棋谱棋局,再经过自我对弈,无限复制学习经验。人工智能则是透过深度神经网络 (DNN) 跟蒙地卡罗树搜索 (MCTS) 等算法,在有如恒河沙数般的所有可能性里,策略性地找出**解。这些就是 AlphaGo 这台机器,得以产生类似人类学习能力的技术。

大数据的技术,涵盖了统计学、资料科学、资料工程,这三大领域的学问,试图透过分析资料,获得预测结果,并且从中选出较佳的决策进行推荐。这并不是新鲜事,大数据之所以火红,在于它采用了新方法来处理这些过程。比方说同样是资料分析,大数据还会根据使用者的行为,分析资料与行为之间的关联性,并尝试建立出一个模型。奥巴马两次胜选就是应用大数据的成功案例,他的竞选团队利用大数据,找到能够吸引选民的诉求,另外还能增进募款跟广告的效率。

算法是大数据分析的核心,也就是机器如何透过学习,获得类似人类智慧的过程。举凡透过是非题的决策树进行分类,借由回归预测数值,用分群的概念做行销规划,都是透过算法,试图得到更准确的结果。其实这件事我们在日常生活中都在做,只不过在大数据的辅助下,可以把算法的力量发挥得更加淋漓尽致。

当大数据的技术益发成熟,人类智慧与人工智能的差异愈趋缩小,那么人与机器在思考上,还会有什么不同?机器必须遵循逻辑,而人类可以容许矛盾的存在,这大概是大数据的发展再怎么日新月异,也无法改变的本质吧!