大数据为人文科学提供了新视角,革新了人文科学的传统范式,模糊了人文科学和自然科学的界限,使之呈现出文科理科化趋势。计算社会学、语料语言学、数据人文学等交叉学科相继出现并蓬勃发展。在这样的趋势和背景下,由浙江人民出版社2015年9月出版的《可视化未来》(Uncharted)一书,作为一面透镜,展示了大数据在认识人类语言、历史、名望、记忆和文化等方面的透视作用,在宏大的人文视角下,用“冰冷”的数据将人类文化“鲜活”地呈现在我们面前。
书中有一明一暗两条主线。明线是作者埃雷兹·艾登(Erez Aiden)和让-巴蒂斯特·米歇尔(Jean-Baptiste Michel),通过谷歌数字化图书中的n元词组对语言演化和人类文化进行的探索之旅;暗线是作者抽丝剥茧式地拨开这些人文科学问题的层层面纱,并以数据为手段将其作为自然科学问题加以求解的历程。这两条主线交相辉映,使用大数据在最大尺度上对人类文化进行量化,带领我们在人类文化的未知水域上航行。作者通过大数据向我们展示自然科学之普适,人文科学之魅力。全书脉络清晰,通篇读下来可谓是一场科学和文化相互交融的旅行。
该书的一大特色是用图表说话(如图1)。书中数百幅图表,以最直观的方式回答了很多看似毫无头绪的复杂问题。例如,不规则动词是如何逐渐消失的?技术传播有多快?数据和上帝,人们更相信哪一个?名人们更多地是少年成名,还是大器晚成?如何自动地检测出舆论压制?如何预测人类历史的未来?如何进行合适的职业选择?回答这些问题的图表,可以说是一部人类文化的连环画。它们简单易懂,而且读者还可以通过在线的n元词组查看器,方便地生成很多类似的图表,满足我们对人类文化各个方面的好奇心。
图1 大数据揭示语言演化
作为该书的译者,在翻译本书之前,我刚从美国东北大学巴拉巴西教授的复杂网络研究中心访学归国。和网络科学奠基人巴拉巴西教授一起从事科学研究的这段经历,使我对科学的认识越发清晰,研究套路日益成熟。我开始反复思索:数据驱动的科学发现在大数据时代到底面临哪些机遇和挑战?作为科研人员,在应对这些机遇和挑战时又该做出哪些改变?恰在此时,我阅读到Uncharted这本书,并被书中介绍的科学研究范式所深深吸引,一气呵成读完之后,大有相见恨晚、茅塞顿开之感。
受湛庐文化委托,我欣然接受了这本书的翻译工作。和初次阅读时的狼吞虎咽不同,我在翻译过程中细致品味了该书的行文思路和细腻笔触,领略到了作者在处理数据共享和隐私保护矛盾时的睿智——数据投影,也体会到了作者将一个工具拓展到多个应用场景的敏锐——数据形态。在这个过程中,我深切体会到并逐渐坚信,数据科学作为一门学科,在不久的将来会逐渐成形,以数据为研究对象和主要驱动力的科学范式将成为很多科学研究的主流,而首先发生变化的将是人文科学。大量人文学科将以数据为纽带和自然科学融合。计算社会学、计算传播学、计算文化学、计算历史学、计算人类学等传统人文学科和计算技术的结合,将会蓬勃发展,大放异彩。社会计算、城市计算、群智计算等将会快速发展,并深刻影响甚至改变我们看待社会的方式和社会生活方式。正如书中所说:“大数据正在革新自然科学,改变人文科学,并重新定义业界和学界的边界”。
该书的中文译名原本是想命名为“未知”的,后经斟酌,认为“可视化”一词更能体现该书“图表式”刻画人类文化演化的特色,于是定名为“可视化未来”。“未来”或许不太切题,这也是我关于这本书的一点遗憾吧。 ■
所有评论仅代表网友意见