会议概述
2017年4月3~7日,第26届国际万维网会议(26th International World Wide Web Conference, WWW 2017)在澳大利亚珀斯市召开[1]。会议期间传来了喜讯,万维网创始人蒂姆·伯纳斯-李(Tim Berners-Lee) 1获得2016年度图灵奖。这个消息的发布,无疑给本届万维网会议带来了特殊的含义和使命。
万维网会议由伯纳斯-李于1994年创办,旨在探讨网络的最新发展等。W3Events总指导里克·巴雷特(Rick Barrett)和澳大利亚默多克大学教授里克·卡明斯(Rick Cummings)担任程序委员会主席。会议涵盖多种交流形式。
蒂姆·伯纳斯-李
蒂姆·伯纳斯-李是万维网的创始人[2]。鉴于伯纳斯-李对于万维网的卓越贡献,2017年4月4日,美国计算机学会公布,将2016年度图灵奖授予他。他的贡献包括发明了万维网、浏览器以及Web通讯协议。1989年,欧洲核子研究中心成为欧洲最大的互联网节点。这时,伯纳斯-李看到了一个重要的机会——让超文本加入到互联网。他利用当时运用在ENQUIRE系统中的想法创建了万维网,并设计实现了第一个Web浏览器。当时,这个软件既是编辑器也是服务器。1991年8月6日,第一个万维网网站在欧洲核子研究中心问世了,网址是info.cern.ch。在这个网站上,解释了什么是万维网,应该如何使用浏览器,以及如何搭建一个Web服务器。在随后的短短时间里,万维网开始迅速改变世界。1994年,伯纳斯-李在麻省理工学院成立了万维网联盟(World Wide Web Consortium, W3C),许多公司加入进来,共同制定万维网标准,推动万维网的普及和发展。
主题报告
WWW 2017会议邀请了发明家、作家、教育家、播音员、企业家马克·佩斯(Mark Pesce),雅虎研究院主管耶艾尔·玛瑞克(Yoelle Maarek)博士,平方千米阵列(Square Kilometre Array, SKA)射电天文学家梅勒妮·约翰斯顿-霍利特(Melanie Johnston-Hollitt)博士作主题报告。
WWW 2017主题报告专家(左起:马克·佩斯、耶艾尔·玛瑞克、梅勒妮·约翰斯顿-霍利特)
马克·佩斯在“万维网世界”报告中指出,万维网这一伟大项目已经取得了巨大的成功。如今,我们生活在两个世界中,Web世界和现实世界,现在我们要做的就是把这两者结合起来。第一步就是要深入思考Web世界和现实世界互相之间能提供什么,该如何放大对方的价值和能力。接下来要做的就是在现实世界中为Web找到一个最合适的位置。
耶艾尔·玛瑞克在“Web邮件没有死去,只是不再是人在操控”报告中指出,Web邮件的主要流量都由机器而不是人类产生的,这是Web研究者面临的主要挑战和机遇。应该研究Web邮件客户端要实现什么样的用户体验才能适应这一改变。
梅勒妮·约翰斯顿-霍利特博士是惠灵顿维多利亚大学天体物理学系主任,同时也是Peripety Scientific公司CEO。她的报告“驯服数据洪流,探索宇宙奥秘”讲述了大数据研究方法对她所在平方千米阵列的工作中的影响,以及她在一些新算法上的探寻。她希望这些算法不仅能用于探索夜空,也能够把大规模的数据转化为可用的知识。
研究论文和热点
社交网络分析依然是WWW会议上最热的研究话题。论文“GPOP: Scalable Group-level Popularity Prediction for Online Content in Social Networks”探讨了社交网络中一个非常重要的问题——预测在线文本的热度。早期的研究都是基于整个社交网络用户的普遍行为或者捕捉每个个体用户的行为,而此文的作者认为,以用户群组为单位的文本热度分析更具有必要性和实际可行性。论文的主要思想是先将用户聚类成比较紧密的群组,然后采用张量分解来完成文本热度预测任务。作者在Twitter.com和Behance.net两个社交网络上进行了实验验证,得到了非常好的效果,而且还发现了很有意义的用户群组。
日本静冈大学、日本先进情报中心项目以及日本北海道大学合作的论文“Exact Computation of Influence Spread by Binary Decision Diagrams”,其背景问题是通过评估社交网络中的影响力传播来估计病毒式营销中的口碑效应,在标准的随机级联模型中,精确计算影响力传播已经被证实为是#P-hard,所以一般都会采用基于模拟的蒙特卡洛方法来避免精确计算。作者提出了一种可行的基于独立级联模型的精确计算方法。在这个算法中,首先创建一些二元决策图来实现所有可能的影响力传播模式,然后用动态规划在这些二元决策图上计算影响力传播。作者在一些真实的社交网络上成功地验证了这一算法,精确地计算出了影响力传播。
对用户的行为建模是一个非常重要的研究问题。来自德国莱布尼兹社科研究所和德国科布伦茨大学四位作者的论文“What Makes a Link Successful on Wikipedia?”,研究了一个比较有趣的问题。Web上存在着大量的超文本链接,但是经常被点击的只是极少的一部分。什么样的超文本链接才会被经常点击到呢?作者迪米特罗夫(Dimitrov)通过分析大量的超链接点击数据后发现,用户有一定点击倾向性,比如更倾向于点击网络边缘的链接,点击语义上比较相似的文章的链接,点击位于屏幕顶部和左边的链接。当把这些发现当做贝叶斯先验加入到马尔科夫链导航模型后,模型的性能得到了显著提高。作者又成功地把这些加入到了经典的PageRank算法中。
其他还有计算健康、众包、推荐系统及语义与知识等方面的论文。
WWW 2017大会奖项
最佳论文奖
WWW 2017最佳论文奖颁给了加利福尼亚大学的施薇塔·简(Shweta Jain)和舍沙德海瑞(C. Seshadhri)合作的论文“A Fast and Provable Method for Estimating Clique Counts Using Turán¡¯s Theorem”。这篇论文利用图兰定理提出了一种叫做图兰阴影的结构,实现了图中任意大小的团的快速计算。
首尔时间检验奖
首尔时间检验奖颁给了“Graph Structure in the Web”[3],论文作者是谷歌的安德烈·布罗德(Andrei Broder)、IBM的拉维·库马尔(Ravi Kumar)、普拉巴卡尔·拉加万(Prabhakar Raghavan)、斯里达尔·拉贾戈帕兰(Sridhar Rajagopalan)和安德鲁·汤姆金斯(Andrew Tomkins)等。论文最初发表在WWW 2000上,并在当时获得了最佳论文奖。这篇论文对互联网结构的研究做出了两个重要贡献:它进行的大规模实验,显示Web节点是根据幂律分布的;论文描述了一种更加复杂的网络结构,也就是如今非常具有标志性的弓箭(bowtie)状。
未来展望
笔者参加WWW 2017有三个感受:首先,社交网络分析仍然是会议的主要话题,相关的研究还有用户建模、Web文本挖掘、网络安全与隐私等。目前社交网络分析面临的一个挑战就是如何设计有效的算法来应对规模越来越庞大的数据。其次,深度学习逐渐与大数据分析接轨。本届大会在推荐系统、语义与知识等领域已有一些工作采用了深度学习方法,这也是未来大数据领域研究方法的一大趋势。第三,与往年不同的是,本届大会创建了一个新的研究方向——计算健康,这充分表明大数据在医疗健康领域起到了越来越重要的作用,我们期待大数据为医疗健康带来巨大变革。
WWW是一个交叉综合性非常强的会议,多个学科都在这里得到了应用和展示。随着大数据时代的快速发展,我们也将面临越来越多的挑战,期待下一届在法国里昂举办的WWW 2018为我们呈现更加精彩的研究工作。 ■
脚注:
1 2017年4月ACM公布,蒂姆·伯纳斯-李获得2016年度的图灵奖。他也是英国女王授勋的爵士,麻省理工学院教授。
参考文献:
[1] http://www.www2017.com.au/.
[2] https://en.wikipedia.org/wiki/Tim_Berners-Lee.
[3] http://mp.weixin.qq.com/s/1d1CBx9gj5l5bVV3S1kiaw.
其他作者:陈华均
所有评论仅代表网友意见