最近,人工智能(AI)成了一个热门话题。除了媒体的日益关注,还有许多企业竞相加入讨论。大众的议论大都集中在AI会不会取代人类的工作、会不会威胁到人类这样的话题上。然而,大多数人忽视了,AI技术的进步最终是为了落地到人们的现实生活中。在可预见的未来,AI不是打败人、取代人,而是更好地成就人、服务于人。
AI解放人力最终服务于人
自从人工智能融入人类社会以来,很多人都想知道人工智能是什么?它在我们的社会生活中扮演什么角色?总的来说,人工智能不是一个新的行业,它已有几十年的历史。它是为各行各业带来改变的技术手段。人工智能可以做人类不想做的事情,比如减少大量的人工重复性的工作,危险性的工作,或者人类做得不太好的工作:因为人类能力不够强、速度不够快,容易受主观判断、情绪影响等,这些都可以通过人工智能进行优化。
例如,繁重的科学和工程计算本来是要人脑来承担的,现在计算机不但能完成这种计算, 而且能够比人脑做得更快、更准确,因此,当代人已不再把这种计算看作是“需要人类智能才能完成的复杂任务”。人工智能的具体目标随着时代的变化而发展。它一方面不断获得新的进展,一方面又转向更有意义、更加困难的目标。
AI是一个比较泛的概念,定义并不是很清晰。最近几年AI技术的突破,其应用普遍聚焦在三个方面:人机交互的变革,即让AI看得懂、听得懂;场景应对或决策的自动化,如自动驾驶和医疗图像的智能诊断等;解决系统优化问题的大数据,如电网调度、物流和仓储等资源与效率的优化。
人机交互的变革可以说是人工智能这几年突破的一个重要领域。计算机发展至今,每隔20年左右就会出现一次人机交互的重大变革,我们现在已经来到了第三次人机交互改革的时代。在PC时代,人们与机器通过键盘和鼠标交流;在移动互联网时代,人们与智能手机通过手指操控屏幕交流;在智能时代,人们与机器之间是通过机器视觉和语音技术进行交互的。
在场景应对与决策方面,自动驾驶是一个很好的例子。自动驾驶系统通过车上摄像头进行路况识别,控制方向盘的操作与行车速度,能比一般人更可靠地应对路上的突发事件。又如在医疗场景,不同经验的医生有时候意见会不一致,如果通过人工智能的训练,诊断可以变得更可靠更准确,让医疗水平上升到一个更高的水平。大数据应用在很多工业领域,例如电网调度、物流和仓储优化等方面,都是利用大数据在最优化问题中找到最理想的解决方案。
腾讯公司一直关注着最前沿的人工智能相关的研究,同时更关注如何把这些研究切实地落地到现实生活当中。从研究到工程再到产品化,还有大量的工作需要攻克,例如一些边界用例的问题在研究阶段没有注意到,在工程和产品上都需要考虑。
我们平时在智能手机上用到的腾讯产品,有很大一部分都应用了不同类型的、先进的人工智能技术,主要有四个方面。
1.机器视觉应用。女士们非常喜欢的天天P图和美颜相机,借助的就是生成对抗网络(GAN)生成的最优人脸质感。QQ空间直播的视频挂件,应用了一些卷积神经网络(CNN)的研究成果,能够又快又准地完成五官配准,让用户在视频聊天中很自然地交流。然而我们在技术落地过程中发现,如果要在手机上运行该程序,就需要优化网络规模;如果要高效地进行五官配准,就需要解决物件抖动的问题,这些都是在工程层面需要解决的问题。此外,腾讯跟许多电影发行商有一些增强现实(AR)方面的合作,AR体验非常受年轻人的欢迎,也帮助提高了电影票房。扫图转文字是QQ最新发布的功能,得到盲人用户的点赞,因为他们在过去的聊天窗口中无法知道图片上的内容,添加了光学字符识别(OCR)和物体识别的功能之后,盲人在聊天中也能知道图片上的内容,如图1所示。
图1 机器视觉应用
2.语音音频应用。微信的语音转文字、QQ音乐的听歌识曲、企鹅FM的文字转语音等(见图2),让用户的交流更加便捷。在全民K歌的产品里,腾讯攻克了很大的技术难关,把人声和背景声分离开来,这与机器视觉中物品的分离有很大的区别。
图2 语音音频应用
3.个性化内容推荐。以QQ看点为例,全国各地每天产生的信息总数堪称海量,但屏幕尺寸有限,能给用户展示的新闻也不多。利用机器学习中的预测模型,腾讯能够自动结合用户画像和应用本身的数据对其用户进行个性化推荐,还可以根据用户的喜好,为用户推荐不同类型的新闻,如图3所示。
图3 个性化内容推荐
4.游戏AI。腾讯对于游戏领域的AI投入了相当多的人力物力,其核心技术包括环境感知导航、策划决策和多体系统协调,采用了深度神经网络+模仿学习+强化学习的算法。今年年初,腾讯的围棋AI产品“绝艺”在东京第10届UEC杯计算机围棋大赛首次亮相,以11战全胜战绩夺冠。像《王者荣耀》和其他需要协作的游戏,我们也借助机器人的力量帮助玩家在整个团队对战中有更好的体验。因为有巨大的计算量,《王者荣耀》游戏AI的难度和复杂度比围棋高数百倍,如何攻克多人协作的游戏AI难题,也是学术界热烈讨论的话题。腾讯游戏界面如图4所示。
图4 腾讯游戏界面
AI技术的意义在于驱动创新
在AI技术层面,腾讯将AI Lab、优图、腾讯云等的AI能力连接在一起,可提供超过20项的顶尖AI技术。但腾讯不止于AI技术的修炼,更注重的是AI应用带来的社会、经济、思想等层面上的进步。
作为“互联网+”的下一站,“智能+”将用智能的机器、智能的网络、智能的交互连接各个行业,创造出高效的经济发展模式和更人性化的社会生态系统。如今,越来越多的行业正在拥抱“智能+”的发展趋势。
如何更好地利用人工智能,行业的专业知识积累非常重要。比如在医疗领域,需要专业人士标注医疗图像;在工业领域,需要了解制造业的流程与成本结构。腾讯云通过开放一系列的智能服务来帮助不同的行业、企业去解决他们的数据问题。
这些智能服务不仅有利于企业自身的成长,也与我们的日常生活密不可分。基于腾讯云优图的人脸识别技术已经在不同应用场景中遍地开花。滴滴出行的“滴滴代驾”“滴滴顺风车”“滴滴出租车”等业务线都用到了人脸识别技术,通过对比滴滴司机人脸图片和司机注册照或证件照,可以进行司机审核验证。
联通运用我们的人脸识别技术,通过用户自拍照及后台身份证照片1:1对比进行卡片激活验证,开卡流程耗时不到1分钟。
现在儿童、老人走失情况特别严重,腾讯云与福建省公安厅共同打造了防走失平台“牵挂你”,利用人脸识别技术,提高了人脸搜索准确率,上线3个月已帮助124名走失人员找到了家人,截至目前已成功找回了431人。寻找走失人群不仅需要平台具备人脸识别、配对的能力,还需要跨年龄匹配的能力,因为儿童从出生到三四岁面容变化会很大,人眼都不一定可以准确地识别出来。腾讯通过积累的大量数据,能够很详细地记录一个孩子的成长信息,并能较好地解决跨年龄识别问题。腾讯云优图的人脸识别如图5所示。
图5 腾讯云优图的人脸识别
除此之外,我们平常去过的很多景区都可以“刷脸”入园,苏州影宿电影酒店能通过人脸识别自助办理入住,交警针对一些不配合的酒驾司机也可以通过人脸扫描确认其身份。在机场、高铁站也有不少人脸识别技术落地的案例。
腾讯云优图的OCR技术能力也在不断完善。在交叉领域的技术融合基础上,进行了多轮网络改良、模型精简和矩阵计算优化等,刷新了ICDAR2015四项世界纪录,适用于物流、金融、教育、交通、政务等多种行业。顺丰使用OCR识别服务,3小时即可识别2000万张快递手写运单,大大提高了效率,减少了人力的消耗。此外OCR还可以应用于证件类型的识别,比如身份证、驾驶证、行驶证、营业执照、车牌、名片等。
腾讯云小微是腾讯推出的一个智能服务开放平台,目前已经有超过300家客户接入,可以赋予硬件听觉、视觉感知能力,从而构建一个从云到端的“智能云生态”。
腾讯云的智慧交通方案,支持违规变道、违规停车、拥堵等常规事件检测,在自动化车辆监控及事件预警上达到业界领先。在车辆检测方面准确率不低于95%,车辆属性识别准确率不低于92%,达到了前五强。目前,腾讯还与很多城市合作,大量的路况数据能够帮助政府去更好地解决交通问题,提高道路资源的使用率。
在医疗图像诊断领域,腾讯觅影融合了腾讯内部AI Lab、优图实验室等多个团队技术,对早期食管癌智能筛查准确率高达90%。腾讯所提供的诊断能力可以跟很专业、很资深的医生的诊断水平持平,在某些领域的诊断准确率甚至超过了资深医生,分担了资深医生的部分工作。现在已经有很多三甲医院使用了我们的技术。让这样的服务普及到每一家医院,是我们一直以来追求的目标。
作为一个AI驱动的企业,腾讯在未来还会积极使用AI提升产品体验,改善运营效率,在安全防护上也要做到前沿,让AI更好地服务于人。 ■
(本文根据CNCC 2017特邀报告整理而成)
所有评论仅代表网友意见