James
James 书航,航通社创始人

看了百度的年度 AI 秀,我们总结出今年全球 AI 三大趋势

看了百度的年度 AI 秀,我们总结出今年全球 AI 三大趋势

AI 将更多地模拟真人;可用性越来越强;与人类劳动呈现竞争与合作相伴的关系。

文 / 书航 2020.9.21

9 月 15 日举行的“百度世界 2020”大会展现了百度过去一年的 AI(人工智能)布局及成果,为国际 AI 大厂年度“交作业”补上了一片重要的拼图。

谷歌、微软、亚马逊等实力雄厚的科技巨头,是全球 AI 产业的重要驱动力量。这些头部公司大多会每年一次集中发布新技术和新产品,每次都成为预测全球 AI 趋势的风向标。

受疫情影响,今年的谷歌和 Facebook 开发者大会取消,但是苹果、微软 和亚马逊等还是分别在线上发布 AI 相关进展。通过巨头们今年的各项技术发布,全球 AI 业界的三个主要发展趋势也逐渐清晰起来:

  1. AI 将更趋向于模拟真人,包括模拟语音、动作和性格。
  2. AI 在不断训练之下会变得更有用,可靠性更高;同时越来越不依赖云端,而是在本机和低功耗设备上运行。
  3. AI 将从事更多重复的事务性工作,人类与 AI 的分工合作也同时增加。

今年的“百度世界”都发布了什么

“百度世界 2020”定档 9 月,是国内疫情防控常态化的又一标志。3 个小时的大直播与央视新闻联合呈现,由康辉坐镇主持,多位央视新闻名嘴作为“AI体验官”全程参与。

让媒体感到新奇的是,百度安排大家在“分会场”——一家电影院的 IMAX 厅观看直播,这不禁让人想起去年央视携手全国影院以 5G+4K 直播国庆 70 周年阅兵式的情景。

img

无人驾驶、小度助手、度晓晓、虚拟人

会上的主要发布包括:

(1)无人驾驶:百度 Apollo 在首钢园区现场演示了完全无人驾驶所包含的三大要素:前装量产车、AI 老司机(即不配备安全员的“主驾无人驾驶”)、5G“云代驾”。当路面路况有变动或交通管制等情形时,车辆可由云端驾驶员远程控制来“平行驾驶”。

(2)小度助手:小度助手(DuerOS)版本升级到 6.0,公布数据称月交互次数超 58 亿次,有 4.2 万名开发者和 4000 多个优秀技能。大会展示了小度的三个主要场景即家庭、酒店地产、车载。此外发布了首款搭载小度的真无线智能耳机,为小度补充了第四个场景——随身。

(3)百度移动生态的服务化、人格化:大会介绍了百家号、智能小程序、托管页的相关进展。百度知道、文库等 U/PGC 平台正陆续和百家号体系打通。专家、达人通过百家号开设的直播会在百度搜索结果页优先展示。百家号创作者数量已达 340 万。

大会还发布了创新搜索产品“度晓晓”,这款手机上的养成类虚拟助理App建立在小度助手的能力基础上。随着用户的使用,“度晓晓”可以形成不同的性格。

(4)百度大脑 6.0:大会展示的终端虚拟人“小康”“小李”融合了视觉、语音、语言、知识等多模态的百度大脑 AI 技术。和同类产品相比,它们的“认知能力”有很大提升,生成和展示门槛也大大降低,有助于打造具有人情味的下一代虚拟客服。

百度大脑目前开放了 270 多项能力,聚集了 230 万开发者。飞桨深度学习平台和昆仑通用 AI 处理器,标志着百度掌握了 AI 核心底层技术。会上还展示了山东电力、森林防火、央视新闻等 AI 应用案例。

可以明显地感受到,现在提及全球范围的 AI 巨头时,人们越来越频繁地提到百度。有些时候,百度还可以作为其中唯一的中国企业代表。去年《哈佛商业评论》中文版发布的《2019 人工智能专项调研报告》显示谷歌、苹果、微软、百度、亚马逊为 2019“全球 AI 五强公司”。

img

2019 全球 AI 五强公司

虽然当今任何大型科技企业都会触及 AI,不过很多巨头的 AI 实践是分散在主营业务之内,随业务的发展而发展。百度则很明确地以 AI 作为发展方向,其业务线均围绕 AI 能力展开,并反哺 AI 能力的进一步增强。

李彦宏在 2017 年表示百度“是一家人工智能公司”,此后多次承诺增加在 AI 方面的投入。即使受疫情影响,百度也没有削减研发预算。2020 年 Q1/Q2,百度的研发费用分别为 44.43 亿元和 48.39 亿元,与当季总营收的比值分别为 19.71% 和 18.59%,均是近年来的高位。

根据沙利文公司(Frost & Sullivan)《2019 中美人工智能产业及厂商评估》报告,百度、阿里、腾讯和华为等综合型厂商在计算机视觉、自然语言处理、语音识别等核心技术领域均有布局,同时加速基础层软硬件的布局和追赶。

img

中美 AI 厂商布局表

在此基础上,在智慧城市,智能客服与营销,智慧医疗,智能营销,智能制造,智慧能源,智能制造等方面,百度均有自有布局。至于 Apollo 在出行方面的成就,更增添了百度 AI 版图的完整度。

从大厂动向看今年的全球 AI 三大发展趋势

疫情改变了全球科技企业的新品发布节奏。受疫情影响,今年的谷歌 I/O 大会 和 Facebook F8 开发者大会宣告取消,但是苹果 WWDC、微软 Build 和亚马逊 Alexa Live 2020 等还是在线上举行。

今年已经走过三分之二,此时召开的“百度世界 2020”可以说为国际 AI 大厂的年度“交作业”补上了一片重要的拼图。接下来还会有微软的 Ignite 和 AWS re:Invent 等活动,苹果还缺一场秋季发布会;谷歌也计划推出新的手机和智能音箱等。

今年各家 AI 巨头都省略了开发者现场参会的环节,变成视频和“PPT发布”,有的直接群发新闻稿了事。总体上说,今年它们带给开发者和市场的新东西都不多;更重要的是,疫情及远程办公也降低了工作效率,拖慢了内部研发和硬件制造的进度。

除小度之外,几大语音助手 Alexa、Siri、Google Assistant 也都趁机宣布了最新的用户数、装机数和开发者数量,但微软的 Cortana 则退出了消费者端的竞争。在用户分布方面,中美两国继续保持着“划江而治”的状态,尚未出现什么产品可以广泛打入对方的市场。

看完百度世界 2020 之后,结合其它国际 AI 大厂今年的各项技术发布,全球 AI 业界的三个主要发展趋势也逐渐清晰起来:

① 人工智能将更趋向于模拟真人

其实 AI 每一年都在尝试模仿真人的音容笑貌,但 2020 年可以说是厂商们在拟人 AI 研发方面取得突出进展的一年。像是沙特“机器人公民”索菲亚那样的“实体 AI”尝试暂时消停了,但在屏幕内出现的三维形象,则在飞速跨越拟人形象的“恐怖谷”,变得越发实用。

AI 对真人的模拟包括语音、动作和性格。显然,语音方面的拟人 AI 技能现在已经“点满”,AI 客服在日常生活中已被大量应用。更多人会与 AI 互动,即使自己还没有意识到;但反过来,在我们不认识 AI 的同时,AI 会认出我们。

2018 年,航通社参观世界机器人大会,对服务型机器人的进展深感失望。迎宾、业务办理、服务员等类人形机器人,几乎无一例外的选择特别低幼的,长得像喜羊羊一样的卡通脸,露出傻乎乎的,近似“面瘫”的笑容。

img

2018 年机器人形象和 2020 年 Vtuber

如今,厂商们终于具备了跨越 “恐怖谷”,向人形 AI 这一高峰进军的决心和实力。过去一年诞生了众多虚拟偶像(Vtuber),而一些由人控制的 3D 形象,在需要采集人类动作时也不需要大量的传感器,只要用手机摄像头,甚至是一些录制好的视频片段就可以了。

在百度世界大会宣布上线的虚拟助理“度晓晓”从2019年开始研发,她的造型、动作和语音都已经非常自然,知识储备更丰富,应答也更接近真人。

img

百小度、小度、度晓晓

用户见惯了多种 AI 助手之后,口味也更为挑剔。从 2015 年搜索框旁的机器人“百小度”,到语音形态存在,外形也是机器人的“小度”,再到 3D 人形 IP“度晓晓”,技术难度不断加大。

对人类性格的模拟也将帮助AI越来越多地用于创建电影、音乐和游戏。2019 年五四青年节晚会,百度帮助打造的虚拟主持人“小灵”亮相。一年以后,百度世界大会上的虚拟人“小康”技术水平又有了重大提升。

img

小灵、小康和小康的原型——90 年代的康辉

现在打造虚拟人不再需要录制长时间的视频,只需要几分钟现成的视频资料即可,而且它的对话能力也更强,两个虚拟人之间可以“机机对话”。虽然还是略显尴尬,但已经不至于出现停顿和“乱码”了。

今年很多家开发的 AI 助手在“认人”方面都有了新进展,认出不同的家庭成员成了新的“基本功”。小度助手(DuerOS)6.0 增强了根据音色区分家庭中不同成员的能力,并且只需要录入 20 句话,就可以模仿父母的声音给孩子讲故事。

此外,语音助手也在更努力地学习人类的交流逻辑,例如识别模糊化的指令。人与人交流的时候,对同一种事物有多种不同的表达方式,有时可能会相当模糊,对这种模糊指令的识别一直是一个难点。

7 月 22 日,亚马逊线上举办了 Alexa Live 2020 开发者大会。本次 Alexa 发布了 31 个新功能,其中基于深度学习的多轮对话开发工具 Alexa Conversations,可以让语音助手的交互体验更加自然。

基于此,用户可以不用清晰记得技能的名称,只要大概说关键字让 Alexa 推断你的意图,就可以调用技能,使用更轻松方便。如果 Alexa 不能完全确定时,将会与用户确认,随着持续深度学习和训练,效果会更精确。还有,现在 Alexa 在执行一项任务的同时,还可以在中途暂停,等过段时间回来还会继续原来任务的进度。

② 人工智能将越来越有用

随着真实模拟的精度和可用性提高,数据变得更加准确和可用,人工智能变得越来越有用。例如,个性化推送将越来越多,成本也降低;AI 越来越处于“边缘”而不是云端,即在本机完成、在低功耗设备上运行。更多设备(包含物联网设备)将运行 AI 驱动的技术。

现在我们生活中最常用的网络服务,已经淘汰了大多数的手动推荐位,走向“千人千面”,这意味着对 AI 算法推荐的越来越信任和依赖。

本周有消息称,手机淘宝客户端将全面“信息流化”,原本顶部显眼的焦点图展示广告将和页面中部的聚划算、百亿补贴、淘宝直播、有好货等板块一起,融入算法推荐信息流“猜你喜欢” 。

img

手淘改版对比图 / 晚点 LatePost

疫情期间,百度内部聊天工具百度 Hi 升级为办公平台“如流”,加入了钉钉、飞书、腾讯会议、Teambition 等企业协同工具的战场。除标配的音视频会议、文档协作等功能外,如流最差异化的特点是它的知识管理功能。

如流的知识库搜索利用了百度擅长的搜索技术,同时基于知识图谱等 AI 技术实现个性化推荐,不同层级、岗位、知识背景、所属项目的员工看到的知识流将不相同。

img

如流知识管理界面

近年来,AI 巨头们越来越重视让 AI 算法以更节能,更省算力的方式达到和未优化前同样好的效果。

苹果应用在操作系统内的 AI 能力如自动生成相册、剪辑视频等,均可以离线由自带 AI 芯片完成;谷歌从去年 I/O 大会开始,也强调一些初步的 AI 运算可用本机算力完成。

这次百度世界大会展示的终端虚拟人“小康”和“小李”分别模拟了二十年前的康辉和李彦宏,相比之前的版本,虚拟人的生成门槛降低,只需要几分钟的视频资料;同时计算量降低,普通手机也可以正常运行。由于其具备认知能力并可“机机对话”,也减少了由真人调教,继续投喂信息的训练量。

在物联网、新基建、5G 等大背景下,AI 的训练量加大,算法日益精准,也让人们越来越信赖 AI 从事一些重要的工作。这次百度世界大会展示了一系列 AI 应用大规模推广,和用于重要岗位上的案例。

百度 Apollo 在全球27座城市进行了里程超 600 万公里,累计安全载客 10 万人次的训练, 展现了成熟的无人驾驶与 5G 平行驾驶能力。全无人驾驶是无人出租车(Robotaxi)实现商业闭环的必要条件,将加速中国自动驾驶大规模商业化部署。

小度助手将和人类互动的各种 AI 能力封装起来,可以用很低的成本将任何原本非智能、半智能的场合智能化,例如改造酒店、养老院和普通家庭。去年启动的百度“AI 助盲行动”把小度音箱安装到全国 40 多个城市的盲人按摩店,提升了盲人按摩师的工作与生活质量。上百万辆智能汽车装配了拥有小度智能交互的 Apollo 小度车载。

img

央视新闻AI体验官走进百度智慧养老社区

百度智能云为各行各业提供了完备的解决方案,也涌现出很多经典的合作案例。百度工业视觉智能平台通过对电网实时巡检画面快速检测,帮助国网山东电力实现施工机械、烟雾山火、导地线异物等隐患目标的高效检测和高精度危害预警。

img

百度智能云与山东电力合作建立 AI 中台

百度的另一项广受好评的公益行动“AI 寻人”正与国家机关、新闻媒体、公益组织等展开广泛合作,今年上半年又成功匹配了 1500 多例,总共帮助 11716 个家庭团聚。其跨年龄人脸识别技术采集了人脸的 100 多个特征,可以靠一张距今 20 年以上的老照片顺利完成匹配。

③ 人工智能与人类:替代与协同

随着 AI 的稳定性、可靠性日益增强,它在部分人类岗位上完成彻底取代也是必然的。人工智能将越来越多地代替人类从事枯燥,重复的事务性工作。

2016 年,Facebook 的算法误将一张历史老照片判定为“色情”而删除引发争议,说明当年的算法还不成熟。但到了今年,微软旗下门户网站 MSN 裁撤了给新闻排序的人工编辑团队,放心地把首页交给算法打理。

电视业的关键流程之一——视频剪辑,也因为 AI 的进入而不再一样。早前,IBM 协助腾讯体育在转播 NBA 时,以最快速度实时剪辑直播中的精彩画面。这次百度披露,其联合央视网打造的“AI 帮你找”可以自动解析出视频中的人物、感情标签等。已经上线的“AI 中华诗词”可以标注视频内出镜的主持人、专家等名人具体是在几分几秒出现的,点击时间戳即可跳转过去。

img

“AI 中华诗词”中,用户可以选择视频中自己感兴趣的点,精准观看

与此同时,人类与 AI 的合作增加,并更多从事 AI 尚无法完全接管的想象力、设计、战略和沟通技能。一些 AI 产品也自我定位成现在岗位上的人类的辅助自动化工具,而不是以取代人类为目的。

百度帮助央视网搭建的一套系统,为编导迅速找到所需的镜头,还能自动编辑。通过读取《等着我》的往期节目,几分钟内就能把节目中最感人的部分做成集锦,编辑只需要微调、最后确认。

8月下旬,刚从微软分拆出来的小冰公司发布了“X 套件”,是对微软 Office 套件的理念进化。X Writer 允许用户输入一段文字开头后,召唤 AI 自动续写;X Studio 可将文章转制为音频,制作播客、电台节目等,以及调用音源作曲编曲;X Presenter 增强了传统的 PPT 演示,3D 人物可模拟真人讲解,取代真人出镜来制作网课、视频会议等内容。

img

X Presenter:“人工智能时代的演示文档”

小冰发言人讲解时称,它们希望 AI 不是取代人类工作,而是帮忙做好半成品,让人类做最后的审核把关即可。由X 套件辅助生成的所有成果,其知识产权均归用户所有。

很显然,人类不得不应对 AI 进入工作流程的趋势,善于利用 AI 为自己减轻工作量,同时及时从会被 AI 完全取代的工作中转行。

IDC 预测,到 2025 年 75% 的组织将投资于员工再培训,以填补因需要采用 AI 而造成的技能缺口。以至于,如果你的雇主不投资于 AI 培训,那么你可以预判他们未来几年的成长空间可能很有限。

李彦宏在百度世界 2020 大会上提到了“数据标注师”,这是 AI 创造的其中一种新行业,对收集进来的数据进行标注,使其有条理,符合训练机器所需的条件。标注过的数据越多,机器学的越快。他说:“对人力的需求会被逐步的激发出来,我觉得人的需求是会不断膨胀、不断更新的。”

📕 参考资料

https://baiduworld.baidu.com/zt/activity/index

https://www.cyzone.cn/article/571846.html

https://mp.weixin.qq.com/s/x6tXIXBvDcfkcYKCeYE6Xg

https://www.leiphone.com/news/202004/Hegr5IfY9Z21CoVN.html

http://www.chinanews.com/it/2020/08-25/9273618.shtml

https://www.theverge.com/2019/1/18/18187992/

https://mp.weixin.qq.com/s/tiiUYAxJ6qJNp6OpgfVmCQ

https://baijiahao.baidu.com/s?id=1677889259224363177

https://www.shenzhenware.com/articles/14248

http://mbd.baidu.com/webpage?type=live&action=liveshow&source=h5pre&room_id=3825953134

https://mp.weixin.qq.com/s/3Tx_kO7Z3nK25tbX8YixaQ

https://mp.weixin.qq.com/s/9OgpEkc2HhaPAzZW_EFb2w

https://mp.weixin.qq.com/s/LXpHlSgWoXEXtGR3-cn2OQ

https://tech.sina.com.cn/n/k/2018-06-19/doc-iheauxvz5976521.shtml

http://tv.cctv.com/2019/10/31/ARTIz6iRuOYu4UuaNgy8NOlS191031.shtml

https://www.ithome.com/0/504/552.htm

https://cdn.idc.com/research/viewtoc.jsp?containerId=US45576319

👉 航通社相关文章

评论系统由 Disqus 驱动