“小度在家”是“AI智能音箱”,但视频通话才是它的最大亮点

本文首发于百家号,原创文章未经授权请勿转载

航通社 (ID:lifeissohappy) 微博 @lishuhang

在人工智能和信息流概念驱动下,百度2018年第一季度营收同比增长31%,净利润同比增长277%。而DuerOS作为百度AI战略的重要支撑之一,与TCL、海尔、美的、创维、极米等160家企业达成合作关系,共发布超过90款搭载DuerOS的硬件产品。

在这之中,与小鱼在家合作推出的“小度在家”堪称DuerOS的官方示范产品,可以说像Surface之于微软,Pixel之于谷歌,HomePod之于苹果一样,具有标杆意义。

“小度在家” 3 月 26 日发布当天,李彦宏,陆奇、百度度秘事业部总经理景鲲等高管悉数到场站台,体现出对它的巨大期待。

航通社(ID:lifeissohappy)收到了百家号送测的“小度在家”音箱,经过一个多星期的试用,希望给大家带来关于这款智能音箱的一个详细介绍,同时分享一些使用体验和改进建议。

以下,就让我们通过这款音箱,一窥百度AI布局的最新一颗棋子的风貌。

1 | 历史:三年迭代 从2999到599

“小度在家”智能音箱是由百度以及其所投资的小鱼在家共同研制的,但它实际上并不是100%的新概念,背后有着非常长的研发历史。了解这段历史,有助于我们了解为什么“小度在家”会是今天这种样子。

小鱼在家是最早一批智能硬件初创公司之一,公司成立于2014年7月,首个产品发布于2015年初,售价高达2999元,三年之后再看简直恍如隔世。

小鱼在家最早的两名合伙人,创始人兼CEO宋晨枫曾任多玩YY的核心团队成员,董事长兼CEO袁文辉曾是视频会议提供商保利通(Polycom)的中国总经理。这决定了整个团队的核心技术方向,都是围绕着语音和视频通话技术展开的。

当时,智能硬件和创客还是最大的“风口”。所以小鱼在家最早的产品,是以智能硬件形态出现,而不像今天“小度在家”这样,以人工智能作为主要卖点。对其早期产品而言,叫机器人比叫智能音箱可能更合适。

在那个距今并不遥远的智能硬件爆发期,有很多产品都致力于以机器人的形式,改善智能会议、家居陪伴、监控等需求。产品设计的场景是企业视频会议或照顾老人、孩子及宠物。

当时还有另外的公司,做过与真人小孩一般大小的机器人,在本来是头部的位置是一个iPad支架。用户需要将自己的iPad连接到设备上,让屏幕显示人脸。

巧合的是三四年后,促销价99元的天猫精灵最近推出一个手机支架,同样是希望将用户自己的手机作为显示屏以节省成本。但是既要装上去,又要拔下来的操作,怎么也不如直接带一个屏幕更舒服。

从最开始到现在,小鱼在家的产品一直都是有屏幕的,而且屏幕是最主要的交互界面。初代小鱼在家因为自带屏幕而提高了制造成本。硬件成本降不下来,加之软件成熟度和市场接受度也不高,这条视频通话机器人的路径一度陷入困境。

不过,初代小鱼在家收获了意料之外的用户,让袁文辉喜出望外。

比起在家庭环境中使用,更多人选择了将小鱼在家摆放在办公室。三千块钱虽也不便宜,但相对当时售价动辄几十万元的视频会议系统,这是速度更快,且一次投入,后续免费的视频通话方案。

袁文辉马上组织团队做“小鱼办公”,专注于企业视频会议领域。2016年下半年,“小鱼办公”团队正式从小鱼在家分拆出来,并更名为小鱼易连。资料显示,小鱼易连2016年在全球发展了400余家代理商和130万企业用户,销售额过亿。2017年3月,小鱼易连完成真格基金、创新工场、光速中国等参与的1.25亿元人民币B轮融资。

对于面向家庭的小鱼在家而言,转机出现在2017年4月。小鱼在家和百度共同推出了一款名叫“分身鱼”的视频通话机器人,当时已经内置DuerOS。小鱼在家依然保持品牌的独立性,唤醒词也是”小鱼小鱼”,而不是”小度小度”。

“分身鱼”在京东开展预售,曾有过1699元的促销价。查看当时的资料就可以发现,分身鱼的外观设计和功能,与初代小鱼在家和现在的小度在家一脉相承。

“小度在家”是小鱼在家团队综合了以上所有成功或失败的尝试之后,所推出的一个趋于成熟的版本。其操作界面、手机客户端等依然沿袭了小鱼在家之前所研发的基础,但是百度为其提供了语音识别内核,加上整个百度体系下的内容源,整合在一起为其所用。

而且,“小度在家”价格也从三年前的2999,一年前的1699,一举降到今年的599。就算技术再怎么进步,百度也必然在其中提供了一定的补贴。

毕竟现在不带屏幕的纯音箱已经降到百元级别,只有以更大的优惠力度促使用户购买,以完成教育用户的过程,接下来才能更轻松的去推广后续的产品。

这就说明现在购买“小度在家”应该是比较超值的。小度在家的发售情况也果然不负众望,4月10号的首批10000台现货在一分钟之内售罄,4月26号的第二批销售不到3分钟被抢空。

从这段发展历史我们可以看到,“小度在家”内置百度提供的语音引擎及内容资源,只是构成其竞争力的一部分要点,而另外一个重要的点,则是小鱼在家团队多年积累的视频通话技术和经验。小鱼在家三年前开始规划与家人视频联系的卖点,直到今天才终于迎来了真正成熟的一刻。

小鱼在家独立品牌多年的发展,浓缩为一句“小鱼小鱼”的备选唤醒词,存放在“小度在家”音箱的系统设置中。

2 | 基本操作:纯语音交互不如更多利用屏幕

我们可以把“小度在家”看作是一个以语音形式,模糊的访问所有百度内容的入口。对于年轻人来说,这样一个入口的吸引力和易用性,并不如直接购买一个平板,因为他们可能习惯了使用手指触控的操作界面。并且,就算是在平板屏幕上面打字,速度也不会太慢。

最重要的是,年轻人比较习惯的带着目的去搜索的过程,像是在淘宝的购物页面做筛选,每一次筛选过程都要在一个屏幕内看到尽可能多的选项,并且可能更习惯直接用手指点。如果不这样而只是随便看看的话,就是使用手指向下滑和左右翻动,而不是对着音箱说“下一个“,那样会很别扭。

以语音操作和模糊搜索为主的交互方式,决定了“小度在家”的主要受众人群是老人和孩子。因此航通社(ID:lifeissohappy)并不会责怪“小度在家”不能呈现“搜索xxx”在百度搜索的所有结果,而只是念默认第一条百度百科的内容。

但是,即便是老年人和孩子,他们进化的速度,或许也要快过产品设计者的预想。

例如,小孩子到10几岁的时候,上QQ空间等等其实已经和大人差不太多了。所以,依赖智能音箱的孩子范围被限定到学龄前甚至早教阶段。而这时候的幼童,如果说不出自己想看的具体名字是猫和老鼠还是小猪佩奇,或者想做的具体的事情是什么,就只是泛泛的说”教我学英语“,”跟我玩游戏“,甚至”石头剪子布“,这些就都属于小度的知识盲区。

自然,”给我讲童话“,“给我放动画片”,“我要看动画片”这些还都可以。即便如此也不是口令一出马上开始播放,还需要再喊“选第一个”,“播放”,以这样的方式来激活播放。

而对老年人来说,他们可能也不会满足于模糊搜索,也会尽可能追求准确的输出。比如,虽然不一定能准确的记住节目名称或者歌名,却会试图寻找有哪位演员或明星,是在什么场合表演的节目。

而这时,如果他们把小度当真人的话,就会失望——这些问题对小度而言太高深,无法理解。

“小度在家”并没能在交互方式上带给人们根本性的惊喜,例如每次都需要唤醒词,不知道上下文,而且实际上需要此前对语音助手技术有一定的理解,知道怎样用助手可以应答的话来回答;否则就会是鸡同鸭讲,大部分答案都是”我不知道“。

自然,现在这样大部分交互依赖语音来完成,还是因为它是基于统一的DuerOS的语音助手引擎,体验上和智能汽车、手机内置语音助手等一致。但既然“小度在家”多了一个显示屏,并且也把显示作为额外的卖点,为什么不能更进一步,突出的利用好这个显示屏呢?

例如,在显示网页搜索结果,播报新闻,或者看视频的时候,如果能够使用手指直接切换上/下一条,查看全文,或者检索相关,能让人们获得更多的信息;即使距离音箱较远,也可以使用手机APP来操作屏幕的话,这样对显示屏进一步利用,应该会大大促进用户体验的提升,同时又不需要等待语音助手进化的特别完美。

3 | 视频通话:可打任意手机号 具备自动抓拍功能

如同上面所讲过的,“小度在家”最核心的技能,实际上是多年研制的视频通话技术。这种技术使得它具备了AI之外最基本的功效,即使其他的看内容,调戏语音助手这些种种功能统统用不上,把它当做一个简单的视频电话和监控摄像头来使用,也挺好的。

在管理员通过手机客户端激活设备之后,这个音箱就具备了和管理员手机之间相互通讯的功能。所有安装了客户端并具备管理权限的手机,与设备之间进行语音和视频通话都是免费的。

在双方的网络都足够好的情况下,使用视频通话功能,与使用微信的视频通话相比,基本差不多,有时候会稍微流畅一些。

在客户端中一个聊天界面,手机可以对设备输入文字信息或者上传图片,但设备只能以语音形式回复。

但不仅如此,“小度在家”还可以独立拨打任意手机、固定电话以及客服电话号码。这是类似IP电话的技术,来电时会显示95开头,8位数字的虚拟号码,手机回拨此号码,音箱会收到来电。

拨打这些号码的时候,会按照每分钟0.2元收费,同时可以经屏幕显示的微信支付二维码对设备充值。

由于”小度在家“拥有一个前置摄像头,所以也可以充分的发挥作为监控摄像头的功能。放置在客厅当中适当的角度,可以设置为有人来的时候就抓拍,或者是有陌生人的时候抓拍。通过人脸识别功能,只要是已经注册过的用户,都可以识别出来。

所有被抓拍的视频可通过手机客户端及设备界面当中的自动抓拍界面调取,一般在云端保留两天,用户可以单独另存或直接删除。

在这里,不得不提到的一个问题是用户数据的收集和隐私保护。

近期国家有关部门制定了更严格的法规,要求所有互联网服务提供商对用户隐私相关事项更注重提示义务,在开启服务及完成注册前,必须以明确的条款提示用户,而且用户必须知情同意。

但”小度在家“的设置过程尚不存在这样的提醒,而且理论上,不仅在手机端,在设备本体的屏幕上,也需要以简单明了的方式,让家中老人小孩也做到对隐私问题知情同意。

更大的问题是,”小度在家“虽可删除拍照,自动抓拍的内容,但与管理员手机之间的语音消息,暂时找不到删除的办法。对小度说“删除聊天记录”,它也听不懂。

航通社(ID:lifeissohappy)之前猜想,”小度在家“可能会把拍摄的照片视频及语音留言保存在百度盘,但后来并没有在关联账号的百度盘当中发现相应的文件。

4 | 内容:整合百度几乎所有资源 但难以连通第三方内容

由百度旗下爱奇艺、好看视频、百度音乐,以及合作伙伴喜马拉雅、荔枝FM等共同奉献的海量内容,是百度送给小鱼在家团队的一份最宝贵的礼物。

DuerOS现在已经是一个非常宽泛的概念,航通社(ID:lifeissohappy)认为由百度提供的内容资源,加上语音识别和响应引擎,才是百度DuerOS最重要的部分——而不是其操作界面。

4月23日,搭载百度DuerOS的人工智能车机系统东风风神WindLink3.0发布。在”小度在家“上面的图文界面,以及在智能汽车的前面板上的界面,可能有很大差异。

这就足以说明,DuerOS设备不一定非要界面一致,重点是百度提供的内容源以及语音引擎作为内核,同时可以利用各智能硬件生产商自己所设计的界面,综合而成。这种合作模式,与阿里YunOS内核套用锤子Smartisan OS的外衣类似。

航通社(ID:lifeissohappy)测试说指定名字歌手的歌,小度都还可以大致准确的识别。如果在给出歌手准确名称的情况下,即便是说英文名字,它也可以识别。

然而,如果一开始不准确的记得这个人的名字,只是模糊的说出是哪里人,是穿什么衣服,或者这首歌自己是在哪里听过,这些小度可能都无能为力。

有意思的是,航通社(ID:lifeissohappy)说”我要听黄梅戏“的时候,小度推送了慕容晓晓的名为《黄梅戏》的歌曲。而说“我要看黄梅戏”的时候,小度就推荐了一个小孩子在台上表演经典黄梅戏《女驸马》的视频。

这是因为航通社(ID:lifeissohappy)深知怎么说才是这些语音助手听得懂的,所以才不会感到奇怪。但如果你真诚的相信在音箱背后藏着一个人,就很容易产生疑惑:为什么只改动了一个字,给我的结果就不一样了?可见未来如果要让老人小孩更方便使用的话,DuerOS前面要走的路还有很长。

李彦宏曾在发布会现场表示:

“音箱有屏幕和没有屏幕的差别,就像收音机和电视机的区别。”

的确,”小度在家“是一个上面屏幕,下面音箱的设备,这在很多人的理解中,也确实是一个小电视机。然而,这台电视机却不能看电视。

——准确的说,当你说“我要看中央一台”或者“我要看东方卫视”的时候,都没有办法提供现场直播的视频流,是操作者意料之外的结果。

”小度在家“应该认真的考虑引入传统电视台的节目,如果假设的用户群体是中老年人的话。

在我的亲戚中,我简单问了一下,大家最喜欢收看的节目,是晚7点的《新闻联播》。但是对小度说“我要看新闻联播”的时候,因为版权限制,只能给你打开“中国之声“的《全国新闻联播》,广播电台的内容提供方是荔枝FM。

公平的说,小度提供的听广播内容还是比较全面的。只是大家真的可能更喜欢看电视。

当然也可以理解,它不可能提供任何规避版权问题的官方手段。其实小度已经尽力了——你需要注意一下那个不起眼的”好看视频”。

航通社(ID:lifeissohappy)对音箱说出一些在优酷和腾讯视频独播的节目的时候,由于没有版权,系统会自动跳到好看视频,来播放这些节目的片花花絮,以及媒体报道等,以此尽可能满足用户需求。

只有一点点遗憾,例如当我说”我要看梨视频“的时候,并不是打开这个拍客的最新视频名单,而是推送了”冰糖炖梨的做法“。

如果视频内容实在不能满足需求,小度会用朗读文字新闻来替代。文字的内容来源是百度新闻所摘取的国内媒体,但目前为止还没有听到百家号作者的内容,引用的都是报纸杂志等机构媒体。

不过现在,视频、播客内容和文字新闻不能混合播出。如果进入了文字新闻模式(比如”我要听北京的新闻“),那么接下来所有的新闻都会是以朗读文字形式提供。同时,也不能直接在屏幕上看到全文,以及只能朗读前一两段。

鉴于再怎么牛气冲天的公司都不可能穷尽所有版权内容资源,航通社(ID:lifeissohappy)强烈建议”小度在家“能提供无线投屏功能,能将手机的视频通过AirPlay、Chromecast /Miracast等方式投到”小度在家“的屏幕上。

同时,在小度提供某个爱奇艺视频的时候,也希望可以一瞬间转移到手机上,或者投到电视上看。

然而,截至目前还看不到实现这些的可能。甚至不得不说的是,”小度在家“当前连蓝牙都不支持。准确的说,是支持有问题。

航通社(ID:lifeissohappy)在收到包裹之后立即开箱,在第一次联网的时候系统还没更新,马上测试了蓝牙连接。当时是可以连接上的,也有相应的界面。

但是不知道为什么,使用安卓手机所播放的蓝牙音乐,相当的刺耳,并且有明显的停顿,简直是无法使用。后来推送了一次固件升级之后,重新对小度说打开蓝牙,就会提示蓝牙功能目前已关闭。

“小度”官方已经跟航通社(ID:lifeissohappy)确认,蓝牙功能会在今后的固件推送中再次开启。这是软件问题,不需要更换硬件就能解决。

5 | 其他零散的问题和总结

”小度在家“还有一些零散的问题,但是跟之前所说的相比有点无关紧要,权且也列出来,希望开发者能进一步改进。

上面说到,目前只能听到文章的摘要而不能查看全文,以及说“查看航通社(ID:lifeissohappy)的所有文章”的时候,也没有想要的结果。但有趣的是,在航通社(ID:lifeissohappy)说出所有的语音命令当中,只要带有“文章”这两个字,都会切换到由名为“文章”的演员拍摄的视频。

在去年四月发布“分身鱼”的时候,现场还演示了通过语音购物的功能,同时也承诺会开通地图技能,比如通过定位可以询问“附近有什么好吃的餐厅”等等。同时还有一个有望大幅度提升用户体验的功能,是一旦前置摄像头检测到有人正在盯着设备的时候,不需要唤醒词,可以直接输出命令。但上述技能现在都没有开放。

值得肯定的是,百度和小鱼在家的技术团队非常的进取。在邀请我们这些首席体验官来体验产品的一个星期当中,系统固件已经升级了两次,每次都会带来一些新技能。百度将每周四定为技能升级日,固定在这个时候推送新的升级。

现在是做收尾的时候了。纵观”小度在家“这款音箱,它的优点和缺点都很突出。

优点:带有显示器,可以进行语音视频通话,或者传输信息。视频通话的效果很好,可以兼职作为监控摄像头。爱奇艺、百度音乐、蜻蜓FM等优质资源保障了音箱内容体系的可用性。

缺点:作为AI担当的DuerOS未能呈现更多惊喜,交互仍有很多缺陷,和百度其他产品整合不够强,系统较封闭,暂不支持蓝牙、投屏等功能。

以“小度在家”为代表的各种DuerOS硬件产品,是百度人工智能布局中的重要组成部分。如陆奇所畅想的,

“DuerOS会无处不在,它可以在任何一个器件上,在任何一个场景上,在任何一个环境中,跟任何一个人都有交互的能力。”

“小度在家”作为一款拥有显示屏,联网能力,智能引擎的终端,承载着百度人工智能落地生根,培养用户习惯的重要任务,即使现在有这样那样的问题,它未来仍可通过后续升级,一点点将后续的力量释放出来。希望这些无处不在的设备,能成为百度在信息流产品之外“逆袭”的起点。


推荐阅读

2017年夏季智能音箱产品选购指南

10张图带你快速评测天猫精灵X1

新房装修要搞“智能家居”?不妨看看这些建议

欢迎转发到朋友圈。受权转载航通社稿件时,请保留版权信息。

寻求授权,请关注微信公众号【航通社】 ( ID: lifeissohappy ) ,并在后台留言输入关键字“转载”。