本文来自全天候科技,阅读更多请登陆www.awtmt.com或华尔街见闻APP。

作者|姚心璐 编辑|罗丽娟

真正的智能家居场景为何?

“就像‘住在’智能音箱里。” 百度首席架构师、度秘事业部首席技术官朱凯华这样比喻,“家中所有设备将会无缝协作,你在家里走动,有一个助手随时陪伴着你,可能在客厅显示屏、也可能在床头的闹钟上。”届时,诸如智能音箱、电视等产品均会“消失”,在智能家居环境中,所有产品只代表“发声器”和“显示屏”。

不过,在上述场景尚未实现的当下,小度音箱仍是百度的一张重要“王牌”。

近日,数据机构Strategy Analytics发布2019年第二季度全球智能音箱销量报告,显示其全球出货量达到3030万台,其中亚马逊以21.9%市场份额位居第一,谷歌第二,百度以15.3%位列第三,同比增长3775%。

8月15日,在百度小度产品技术沟通会上,朱凯华对小度音箱的技术优势、智能家居的生态发展及未来趋势等多个方面进行讲解。

以下是现场实录,经全天候科技整理,有部分删减:

问:怎么衡量一个智能音箱的技术水平?

朱凯华:如果没有一个大的框架或者大的标准,我们比较难衡量它的好坏,所以我们把语音交互分成三个比较关键的部分:听清、听懂和满足。

听清是指把用户在空气当中的声波转化成正确的文字,这个大家看得比较多,一般被称为语音识别或者唤醒;听懂就是当我得到这个字符串之后是不是能理解用户的需要到底是什么,意图到底是什么,能够准确的给出响应,或者给出引导;满足是用户要什么我能给他,主要包括知识完备程度和技能服务生态两个方面。

问:刚刚提到小度有全双工免唤醒的功能,这个是在具体执行一项任务时实现免唤醒吗?

朱凯华:先解释下什么是全双工。本来音箱交流是切换的,你说话时它听,它说话时不听你说的;全双工是从底层变成双向流式的,只要开启全双工的功能,就会一直进入聆听状态,也就是说不用每说一句话先叫一下“小度小度”。肯定是建立一个交互的模式,但是这种交互到底应该怎么做最好?

既考虑用户的方便程度,又考虑没事不会误触发,这个当中的权衡比较难。比较像2006年的时候要在触摸屏上解决用手指触摸的问题,其实有很多细节要解决。我觉得我们在全双工领域正处在这个阶段。

接下来我们希望只要在适当的时候,它都能进入全双工状态,并且能够智能地自动关闭。

问:我们聊智能音箱离不开隐私问题,怎么保证用户的隐私不被泄露?

朱凯华:对于我们这个设备来说,我们坚持“三不”:不偷听、不偷看、不上传。刚才说到的唤醒,大家会发现所有的唤醒都是在端上计算的,相当于你不叫我,所有其他的声音是不偷听、不上传的。包括摄像头,它不会偷看,如果开启的话给我开启手势,开启人脸距离过近的检测的话,所有都是在端上计算的。

验证方法也很简单,如果有技术的朋友,可以监控一下网络的流量,看看是不是网上有多余的数据上传。你把路由器的网线拔了,看看是不是能唤醒,是不是人脸的Feature还能触发,很容易能验证它都是在端上计算的,这是我们非常重视的。

全双工开启时,大家可以看到有一个很明显的提示,所有的功能我们都会明显提示用户。所有的不偷听和不偷看,很重要的一点就是不违背用户感知,不违背用户的知情权,这是最重要的。

问:智能音箱在录音开启后,还是会将少量的数据提供到人工审听的部门,在这种模式下,怎么保证用户隐私?

朱凯华:从隐私角度看,最重要的是不可溯源,信息会进行非常严格的脱敏处理。其实大家可以想象一下,你在网上买东西,电商的工程师也会看到你的购买记录,然后来改进一些算法来满足用户,但是这些信息是无法追溯到某个具体用户的。

问:很多人会将智能音箱视作智能家居的入口,用户现在对待智能家居的态度是什么?

朱凯华:结合我们自己的思考,我们从用户体验和用户行为上看到的东西,我们认为用户对待智能家居有三种路径:一是全换,把家里全拆了,改成智能家居;二是小修小换,搞一个智能插座、智能灯泡等等;三是不换。

其实很多时候用户是很懒的,属于第三种,什么都不换。所以百度首先推出了音箱上的红外遥控功能,以及投屏控制。前者最大的特点是你什么都不用动,家里任何能用遥控器控制的东西都可以用音箱的红外线控制;而投屏功能则可让无屏幕的音箱实现投屏。这样用户什么都不用做,也可以享受到智能家居带来的一些体验和改变。

问:百度是否会自己做智能家电?

朱凯华:百度的选择更偏向合作。目前市场上家电品牌如美的、海尔等,我们都可以对接和连接。

至于未来的生态,是开放的还是封闭的?我相信还是开放的。我很难想像到一个人家里都是某一个牌子的家用电器,这个人好像也太死忠了。可能电视买最好的电视,音箱买最好的音箱,冰箱买最好的冰箱,洗衣机买最好的洗衣机,大概是这样。

问:小度助手会提供功能给其他家电厂商,如果其他产品比如电视可以取代音箱做中控,是否会对小度的销量产生影响?

朱凯华:刚刚提到了智能音箱是入口,我们很同意。入口本质来说是不限于哪个具体的形态的。举个例子,用手机可以访问百度,用PC可以访问百度,我们肯定都愿意让大家访问。像小度助手一样,你愿意从电视上访问也可以,你愿意从音箱或者从带屏的设备上访问也可以,我们也觉得都可以。

从我们现在的销量走势来说,好像我们没有太担心这个问题,我们已经是开放了,但是销量没有受到太大的影响,这不是我们真正关注的。

问:百度有DuerOS,目前是一个语音交互的操作系统,未来是否会考虑做物联网操作系统?

朱凯华:大家现在讨论的都是一个具体的,从内核开始的操作系统,比如安卓的底层是Linux。

DuerOS虽然有OS两个字,但不是这种基于内核的操作系统,我们提供的是语音交互或者未来多模态交互的能力,这是一种服务,无论是基于安卓、还是未来另一种未来操作系统,这都不冲突。DuerOS提供的是一致的语音交互能力。

问:5G的到来,会对智能音箱带来哪些挑战和机遇?

朱凯华:5G现在主要的特点有四个:高带宽、低延时、广覆盖、边缘计算,5G能够带来变化是需要有一些突破性的使用方式,这个部分从小度角度来说,我们会密切观察。

我们现在能想到的,一个是全高清4K的VR,另外现在比较火的是云游戏,度在家的设备不会像一台电脑那么厉害,但是如果你开启云游戏这样的计算方式,大部分的计算和渲染以及使用的内存,包括GPU都在云端。你在展示的客户端上只是做一些显示,这个能够充分发挥5G的价值。

问:智能音箱目前处于一个不断降价的趋势吗?

朱凯华:这个里面其实每个做智能音箱的公司都会有自己的打法和路径。之前也有人选择降价,很多时候降价只是给用户一些优惠,让用户更能够感知到这个体验。而当口碑或者一些东西形成的时候,我们推出一个品质更好的,硬件更实在的设备,当然可能价格会更贵一点,这个其实是和不同团队的方式和路径有关系。

如果你看一下小度的话,其实价格是在上升的。

问:怎么看待智能音箱的未来?

朱凯华:在脑机接口真正成熟之前,人类和一个设备沟通最高效的就是说话和视觉反馈,这是我们为什么要做有屏幕的智能音箱。

未来,我们相信不是你单买一个小度在家回家就好了,实际上你是“住在”小度里面。假设条数比较成熟的时候,家里看不到一个具体的设备,你家里会有很多地方有麦克风,有些地方有音箱、有些有屏幕,你在家里说话,有麦克风会拾音、有适合你当下位置观看的屏幕给你反馈,这是我们真正相信的未来。

问:如何能够达到这样一个使用场景?

朱凯华:最重要的是设备之间的感知和协同。比如当你问话时,只有一个设备会告诉你答案,不会满屋子都在播报“今天温度19度”,这样你也吃不消。之前我们说智能家居只是互联,其实互联是一个初级阶段,稍微高级的阶段是在相互协同。我们现在在这个路上正在不断前进。

问:那在这样的场景下,智能音箱作为一个单独的产品会消失吗?

朱凯华:在我的想象中,未来不光智能音箱会消失、电视也会消失,很多独立的、不和别的设备协作的设备都会消失。

你住在家里,周围是很多发声器和现实屏幕,未来,大概设备之间协作变得很好时,你不会买一个电视,这个电视有独立的系统,你会说,我在这里加一块屏幕。就像现在在窗户上加一块玻璃,或者加一个双层玻璃。

这些设备将会形成无缝协作,你在家里走动,其实就是一个助手随时陪伴着你,可能在音箱的显示器、可能在客厅显示器、也可能在床头的闹钟上。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。