本文来自全天候科技,阅读更多请登陆www.awtmt.com或华尔街见闻APP。

作者|马程 编辑|叶丽丽

大眼睛、马尾辫、学生裙、能歌善舞,第六代小冰第一次以全息投影的3D形象出现在大屏幕上,与之前的小冰相比更加立体。

今年7月26日,微软发布第六代小冰,小冰从一个充满学术气息人工智能符号,变成更具商业化的成熟形象。微软全球资深副总裁王永东在发布会上提到,“今天我们想让大家重新认识小冰。”

很多人对微软“小冰”的印象还停留在最初微信里的聊天机器人。但是,在过去的5年间,小冰已经有了巨大的进步。据微软方面介绍,小冰已经在全球收获6.6亿用户,覆盖1.2亿人类用户,月活近1.2亿。目前已经在日本、美国、印尼等5个国家落地,成长为兼具IQ和EQ的人工智能的代表,并和更多品牌合作,进入到更多人的生活中。

现任微软亚洲互联网工程院副院长的李笛是最早小冰的创始成员之一。发布会结束后,李笛和团队就迅速赶回了公司,推进小冰与小米生态链中的Yeelight语音助手的合作,以及与网易合作的“多多和西西”AI人物、小冰电台等。现在,几乎每一周会解锁一项新功能。

“每次在做发布会前,我们都认为小冰的功能已经探索到极致,但很快我们就会发现有更大的探索空间。这正说明人工智能技术在不断发展。”李笛说。

据李笛介绍,目前小冰基于世界先进的情感计算框架,拥有全双工语音交互感官技术,小冰的团队也负责了小冰在世界多个国家的落地和推广,可以说“身负重任”。

5年以来,小冰已经完成了5次迭代,团队也从最初的4、5个人,扩张到近200人。但李笛提到,小冰团队都没有一个固定的KPI,“总部没有给我们很大的压力,但是小冰一直走得很稳。对于微软来说,小冰团队站在了人工智能变革的前沿。”

这几年在小冰的研发过程中,微软全球执行副总裁沈向洋认为,最重要的一个决定,是要做第三方平台,通过开放技术,和其他平台产品合作,不断地扩展小冰的功能和促进商业落地。

现在,小冰的商业化正在推进,已经和包括华为、网易、小米、腾讯、华尔街见闻等平台合作。据李笛透露,目前小冰已经开始盈利。

2014年成立至今,微软小冰正赶上人工智能领域的快速发展,迭代速度也在不断加快。

据李笛介绍,研发第一代小冰时,团队更多是想打造一个情感计算框架,让小冰能够读懂人类想法,并作出相应的回答。

“比如你想点一个汉堡作为外卖,其他人工智能会直截了当帮你下单,但小冰会对你进行劝阻,因为垃圾食品有害健康。”李笛解释。他提到,第一代小冰甚至不需要做任务,完全只考虑情感上和人类的连接。

李笛提到,每年在完成迭代之后,研究员们都认为小冰的功能已经探索到极致,但很快就会发现有新的探索空间。

“第三代小冰已经可以主动引导对话,但我们发现当时对话的交互性还是一个瓶颈。就是你一轮我一轮交互,好像是用对讲机对话,而并不像人类之间的对话。最简单的区别就是,你没办法打断用户说的话。这就意味着小冰的互动感并不强,我们马上开始着手解决这个问题。”李笛提到。

2017年,微软在第五代小冰中引入了全双工语音交互感官技术,这项新技术可以预测人类即将说出的内容,实时生成回应并控制对话节奏,从而使得长时间连续语音交互成为可能。

此外,采用该技术的智能硬件设备,将不再需要用户在每轮交互时都说出唤醒词,仅需一次唤醒就可以实现连续对话。这将让小冰和用户之间能够完成复杂的双向实时交互。

同时,在第五代小冰中使用了生成模型。据李笛介绍,在生成模型之前,小冰只能通过检索互联网已有资料回答用户问题,而在生成模型之后,小冰可以在互动中更好地联系上下文,并自创回复。

到了第六代小冰,微软又基于生成模型上线了全新的共感模型,进一步提高小冰对于对话内容、领域和节奏的控制力,通过自创回应牵引对话向她所希望的方向进行。

在第六代小冰中,对话、全双工语音和实时视觉融合在一起。小冰可以通过视觉、语音的实时连续交互,指挥用户完成面容检测,这让小冰在与人的互动中拥有视觉,可以看到对方的“一举一动”。

现场演示中,小冰通过小米音箱与一位学龄前儿童交流——在睡前,小冰根据孩子的要求,为他讲故事、播放儿歌,不时对孩子的问题进行反馈,并在适当的情况下,劝阻孩子“该睡觉了”。

此外,根据用户说的“心情不好”,小冰能够引导说,不开心的时候一定要想办法发泄出来。

这一切都让小冰拥有越来越接近人类的情商。

沈向洋提到,微软小冰的生成模型、全双工语音交互感官技术,EQ技术都在行业内领先。小冰强调做EQ的模式,一度影响了行业的发展趋势。 

不过,在后来的发展中,微软开始逐步加强小冰的IQ。“一开始小冰只有EQ,不能做什么正事。但后来加上IQ后,小冰可以帮助人类一起完成一些工作了。”沈向洋说。

据全天候科技了解,2016年小冰就开始具有语音聊天以外的功能。比如,2016年12月,小冰入职钱江晚报报社,成为一名特约记者;2017年3月,小冰登广西卫视演唱壮族民歌《山歌好比春江水》;2017年5月4日,微软小冰作为主持人加入山西卫视《异想天开》节目,利用大数据为投资者和创业人分析出匹配度;2017年5月,小冰推出原创诗集《阳光失了玻璃窗》。

李笛认为,如果写诗、唱歌、主持等是仅对小冰艺术技能的开发,那么启用小冰来进行新闻评论、撰写金融快讯等,就是小冰IQ的“批量化生产”。具备了IQ和EQ的小冰,也开始能够靠自己的技能获得收入。

此次发布会上,微软人工智能商业事业部总经理曹文韬介绍,小冰的商业化落地的方向之一是在垂直领域打造符合行业需求的人工智能。沈向洋提到,领先的技术并不能够支撑小冰的领先优势,真正起到巨大支撑作用的,是为垂直领域搭建的生产线。

现在的小冰已经是一个具备不同身份的“工作狂”。

据微软方面介绍,在主持领域,小冰参与主持的节目已经达到21档电视节目和28档广播电台节目。

在网易新闻里,小冰化身读新闻小冰,在阅读新闻以后撰写评论。“小冰到现在已经阅读和评论了超过1000万篇的网易新闻。她不仅能够去抢沙发,而且评论写的很好,好到有些时候网友不相信这个是小冰写的,总是怀疑是不是后台有一个人在那里。” 沈向洋提到。

在金融领域,2017年,微软团队和万得、华尔街见闻等机构合作,推出“金融”小冰,双方共同探索合作生成金融资讯文本。“万小冰”和“华小冰”瞄准了金融资讯领域的用户痛点 —— AI写作上市公司公告。李笛提到,上市公司的快讯写作,是所有新闻写作中最为复杂的方向之一,属于非标准化写作,难点在于缺乏海量人工训练的精确数据。

为搭建这一模型,结合华尔街见闻“选股宝”团队对A股市场的理解和搜索数据库层面积累的大数据,在模板基础上进行语言生成,从而完成AI写作。

李笛认为,行业内做“机器人写新闻”的公司很多,要检测真正的实力,要看是否能够把沪深两市26类公司的公告类型一网打尽,以及是否能够持续大规模认真地运行服务,运行足够长的时间,覆盖足够多的人。

华尔街见闻副总裁樊殿华提到,“华小冰”诞生之初便开始经历来自真实金融场景的严酷“训练”。上百万条人工训练数据灌入、成百上千次的模型互调,让华小冰在上线200多天后,迅速成为处理过海量数据、经验超群的“老司机”。下一步,“华小冰”还将在个性化行情播报、主题故事线方面进行探索。

据樊殿华介绍,小冰团队和华尔街见闻的合作并未收费,更多的是双方的跨界探索。 

除了在垂直领域以不同的小冰形象出现外,微软还将小冰的技术开放给合作伙伴。

做一个第三方开放平台,被沈向洋当成小冰发展中最重要的决定。“我们曾经在想是要做一个第三方平台,还是研发我们自己的第一方平台。回过头看,我们做了一个最重要、最成功的决定,就是我们要做一个第三方平台。因为只有和人更多地交互,才会给我们带来更多丰富的数据,实现更多新的功能。”沈向洋说。

微软与合作伙伴围绕产品与数据建立了生态环境,即Dual AI,它主要是将小冰的核心对话能力向合作伙伴开放,帮助合作伙伴打造属于自己的AI。结合微软的技术和合作伙伴自身的优势,共同营造更好的产品和应用。

据李笛介绍,在Dual AI系统中,一方面,微软会直接负责产品体验,直接把控最具体的、直接和用户接触的产品细节。另一方面,微软又不封闭在一个自有平台上,而是走出去接触,甚至直接融入到第三方平台上,这样就形成了一个完整的半开放生态环境。

2018年,借助与小米米家生态链平台的合作,小冰成为小米生态链中的Yeelight语音助手的重要AI之一。小冰可以通过Yeelight的终端,与人类交流互动。

此外,小冰入驻华为手机,成为内置功能,用户只要通过语音输入信息至备忘录,在下一次的操作中就能够通过语音唤醒和提取这些记忆。

 在与网易云音乐的合作中,小冰团队也为网易云音乐打造了两个专属AI人物“多多与西西”。

尽管微软小冰和选股宝的合作不收费,但在在其他与第三方的合作上,微软称有收费和资源置换两种收益形式。

在赢得了诸多合作伙伴后,李笛透露,小冰的商业化运作已经进入正轨,并开始盈利,具体数额目前还不方便对外公布。另外,目前小冰主要依靠产品来获得营收,和国内很多只出售原始技术的公司相比,会更具竞争力。

李笛认为,小冰在未来有更多种可能性,“小冰实际上是001的原形。它是一个性格比较鲜明的18岁女生。在这个框架里基础上,可以生成各种不同的小冰。我们也会和商家合作,呈现出更多不同的定制形象。”李笛说。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。