这是华小冰静默开工的第248天。

过去的200多天里,华小冰撰写的金融资讯触达了中国40%的个人投资者。

跟所有勤奋的金融资讯加工者一样,华小冰必须保持高度的专业水准,对每天密集发布的26类上市公司公告,进行关键信息的提取、加工,并确保第一时间、准确地推送到投资者手中。金融资讯的特殊性,决定了这类信息的加工必须以毫秒为单位、且不能出现哪怕万分之一的偏差。

直到2018年7月26日,微软小冰的第六代年度发布会。一些细心的投资者发现,原来华小冰并不是一个人,而是懂金融的微软小冰。

华小冰的“华”取自“华尔街见闻”,这家中国最有影响力的财经媒体,一直致力于内容与技术的双轮驱动战略。曾首创金融信息7X24小时“实时”模式,通过同名华尔街见闻APP、选股宝APP、全天候科技等产品打造了强大的内容矩阵,为用户提供优质资讯、数据、行情、研究和社区等服务。此次联手微软,也可以视作华尔街见闻深耕内容AI技术的一次创新合作。

华尔街见闻旗下产品选股宝被称为“最懂投资者”的A股产品。作为A股产品界的一匹黑马,凭借领先的结构化A股资讯、强大精准的主题数据库、海量用户数据积累,在竞争激烈的A股产品中杀出重围。

此次华小冰的诞生,正是微软小冰与选股宝团队深度合作的结果。双方共同探索和应用小冰金融文本生成技术,并通过华尔街见闻、选股宝APP,将华小冰生成的智能资讯,分发至众多合作券商APP,进而覆盖多达40%的个人投资者。

此次合作就是瞄准了金融资讯领域的用户痛点——上市公司公告AI写作。公告是上市公司绝大多数重要信息的唯一出口,第一时间掌握相关上市公司披露的关键信息和背后意义,是所有二级市场投资者必须跨越的难关。

金融AI写作一直是个理想丰满、现实骨感的领域。一方面,上市公司公告由于是程式化文本,存在数量多、信息冗余的情况。而人工处理普遍存在时滞、缺漏等问题。另一方面,AI公告写作也一直是未解难题。上市公司公告更接近非标准化金融资讯。虽然公告所包含信息元素相对确定,但上市公司公告格式不尽相同,且经常出现非标准化场景。因此,绝大部分的“金融AI写作”仅仅是模板化的数据提取和填充,对于非标准化内容的加工显得有些力不从心。

2016年艾媒咨询(iMedia Research)的调查显示,相较于汽车、家居、健康等媒体,财经类媒体的内容专业性较强,内容价值是其重要驱动力。因此,要让机器人撰写专业的财经内容,似乎还需要进行更艰难的探索。

华小冰则首度解决了金融领域的非标准化写作难题。在借鉴传统NLG和语言模型方法的基础上,结合华尔街见闻专业团队对A股市场的理解和搜索数据库层面积累的大数据,在模板基础上进行语言生成,从而快速完成AI写作。

华小冰诞生之初便开始经历来自真实金融场景的严酷“训练”。上百万条人工训练数据灌入、成百上千次的模型互调,很快让这个上手才200天的“年轻人”,迅速成为处理过海量数据、经验超群的“老司机”,甚至可以快速处理长达几百页的招股说明书。

除了公告AI写作,华小冰还将在个性化行情播报、主题故事线方面进行探索。

个性化播报不同于传统的同一资讯池的“千人千面”,而是根据选股宝用户画像、结构化资讯标签(如利好利空、大涨板块和个股实时解盘)、行业主题数据库等,对不同用户智能化生成不同的播报文本,解决盯盘的个性化需求。

图为选股宝智能盯盘

主题故事线,则是以选股宝行业主题数据库为基础,通过数据库内精准的股票和资讯匹配,围绕行业或概念主题,智能化生成历史事件图谱,方便投资者快速了解历史脉络和热点,以便做出投资决策。图为选股宝行业主题数据库

图为主题故事线(仍在优化中)