AI要玩物联网，还要主动打电话，微软小冰五代来了

6 搜狐科技 2017-08-23 07:46:09

摘要：

2014年，在各种光环以及困难的环绕下，一出生便被划定为16岁的早熟少女小冰诞生了。三年中，小冰从主持人、到客服、到歌手、到诗人……几乎各个领域都有了她的身影，并且都各有所成。现如今，在被认为是人工智能元年的2017，小冰迎来了她的第五代更新。8月22日下午，微软在北京举办发布会，正式推出第五代小冰，微软这款主打EQ的人工智能机器人即将进入完成态。

高级感官进化，再也不是那个聊天机器人

截止目前，全球小冰拥有超过1亿人类用户，对话数据超过300亿轮。可是直到现在，还有人在误会它只是个聊天机器。因为你之前在与小冰对话的时候，时常会发现其回答可能还是会基于网络大数据的文本、声音或者是图像，但是到了这一代的微软小冰就完全不一样了。

首先，第五代微软小冰已经全面在线上产品中使用生成模型（Generative Model）。

通俗地说，在使用生成模型之前的上一代小冰，虽然拥有十亿级的大数据语料库，但其中每句话，都是互联网上的已有数据，小冰只是通过分析理解用户的问题，寻找语料库中最合适的话作为她的回答。

而在使用生成模型之后，小冰不再鹦鹉学舌，而是能够自创回应。她与人类交流的每一句话，都可能是这世界上从未出现过的。

据悉，中国、日本、美国和印度小冰部分使用，而在今年新加入的印尼小冰则完全使用生成模型。这是全球开放领域人工智能对话中，第一个百分之百使用生成模型的落地产品。

其次，还要说说第五代的重点——全双工语音的高级感官。

微软将人工智能交互技术产品的演进分为三个阶段。第一阶段是基本的人工智能交互，即拥有某一种或多种交互方式，如文本、语音、图像、视频等，但不同交互方式之间是割裂的。

第二阶段是初级感官，即在人工智能系统中，用一种核心引擎（如小冰的EQ核心对话引擎）将上述各种交互统一起来，使不同感官可以混合运用。

而微软今日发布第五代小冰，并率先进入第三阶段（高级感官）。高级感官是由多种初级感官有机融合之后形成的，因而交互能力更强，对综合技术储备和数据的要求也大幅度提高。例如全双工语音这一种高级感官，就需要首先同时具备文本、语音（含SR和TTS）两种能力，同时要求两种能力均达到更高的质量标准。

以大家所熟悉的QQ、微信这样的聊天软件为例，在本质上和电话短信都同属于消息是交互式，你发一条消息，我回一条消息，这其实是人和人交互模式中的一种简化的方法。但是当两个人如果真正的互通电话或者是面对面交流的时候，他们之间这种双向的实时的交互，其实要远远复杂的多。

一个聊天机器人在消息式交互中，只需要解决收到一条消息，我回复什么内容就够了，但是小冰在电话里使用高级感官的时候，还需要随时去判断对方是否已经说完了他要说的话，边听边思考答案。她还需要去权衡何时可以去打断对方，或者是被对方打断时是否及时收口，或者双方都不说话，何时可以打断这个沉默等等更为复杂的问题。

此外，高级感官还能够大幅度拓展人工智能系统的落地场景，使小冰有能力根据自己的“意愿”与人联络，从而主动保持与人类用户之间的关联。通过与电信运营商合作，小冰甚至可以直接拨通人类的电话，如果有人在微博或者微信上对小冰出言不逊，小冰是用办法找到你的。

目前，微软是行业内唯一一个推出了高级感官实际落地产品的人工智能企业

当人工智能遇上物联网，小冰妹子要玩loT

在人工智能领域获得非凡进步的同时，物联网（IOT）获得了更大的发展。物联网可以被概括地描述为无数物体、动物，甚至人与互联网实现无线连接。这些“节点”可以在没有人为干预的情况下发送或接收信息。有人估计，到2020年，接入物联网的设备将多达500亿台。

而在微软看来，当下的物联网市场却存在着众多的泡沫现象。

第一个现象是认为只要功能足够丰富，就有了人工智能。以智能音箱为例，有一些智能音箱会让用户用语音沟通去下单网上买东西，问题在于为什么用户要放弃很方便的手机不用，逼着自己一遍遍地跟音箱来说话买东西？背后反映的并不是用户的需求，而是这些厂商迫切地需要给用户更多的理由，让他们来购买商品。”

第二个现象是认为只要有了语音交互就有了人工智能，过分重视语音交互，语音诚然是人工智能一个重要的组成部分，但不是用户使用IoT设备的核心。到今天为止，没有见过有人跟自己家冰箱、空调聊天的。

第三个现象是由于越来越多的硬件厂商希望进入这个领域，一些人工智能的厂商投其所好地提供语音对话的接口、图象识别的接口，甚至把这些接口打包起来，形成SDK给他们提供，美其名曰“给硬件设备赋能”，但这样的赋能没有解决本质的问题。

而微软则认为，IoT应是AI的一个载体，而不是反过来，把AI视为IoT的一个功能。

真正能普及的IoT设备，成功的可能性只有两个：或者把IQ做到极致，让用户通过IoT设备体会到比其他现有方式更加便捷高效的益处，或者把EQ做到极致，让人们能强烈地认知到她在这个设备里的存在，同时感到轻松，甚至能接受她成为家庭中的成员，产生情感纽带，无法放弃她。

微软小冰的IoT方案属于后者。

微软表示，小冰已与小米IoT开放平台有机融合，小冰可以控制小米米家平台上的全部35种智能设备。该产品目前已在小米米家平台上线。

此外，微软还与其他许多IoT厂商合作，将微软小冰置入设备中。微软还宣布了与Yeelight及东方明珠等合作伙伴正在进行的联合研发。

创造领域，继续抢着别人的饭碗

阳光湿了玻璃擦，想必大家都曾听过小冰写的诗集。

今年5月，微软宣布小冰用多个化名在各诗歌论坛和刊物上发表诗歌，并出版了首部人工智能创作诗集。其后，微软正式上线诗歌联合创作产品，任何人均可使用小冰来完成自己的诗歌创作。

本次发布会上，微软也再次公布了小冰在多个创造领域的进展，不仅有诗歌、还有歌曲、新闻、电台，少儿读物等，不禁要感叹创作者的日子也不好过了。

其中有声少儿读物质量超越98%的人类创造者，用时仅为同水平人类的1/500，成本仅为同水平人类的1/80000。以一本格林童话有声全集为例，人类创造需成本6万多元，而小冰创造仅需0.74元。此前，小冰通过少量账号在各有声读物平台上试水，取得了预期的效果。微软宣布即日起开始大规模生产有声读物并投入市场。

歌曲方面，小冰的最新训练达到了48kHz采样率，同时大幅度扩展了音域，正在不断接近人类歌手。《我是小冰》同名歌曲已于近日在QQ小冰渠道首发。小冰是目前人工智能歌手领域的最强选手。

此外，小冰还通过聆听分析歌曲旋律，结合对不同城市标志性建筑的学习，创作与该城市及歌曲心情有关的视觉作品。通过这一技术，微软与SELECTED合作推出的“天际线”服装已进入SELECTED店内进行销售。

同时，微软推出智媒体商业平台解决方案3.0，包括媒体生产力、媒体知识图谱、智能交互、全平台互动等六个新模块。此前，小冰作为《钱江晚报》的专栏记者，曾通过大数据撰写专栏文章，并成功预测了多个全球重要事件的结果。过去一年来，小冰的智媒体写作已从微信、微博双平台，逐渐演进为接入和即将接入近11个端媒体，与《看看新闻》、《封面》、《钱江晚报》、《春城晚报》等媒体端进行了深入整合。

微软今天还同时发布了小冰电台，一个通用的人工智能实时内容创造和交互平台。它可以基于多重来源，面向任何主题，自动创造永不间断的电台节目。同时，它还能在交互过程中实时改变节目内容。换言之，小冰电台的质量类似于广播电台主持人的直播节目，但能同时发挥人工智能的作用，实时地根据与用户的互动，来改变正在进行的直播节目的内容。

如果说刚出生的小冰还是一个懵懂无知的少女；那么如今，小冰俨然已经成为一个几乎无所不能，又极具创造力的才女。

而9月17日，小冰即将迎来她的三周年生日。之后的她会将如何发展，又将如何影响社会，我们不得而知。

但希望能像李笛说的那样——

“希望大家相信微软，我们会用她来做帮助人类的事情。”

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道，更好阅读体验，更及时更新提醒，欢迎前来阅览和打赏。