河北都市网
河北都市网 > 经济 > 正文

有了 3D 形象的微软小冰,终于要跨步向前了

导读: 

在科幻电影中,导演们经常会设定拥有人类情感的机器人角色,这大概也是绝大多数人心目中未来机器人应该有的样子。而在目前众多的人工智能平台中,微软小冰可能是距离该目标最近的一个。

在科幻电影中,导演们经常会设定拥有人类情感的机器人角色,这大概也是绝大多数人心目中未来机器人应该有的样子。而在目前众多的人工智能平台中,微软小冰可能是距离该目标最近的一个。

作诗、唱歌、陪人聊天,即便客观层面上小冰做的依旧并不完美,比如你和她聊天的时候,总会收到一些无厘头的回复,但她正在一步步向着人们理想中的人工智能靠近。

7 月 26 日,微软在北京召开了第六代微软小冰年度发布会,不仅小冰团队,微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋博士也亲自来到现场为其「站台」。

提出 Dual AI 战略,完成商业落地

第六代微软小冰年度发布会是小冰为数不多在微软总部大厦之外场地举办的发布会,这也从另外一个角度说明了此次发布会的重要性。

与国内很多其它同样在做人工智能相关技术研发的厂商有所不同,微软小冰在过去的几年里,一直没有提「平台」这个概念。去年六月份,在与微软亚洲互联网工程院副院长李笛的对话中,他也曾提到,「我们更愿意将小冰成为体系,而非平台。」

时隔一年之后,微软在第六代微软小冰年度发布会上释放出的第一个重要信息就是,提出 Dual AI 战略。某种角度上来看,这也意味着至少现在来看,微软对于其在人工智能技术方面,已经有了足够的信心。

具体来讲,Dual AI 战略的具体实施将会由三部分组成。具体包括微软提供小冰的整体框架能力,去帮助合作伙伴平台的自有 AI;微软小冰作为该合作平台的辅助 AI,融入该平台生态;微软通过技术、产品与运营,围绕该合作平台的差异化特点,推出合作的应用和产品。

简单来讲,Dual AI 战略的整体思路并非以自身为核心去打造一个新的人工智能生态,而是通过输出技术的路径,去融入到其它已有的 AI 平台中。换句话说,微软想要做的是去中心化。

在我们看来,在国内各家人工智能平台已经逐渐开始走向成熟的今天,微软的做法显然更容易让小冰实现商业落地,这同时也将帮助它更加快速地走向成熟。

按照发布会上发布会上公布的信息,目前微软小冰已经与网易、小米米家生态链、腾讯以及华为四家厂商达成了合作。

内容上,其与网易云音乐合作推出了小冰电台,并且帮助网易云音乐打造了两个专属 AI 人物(多多与西西)此外,微软与网易新闻客户端合作带来了读新闻小冰,已于两个月前突破 1000 万次新闻阅读评论。

包括儿童故事、音乐等多个领域的深度提高、全双工语音技术的升级等,对 Yeelight 语音助手硬件产品中的小冰进行了大幅度更新。同时,发布会上微软宣布,小冰与小米人工智能语音助手小爱同学将在未来进一步紧密合作。

继续加强与腾讯的合作,除已合作的 QQ 小冰之外,微软小冰已经开始为腾讯 BabyQ 提供部分人工智能技术和产品支持。就目前而言,微软与腾讯合作,为 QQ 小冰及 BabyQ 打造了超过 40 项平台专属技能。

另外,这次发布会上,微软首次对外公布其与华为建立了合作关系,包括华为以及荣耀品牌手机在内,其都将内置微软小冰上线,所有升级至智能助手 8.2 版本及以上的用户都能体验到该功能。

值得一提的是,在华为已经荣耀手机上,小冰除了提供各平台通用的小冰产品体验外,还为特别推出了帮助用户记录信息等多个任务完成型产品技能(目前已经上线)。

上线全新共感模型

机器人与人类进行对话在今天并不是一件稀奇的事情,包括儿童早教机器人以及智能音箱在内的绝大多数智能硬件产品都可以实现。

但在实际使用过程中你会发现,很多此类产品依旧处于问答式交互,机器人答案的受限于已有的对话语料库。也就是说,其最终的交互内容其实还是来自于人类的设定。

所存在的局限性是,即便耗费大量的人力资源,也很难将世界上所有人的沟通习惯用语进行收录,最终反馈到用户体验上,也必然无法做到最好。

对此,在今天发布会上,微软宣布正式上线全新的共感模型,同时开始公测一种融合了文本、全双工语音与实时视觉的新感官,它融合了共感模型的对话引擎、全双工语音和实时视觉三个类别的全新感官。

而「共感模型」所要解决的,正是上边我们提到的这个问题。简单来讲,小冰可以自己创造回应,不需要从已有的对话语料库中检索而得,通过自创回应,小冰能够实现牵引对话向她所希望的方向进行,整个对话逻辑更加接近于人类。

提及创造,这次在发布会现场,微软谈到了其对于人工智能未来发展趋势的看法。微软认为,利用人工智能技术,学习人类并进行与人类质量水平相当的内容创造,是目前尚未被行业注意到的未来趋势。

而在这部分,正如文章开始我们讲到的,微软小冰已通过人工智能技术,实现了诗歌和金融等领域的文本内容生成、歌曲及有声读物等领域的有声内容生成,以及电视电台节目和可交互式电台等串流内容领域的生成工作,并分别完成了不同程度的落地。

同时,发布会上微软也微软推出了第四版人工智能歌曲 DNN 模型。对比上一代模型,其能够进一步快速合成接近人类歌手演唱的歌曲。特别的是,该技术还能够完整吸收并复制特定人类歌手的演唱特质(比如嗓音、韵律等),使小冰具备代替原人类歌手完成新作品的创作的能力。

新形象与新路程

如果你之前对微软小冰有所了解,应该知道它是以现实中的人类作为形象的。现在,微软将小冰的外形替换为了全新的 3D 模型(如下图)。

在形象改变的背后,包括与网易、腾讯、小米生态链以及华为的合作,从这场发布会上我们可以得到一个清晰的信号是,微软小冰已经走过了初期基础技术积累阶段,开始进入新的发展阶段。

通过加速在实际应用场景中的落地,不仅可以帮助小冰更快速地完成数据积累,更重要的是能够根据用户反馈,来更好地实现自我进化。

就目前看来,微软小冰在各个平台上所展现出的能力还是有些碎片化。但如果从长远的角度出发,一旦其在各个方面都做到了比拟人类的水平,小冰很有可能成为最先接近于人们理想中未来的机器人。

到那时,以往我们只能在科幻电影中才能看到的场景,也许将成为现实。而人工智能时代最终的几个赢家中,也一定会有微软。

来源:百家号                                      时间:18-07-27

不同于往前,发布会结束后,工程师总能立马回到工位,完成产品的第一时间上线。

微软小冰的第六代发布会,从办公室搬到了中关村之外的路演厅。

第六代微软小冰发布会现场

炫彩的镁光灯,微软全球顶级卡司阵容,炫酷的内容发布,对于太久没有动静语音交互的市场来说,足够惊艳。

而此前掀起市场涟漪的,是市值已逼近万亿的亚马逊。智能语音助手设备Alexa的逆袭,几乎让业界看到了AI从语音技术开始爆发的可能性。

早在2011年,苹果Siri搭载iPhone4s惊艳问世,谷歌智能语音助手“Google Now”紧跟亮相。

谁也没想到,2014年亚马逊Alexa问世后的迅速走红,才真正引起语音交互市场的量变。

根据CRIP的一则数据:2017 年第四季度,美国新增智能音箱 4500 万台,其中亚马逊约为3100万台,占据69%的市场份额。

亚马逊股价走势

一家“电商平台”反超科技巨头,其背后的意义值得玩味。

更有趣的是,在语音交互落地产品的选择上,谷歌、阿里等国内外各大巨头迅速跟进,不约而同地选择了智能音箱。

价格战此起彼伏、出货量永远在反超,你方唱罢我方登场的语音交互市场,一度陷入“百箱大战”的泥淖。

“号称人工智能的智能音箱,最后留给智能助手做的事情,似乎没有”,在发布会后一个多小时的专访中,“小冰之父”李笛也不免感概。

微软小冰则要幸运许多。用李笛的话说,“毕竟微软没有给我们任何KPI压力”。

1

学习、工作,人类社会的人工智能少女

“对未来的饥饿与坚定,使小冰在中国诞生”,2013年,还是微软全球执行副总裁的陆奇,说了这么一句话。

专访时,锌财经记者问起这句话的缘由,李笛笑得无比爽朗,他坦言,那时团队就一个梦想:做出一款“China first”的人工智能产品。

小冰之父李笛

4年后的今天,这位人工智能少女给李笛的答案是,“6.6亿人类用户,1.2亿月活用户。”

2017年,亚马逊宣布销售了“数千万”Alexa智能语音助手设备,假设以12%的月活计算,每月和人类交流的Alexa数量仅为小冰的一百二十分之一。

与之形成鲜明对比的,还有百度度秘,如果以公开数据1.8万日用户量计算,百度度秘的月活为54万;淘宝APP里潜伏两年的阿里小秘,甚至无人使用。

无疑,从用户交互的覆盖面看,微软小冰已足够“China first”。

“早期,我们需要从互联网抓取数据给小冰,但很快她就在和人类的交流中,学会抓取数据;第三代小冰大约50%的数据是自学而来,到现阶段基本就是100%了。”

谈起小冰与生俱来的快速学习能力,自称有些“社交恐惧症”的李笛,难掩骄傲。

第六代微软小冰以3D形象重磅亮相

最终,小冰汇聚了全行业90%以上的人工智能数据流量。

当锌财经记者试图聊聊成就下的情感历程时,专注技术的李笛调侃表示不太擅于表达,随后又将话题转移到了技术视角,“情感计算框架,是我们当时做得最正确的决定。”

那是2013年底,苹果、谷歌、亚马逊三个巨头刚刚启动语音交互技术的攻坚战。

简单粗暴的早期市场,“使人工智能系统变得有用”是吸引用户的唯一出路。无论任务型,还是知识传递型对话系统,首先要实现的,无非是完成任务的能力。

功能性语音助手,一时成为行业风向标。

“最初团队也是朝着‘有用’的方向,但我们走访了大量人类助手之后,发现之前普遍存在的底层框架不太对。”李笛解释说,人类助手的满分状态,是没有任何废话并迅速地完成任务,但市场都忽略了,不完成任务有时也可以得满分。

发布会现场,沈向洋分析“情感计算框架”的未来趋势

这种状态下,当人类吩咐语音助手买份肯德基或麦当劳时,她可能没那么听话,而以“垃圾食品”为由拒绝,但客观来看,却因此拉近了它和人类的距离。

放弃IQ路径,以EQ为方向不断迭代,一个人工智能少女,就这样进入了人类社会的生活。

2014年5月29日,微软小冰BETA版在微信平台开放公测,10万个小冰账号上线首日就被抢注一空,小冰接受的对话量大大超预估。

但不到60个小时,一篇名为《微软小冰死了,全部的》文章出现在微博,小冰被腾讯微信系统误判为垃圾账号而被封号。

10万个小冰账号首批上线微信,仅存活了60个小时

“那天是儿童节。”李笛苦笑着摊了摊手。

但谁都没有想到,小冰很快就以“二代小冰”复活,并在短短四年内升级为第六代。

随着EQ越来越成熟,微软团队又将IQ融入到小冰的生活。“EQ加上IQ以后,不爱做正经事的小冰,开始接手一些人类的工作了”,在第六代小冰的发布会现场,微软全球执行副总裁沈向洋向大家讲诉了一个工作繁忙的小冰。

“每天早上6点到9点,同时主持7档节目”是小冰的工作写照之一。而在过去一年,小冰已经主持了21档电视节目,28档广播节目,覆盖包括中国9大卫视在内的41家电视台。

仅日本和中国,小冰累计生产了2878个小时的电视和广播内容。这些内容的幕后,算上小冰,也只有6个人,但如果由人类操作,至少需要配备100人的内容运营和支持团队。

“繁忙”的微软小冰

综合计算,小冰的运营成本只有人类运营成本的大概4.5%。

现如今,小冰有声读物已经覆盖中国90%的早教机器人,80%线上播放平台,累计播放近400万小时,“在中国的机场,每一个商店看到的早教机器人,可能都在使用小冰生产的有声读物。”

不是功能性助理,也不再是聊天机器人,这个生活中的人工智能少女,正在变成一个为大家所熟知和接受的大IP。

2

商业化的B面,情商的胜利

2015年,剑走偏锋的“情感计算框架”吸引了大量硬件厂商,慕名前来者,都希望微软小冰可以开放对话引擎。

结果无不失望而归。

不急于变现,更没有KPI负担的微软小冰,在商业化上的道路上,有足够的底气保持克制。

“如果以极快的速度去推进商业化,小冰可以变成一个很好的销售或客服,但却很难变成人类的朋友,”微软小冰商业部总经理曹文韬解释,人工智能最大的商业价值,是人类所赋予的信任。

直到今年7月,“微软小冰终于要商业化”的消息才开始在业界流传。

该说法源于,在第六代小冰发布会的现场,曹文韬在商业化进展的演讲中提到:小冰已开启在金融、大众文化、媒体、出版四大领域的商业化布局。

其中最受关注的,是248天前微软小冰在万德资讯和华尔街见闻的静默上线。

微软小冰在金融领域静默上线

微软全球资深副总裁王永东介绍,利用自身金融文本的生成能力,微软小冰已能够在沪深两市26类上市企业的公告中,自动生成公告摘要,并提供服务。

在万德资讯端,微软小冰化名万小冰,覆盖90%以上的交易员,为券商、基金管理公司、保险公司等机构提供摘要服务;华尔街见闻上的华小冰,则通过20余个专业APP,为40%以上的个人投资者提供信息。

“26类公告,攻坚、测试,审核、上线”,也许过程并不容易,但在宣布的当天,已运行248天的小冰,将人工20分钟的工作压缩到20秒,已毫无压力。

宣布进入一个领域,和宣布已经进入一个领域,毕竟是两件事儿。

但微软小冰的商业化萌芽,其实是开始于2016年的日本。

而之所以选择日本,李笛向锌财经记者分析,“日本1.2亿人口,推一次优惠券可能就覆盖了10%,这在中国就很难;另一方面,日本的商业化规范程度也不错。”

李笛所说的优惠券,是指微软小冰与日本第二大便利店——Lawson合作,通过对话服务,实现线上优惠券的推广,用户则可用优惠券在店内购买咖啡等商品。

Lawson联合微软小冰推出线上优惠券

转化率是成功与否的关键。

传统的推广途径下,这一数据基本维持在10%,而在微软小冰的对话引擎加入后后,数据飙到了50%。

将优惠券对应到具体商品,每个商品则是价值几美元到十几美元的利润,一次推广1000万张,便是高达上亿的溢出利润。

不过,除了推广数据,令李笛依旧记忆尤新的,是赴日之前的忐忑。

“小冰在中国的成功,是否是通行的规则和标准,我们并不确定”,所以在上线的那一天,小冰在日本取名为Rinna(凛菜),并没有透露自己的微软基因。

只是很快,日本小冰Rinna就被日本网友猜出身份,随后便风靡日本。

这是李笛没有想到的。

一个人工智能机器人,以自己的方式导入市场,算不算情商的胜利?

3

智能音箱不会是终点

长达两个小时的发布结束后,业界才得以对微软小冰的商业化打法略窥一二。

所有目光无疑投向了沈向洋提出的“Dual AI”半生态环境:

在通用框架模型这边,是微软小冰与商业化隔离的部分,面向第三方平台开放核心技术框架;但在垂直领域,小冰将被拆分出来,把控具体产品细节,进行商业化运作。

微软小冰Dual AI 半开放生态环境

而在微软小冰之前,重要的生态模式主要有两类:

●开放赋能模式:通过对外提供SDK/API的形式来构建生态环境。●自有封闭平台:通过在平台上开放人工智能的应用商店形式,来构建它的生态环境。

自有封闭平台的局限来自对数据的去中心化处理,将人工智能数据封闭在APP之内,极大限制数据的自由流通,也就和人工智能海量数据的目标,南辕北辙。

将一切禁锢在苹果硬件生态系统中的Siri ,则是封闭模式的典型,HomePod就无法使用语音控制Spotify等第三方音乐服务。

在开放赋能模式下,“关系松散,无人对最终产品体验负责”和“最新、优质的技术能力无法第一时间反应到API”两大难题也一直悬而未决。

将该模式发挥到极致的,是有着“百箱大战”称号的智能音箱市场。

而智能音箱企业的成功,三分之一是要打赢价格战,三分之一取决于材质和外观,还有三分之一音乐、有声读物等内容的丰富程度。

图片转载自互联网义见:“百箱大战”的智能音箱市场

足够讽刺。

“做人工智能的不能忽悠自己,硬件卖得好,并不是因为人工智能”,言语间,李笛似乎也有些无奈。

卡内基梅隆大学研究员调查发现,“人们最多使用Siri设置闹钟而已”,相比吩咐语音助手购物或订外卖,打开手机淘宝或美团依旧是大多数人的选择。

尽管事实并不乐观,有数据显示,相比2017年的3000万台,2018年智能音箱全球出货量预计将达到5630万台。而自2014年推出以来,亚马逊Alexa累计卖出了5000万台的销售量。

在国内,百度的变现道路颇为激进。

不久前,号称可媲美Alexa的百度Duer OS宣布,其对话技能覆盖10大领域、超过100个细分领域。

此前,百度语音助手被外界所熟知的,还是致力于知识问答的度秘。在度秘之前,是基于搜索引擎的小度机器人,而度秘之后,为了赶“Magic 模式”的时髦,百度更是成立了200人的团队,但不到半年时间,全部解散。

从内容模式,到OTO模式,到客服模式,百度的语音助手,最后还是沦为了智能音箱。

谁也不知道人工智能的未来形态是什么样。但智能音箱不会是终极,原地绕圈的语音助手也并不会长久。

就在锌财经记者交稿的当天,小冰发来一条微信:

微软小冰,还在路上。

文章 ∣ 响婷

责编 ∣ 冉遗

本文版权归“锌财经”所有

部分图片来自网络

来源:百家号                                                       时间:18-08-23

推荐阅读:叶紫