|个人中心 | 退出 | 登陆 | 注册 | 订阅
未完成

智能语音系统哪家强?景鲲:百度必赢

2017-07-27 22:55 | 作者: 刘佳玲 智能语音

 

WechatIMG59

假如你是一个高压线维护人员,工作时需要带上厚手套保护双手,这时候,你的手机响了,有人打电话给你,但你正在高压线塔上操作设备,不能脱掉手套拿手机,你该怎么办呢?

一个从事高压线工作的工人早前写信给百度,希望利用百度的对话式人工智能系统DuerOS,解决他的信息需求问题,例如搭载DuerOS系统的手表或手环能够跟他对话,或者满足他打电话的需求。可以想象,如果这位工人的手机能听懂他说“接电话”,然后自动播放来电,他就不会为漏接电话而苦恼了。

百度度秘事业部总经理景鲲说,自从7月份的开发者大会后,DuerOS开放平台就特别火爆,接到了很多来自大企业、小企业或者个人的开发需求,每个人都想把DuerOS适配到自己的产品里,让产品能“听懂人话”。目前,DuerOS的合作伙伴至少有120家,包括硬件、芯片、内容、开发者等各个领域。

可能因为最近工作比较繁忙,景鲲的眼袋显得有点大,但他的精神头很足。身为一枚优秀的程序猿,景鲲特别注重条理,他会把记者的提问分条缕析,眼睛注视着记者,用不急不缓的语调回答问题。参加过许多大型发布会的景鲲这样评价自己:“我这个人比较内向。”

WechatIMG114

在中文领域的语音智能交互中,DuerOS被很多人看做是另一个Alexa。Alexa是国外电商巨头亚马逊2014年推出的语音智能系统,最初搭载在亚马逊的智能音箱里,是语音智能界的“鼻祖”。但Alexa最擅长的是英文,在中国无法使用。

景鲲表示:“世界绝大多数的语音智能交互产品(包括智能音箱、智能电视机、智能冰箱等),其生产厂商都在中国,这种类型的厂商最近找我们合作的特别多,尤其是很多一线大厂,名字我不好说,说出来肯定会让大家很震撼。就是这些一线大厂在主动拥抱我们。以HTC为例,他们在美国选择Alexa的方案,在中国选择DuerOS的方案。”

5月16日,百度DuerOS与HTC达成战略合作,HTC U11成为HTC第一款在中国大陆地区发售的搭载DuerOS的手机,售价约为5000元。官方宣传,不管是查询服务、海量资讯,还是管理日程、应用设置,用户只要轻轻一握,说出问题,小度助手就能轻松搞定。

有网友晒出HTC U11的测评,表示DuerOS要比苹果手机的语音智能系统Siri更接地气。

屏幕快照 2017-07-27 下午10.38

第一回合比拼谁听得更准确。测评显示,Siri的中文识别率近几年始终未得到太大的提升。

屏幕快照 2017-07-27 下午10.38.11

 

 

第二回合比拼谁更能听懂用户说话。Siri给出的结果一般都是网页搜索结果,而小度助手则会直接给出答案,毋需用户点击更多网页。

一些常识性的问题,小度助手均可以给出一个直接的答案,例如查询中英文单词、生词解读、单位换算等等。想知道《人民的名义》是谁拍的?小度助手也照样可以回答你。

 

WechatIMG115

 

第三回合比拼对话连贯性。很多语音智能系统无法结合上下文产生连贯的对话内容,让用户产生“这也太蠢了吧”的无奈。在测评中,小度助手能够依据用户需求,不断筛选合适的餐厅,而Siri给出的仍然是网页搜索结果。

WechatIMG116

WechatIMG117

就连人类回答起来可能会有点不知所措的问题,小度助手也能完美解决。例如,小孩子是怎么来的?(不要告诉中企哥是快递来的)看来,以后应付熊孩子也能得心应手了。

WechatIMG119

盈利暂时不是DuerOS的目的

DuerOS那么酷炫,百度岂不是赚得盆满钵满?

景鲲说:“商业不是我们目前主要的考虑,我们坚信只要人机交互有这样一次跃升的改变,基本上实现商业化完全不成问题。有了语音智能后,用户的粘性和活跃度都会提升很多。所以,现在先要培养市场对语音智能交互的使用习惯。”

7月25日,搭载DuerOS的极米激光无屏电视在北京发布,最高售价7.99万元。景鲲说,DuerOS是免费开放给极米,不评价极米的定价。

当然,DuerOS仍有技术有待提升,例如远场语音技术(简单来说就是让用户站在远处说话,机器也能听见的技术)。景鲲表示,电视、冰箱远场语音,车载近距离偏远的语音都还是挑战,这对百度来说是特别好的机会,因为百度注重技术驱动,希望百度投入更多技术能力,收购很好的技术公司,把技术优势发挥到极致。

WechatIMG120

至于百度会收购哪些类型的公司,景鲲回答:“哪些公司跟我们的技术有互补性,甚至客户有特别强的需求但我们还不具备,我们就会把他们收进来。”

景鲲对DuerOS非常自信,“在语音智能交互生态里,百度必赢”。 他解释道,要让机器听懂人话,必须先让它看足够多的表达, “我的儿子今年3岁,我第一次跟他说一个词的时候他是不明白的,我就告诉他,榴莲是什么,有什么表达方法,他第二次就懂了,计算机也是一样的,具备迁移学习的能力,这时候数据就至关重要。百度的搜索平台已经积累了大量的用户表达,所以百度有很大优势。”

智能语音系统哪家强?

在中国语音智能交互生态里,百度的竞争对手有很多。各家的智能语音系统都向Alexa看齐。

4月25日,腾讯推出智能语音助手“腾讯叮当”。虽然“腾讯叮当”还在测试暂时无法下载,但通过腾讯发布的介绍和产品主界面图来看,是期望打造具备精准的语义识别,能提供迅捷互动反馈并支持动态场景下的智能助手。腾讯表示,“腾讯叮当”在功能上与亚马逊Alexa类似。

 

屏幕快照 2017-07-28 上午8.24.59

腾讯表示,腾讯叮当涵盖的服务非常宽泛,新闻、赛事、票务、快递、音乐、股市、文学、基于LBS的附近资源都已囊括其中。腾讯第二号人物刘炽平在接受采访时透露,腾讯的智能音箱或在8月份发布。

WechatIMG122

按照因为百度有强大的中文搜索引擎,所以能干好语音智能的逻辑,腾讯也有覆盖国民的微信应用,积累了大量语音数据,想必日后也将是语音智能战场上的一位悍将。

7月5日,阿里发布首款智能音箱“天猫精灵X1”,售价499元。这个音箱搭载了阿里第一代中文人机交流系统AliGenie。AliGenie拥有声纹识别技术,能认得每一个人的声音,不怕别人给自家音箱“瞎指挥”干坏事,能实现声纹购物。用户还可以使用音箱播放歌曲、查询天气、查星座运势、控制100多个品牌的智能家电等。

屏幕快照 2017-07-28 上午8.25.54

有网友晒出和天猫精灵的互动过程,例如玩猜数字的游戏,过程轻松愉快没有出错。网友询问狮子座性格,天猫精灵却误判为星座运势,给出了错误的答案。

屏幕快照 2017-07-28 上午8.26.30

 

图片来源:爱范儿

有网友开始比赛,看谁能引导天猫精灵说出指定词汇。在视频里,天猫精灵居然“呵呵”了网友,机智地成功“反调戏”。

有网友发现天猫精灵一些仍待改进的地方,例如对网速要求比较高,网速不佳它的反应也会变慢;说话吐字需要清楚一些,不然声纹识别通不过话费充值失败;句子结构必须尽量简单,不然它可能理解不了,例如用户说“关掉这首歌”,天猫精灵却理解成开通单曲循环,最后用户只好略显粗暴地命令“静音” ……

WechatIMG113

阿里对语音智能交互寄予厚望,其人工智能实验室负责人浅雪(花名)说:“我们的父母一般会用手机的通讯交流功能,但80%的App他们可能不会使用,因此触屏不是最好的方式,应该还有更好的。我们觉得,语音可能是下一代人的交互方式。”

京东则是国内最早发布智能音箱的商家。2015年,京东与科大讯飞成立了合资公司灵隆科技,并在2015年6月发布了名为“叮咚音箱”的产品。今年6月8日,京东推出叮咚Top和叮咚智能音箱二代。新产品搭载了京东语音智能系统Alpha。

屏幕快照 2017-07-28 上午8.27

京东表示,Alpha拥有近200项核心专利,由集成和开放网关、底层支持系统、能力中心三个主要部分组成。Alpha拥有人工智能技术、互联网内容与服务、应用语音和图像等人机交互方式,赋能于终端设备和软件应用,并为合作伙伴提供模块化智能解决方案。

和百度的DuerOS一样,京东Alpha也开放API接口,支持第三方开发者的能力接入,开发者可以云端接入或定制化开发的方式为冰箱、电视、音箱、汽车、机器人等多种硬件设备终端提供更多功能。目前,Alpha已经和美的、格力、美菱等几十个品牌商达成合作。

屏幕快照 2017-07-28 上午8.28.42

在接受采访时,景鲲对《中国企业家》说,中国的智能语音设备正处于井喷状态,例如现在市场上新推出的电视,基本都是智能电视,语音智能已经在潜移默化地影响着用户。引入语音智能之后,用户跟产品的交互更加简单,所以用户的黏性、活跃度会比以前高很多。

从语音智能的应用场景来看,景鲲表示,家庭、车载和手机等移动场景,对语音的需求是逐渐升温的。只要解决听清、听懂这几个核心技术问题,把这些技术瓶颈攻克掉,就能迎来整个产业的大爆发,这本质上是跟Android时代是一样的。

  • 分享到: Baidu搜藏 转贴到开心网 分享到QQ空间

专栏

何振红

《中国企业家》杂志社社长

马吉英

《中国企业家》高级记者,关注汽车、...

黄秋丽

《中国企业家》主笔,关注地产等领域

萧三匝

《中国企业家》高级编辑,关注思想、...

周夫荣

《中国企业家》记者