奥迪Q53X车载(An on-board)语音系统只动嘴就足足

更是标志了科大讯飞从语音技术提供商向语音服务提供商转型,软硬数服一体都由科大讯飞来做,奇瑞瑞虎3X车载语音系统也宣布搭载由科大讯飞和奇瑞共同研发的Cloudrive2.0智能语音车载系统,这个系统是不是与讯飞输入法一样逆天,并在试驾奇瑞艾瑞泽5的过程中亲身体验了讯飞汽车语音交互系统——智云互联行车系统Cloudrive2.0,智能车载交互系统正在将司机们的手和眼睛从屏幕中解放出来

mg游戏平台手机版 16

车内人机交互原则之一,是尽量减少达成目标的交互次数。

mg游戏平台手机版,众所周知,车载多媒体中的语音识别一直是个尴尬的“笑点”,山东大汉的情形屡出不鲜。众多车企纷纷踏上“拯救车机“的活动,奇瑞也不例外。继罗永浩宣布锤子手机搭载讯飞输入法后,时隔半个月,奇瑞瑞虎3X车载语音系统也宣布搭载由科大讯飞和奇瑞共同研发的Cloudrive2.0智能语音车载系统。你肯定想问,这个系统是不是与讯飞输入法一样逆天?

智能语音交互系统让驾车更轻松

从这一点看,语音交互赚足了优势。因为语音是扁平化的,一句话包含多种信息。但只要表达得足够清晰,产品足够智能,就可以直接为用户推送最需要的结果。与按键和触摸操控执行复杂命令时的层层定义相比,语音可以更好满足开头的原则。

mg游戏平台手机版 1

■本报记者 赵广立

奇瑞和科大讯飞联合开发的Cloudrive2.0,就是一款搭载了深度定制语音技术的车载系统,整套软硬数服都由科大讯飞操刀,更是标志了科大讯飞从语音技术提供商向语音服务提供商转型。

mg游戏平台手机版 2

边开车边操作触屏导航设备、眼睛盯着手机或车载系统屏幕,这些无疑都是行车过程中的安全隐患。如今,随着智能语音技术的进阶,智能车载交互系统正在将司机们的手和眼睛从屏幕中解放出来。

两天前,车云菌在奇瑞总部所在地芜湖体验了这款车载系统,并在科大讯飞就车载产品转型问题进行了深入沟通。

关于科大讯飞/讯飞输入法

科大讯飞是由中科大优秀博士生刘庆峰一手创办于1999年,至今已走过17个年头。该公司专注于语音技术研发,所谓语音技术研发主要包括两方面,一方面是让机器听懂人的命令,即语音识别技术;另一方面是让机器本身说话回馈用户,即语音合成技术。

mg游戏平台手机版 3

2010年科大讯飞就推出了”讯飞语音云“技术,即为诸多互联网应用,如QQ、短信、微博等应用提供即时语音识别支持,用户通过说话,就可让机器即时输出文字内容,使用方便而且识别率很高。后来,科大讯飞又相继推出了“讯飞输入法”“讯飞语点”等软件为人熟知。

如果此前没有体验过讯飞输入法,那么罗永浩锤子手机那场发布会一定会让你十分难忘。当罗永浩以较快语速随意语音的时候,手机屏幕马上生成准确无误的文字内容,瞬间收获观众们的一地“眼球”。似乎通过这场发布会,科大讯飞一夜爆红。

如果当时没有看到那场发布会也不要紧,在瑞虎3X智能车载语音系统讲解会上,现场讲解人员随时随性的话语第一时间反应在屏幕上,这种反馈速度和准确度真的让人震惊。

mg游戏平台手机版 4

科大讯飞现在已经成功开发出一套被称为AIUI(Artificial Intelligence User
Interface)的人工智能交互界面,通过集成双全工技术、麦克风阵列技术、声纹识别技术、方言识别、语义理解技术和内容服务,最终实现人机交流能像人与人交流一样轻松。目前瑞虎3X上搭载的这套Cloudrive2.0智能语音车载系统就已经实现了部分AIUI功能,更完善的AIUI将会搭载在下一代车载语音系统上,奇瑞作为科大讯飞多年合作伙伴,也有可能成为最先实现搭载AIUI的厂商之一。

7月12日,《中国科学报》记者应邀参加了由科大讯飞和奇瑞汽车联合发起的“奇瑞艾瑞泽5品质之旅”,并在试驾奇瑞艾瑞泽5的过程中亲身体验了讯飞汽车语音交互系统——智云互联行车系统Cloudrive2.0,全程自然语言交流、普通话识别率接近100%的该系统完成了“解救眼睛与手”的任务。

Cloudrive2.0初体验

Cloudrive2.0车载语音系统此前已用于艾瑞泽5车型上

由于车载语音系统语音识别率低,以至于出现了种种用户和车载系统“对骂”的让人哭笑不得的段子,比如网络上流传已久的山东大汉怒骂车载语音等等。要想让机器真正读懂人类说话,除了上面说到的语音技术研发本身的技术支持,还涉及到口音差异、语速快慢等诸多可能影响的因素。大多车载语音系统还停留在必须要用“标准普通话”“正常语速”才能被机器接纳的水平。因此,提高车在语音系统的语音识别率就显得尤为严峻了。不过,好在经过十几年的努力,科大讯飞利用双麦语音降噪模块,能够令机器识别近20种中国方言,使语言识别率大大提高,达到了97%。

mg游戏平台手机版 5

mg游戏平台手机版 6

这款名为Cloudrive2.0智能车载语音系统是由科大讯飞与奇瑞联合开发的。此前已经搭载在今年3月上市的艾瑞泽5上,而瑞虎3X上搭载的这套语音系统,相比艾瑞泽5上的“智云”系统在软件和硬件方面均有不少提升。硬件条件上采用了双核/2G
RAM/32G ROM。而艾瑞泽5上是双核/2G RAM/8G ROM。

mg游戏平台手机版 7

关于车内4GWiFi,目前是与移动合作,与艾瑞泽5一样,都是每月免费提供500M流量,若超出限额,用户可通过银联、支付宝、微信等方式进行充值,费用是10元/100M。据官方介绍,瑞虎3x上的移动4G
wifi信号极强,可以为多达10部移动终端提供4G网络热点。

mg游戏平台手机版 8

要说这套语音识别系统与传统语音系统最大的不同,除了语音识别率大大超出“市场水平”外,还有一点,就是不像传统语音识别系统那样还需要通过手动按压按钮来开始语音识别程序。这套系统只需简简单单对着中控屏说一声“你好小虎”即可唤醒语音助手,机器就开始进入“备战”状态,随后,用户就可只通过语音对“小虎”“发令”,迅速完成拨打电话、收听音乐、收听广播、导航、查找附近地点等一类日常所需功用。而此前上市的艾瑞泽5的车载语音系统可通过直接说“你好小艾”唤醒语音助手为我们服务。

mg游戏平台手机版 9

当我们对中控屏说出“你好小虎”,唤醒语音助手后,中控屏上以一个小圆点“正在聆听”来反馈给用户。这时我们就可以直接给小虎派任务了,比如“我想听《平凡之路》”或者是“我要去体育馆”“我要打电话给亲爱的”等等,无需动手按钮或触摸屏幕,只需口头发出指令,语音系统能直接识别出你要办的事情,自动开始拨打电话、播放音乐、查找地图等。真正实现了只动口不用动手的语音系统操作体验。

mg游戏平台手机版 10

关于语音下令查找地图,Cloudrive2.0智能车载语音系统也告别了以往语音系统只能固定语言才能查找的弊病,比如,以往我们只能说“找附近的火锅店”,但现在我们直接可以语音下令“我想吃火锅”,车载系统就已经明白需要查找的目标,并自行开始查找,然后将查找出来的火锅店列表,用户可语音告诉系统第几个,这套车载系统就开始了新的导航行程。

在搜索餐馆的时候,这套系统展示出的界面还显示顾客评分及人均消费价格等实用信息,十分便捷。

mg游戏平台手机版 11

mg游戏平台手机版 12

这套系统之所以能展示给我们更智能的一面,是因为科大讯飞与众多公司合作,从而获得了丰富而精确的地图信息,以及一系列千万级的用户兴趣点的大数据,从而更加智能化,展现给我们更多需要的信息点。

mg游戏平台手机版 13

科大讯飞目前已经与30余家应用软件合作,像我们熟知的大众点评、美团、喜马拉雅FM等应用都包含在内,并且除了目前的这些应用软件之外,各类手机上用的软件也会陆续加入,使用户手机和车机也实现互联,双向操控。

mg游戏平台手机版 14

另外,用户可通过专属手机APP,实现随时随地获取车辆信息,将手机查询信息一键发送至汽车、回看行车历史轨迹、查询违章等。最重要的是,这个系统支持免费在线升级,用户可按时选择更新,以随时享受最新的智能体验。

艾瑞泽5启动后,只要一句“小艾你好”,就能够唤醒装载在车上的智云互联行车系统(方向盘和车机上的按钮也可唤醒)。行车中,记者跟“小艾”互动要去的目的地、目的地周边美食、想听的音乐和要拨打的电话号码,“小艾”都能准确识别,并给出推荐结果。

6个月时间完成了Cloudrive2.0的正向开发,软硬数服一体都由科大讯飞来做。在这之前,讯飞并没有车载系统的整合经验。科大讯飞汽车事业部总经理刘俊峰在介绍整款产品时,做了上述说明。

结尾

Cloudrive2.0智能车载语音系统对语言的识别率达到了较高的水平,即便是稍有口音也能正常识别无障碍,最多通过人机交互1-2次也能完美解决。试想一下,如果时速较慢可能我们平时用手操作传统车载系统也许没什么障碍,但如果时速过快的情况下,不需扭头看屏幕,不需动手开启语音识别按键,轻轻松松几句话,车载语音系统解决了我们导航、听音乐、打电话、听收音机等诉求,那么开车行驶的便利性就大大提高了,车载系统也不再被我们忽视,被我们吐槽。

Cloudrive2.0智能车载语音系统由于搭载了技术领先的语音识别系统,使用体验感受大大提升。由此也可以看出,科大讯飞已经实现了从一个语音技术提供商向语音服务提供商的转变,未来这种转变将会更加体现在它所研发的产品上,比如前面说到的更为先进的AIUI应用在车载系统上,或者是更深入的互联功能,像语音控制车内天窗、灯光、空调开关等,非常值得期待,也将是车载系统发展史上的里程碑。

此外,针对一些人普通话不标准的问题,智云互联行车系统Cloudrive2.0特别开发了支持多达16种方言智能识别交互的功能,可对安徽、四川、广东、河南、东北地区等地的方言进行识别,并用方言与用户对话,大大提高了其在方言特色地区的普及率。

系统在奇瑞新款艾瑞泽5上是首次搭载,车云菌在芜湖进行了短暂体验。在整个系统操作的过程中,都可以在车内用方向盘或中控台上的物理按钮唤醒语音命令。不过这个操作,常常被“小艾你好”这条语音唤醒指令代替。

值得一提的是,该系统一改以前语音交互设备的“呆板”形象,其智能程度可以准确地理解自然语言。以前的语音交互体验要求车主只能说固定的命令词,比如说“播放音乐”,但“我想听歌”就不行。其次,车主只能按固定的流程说,比如导航要分步骤报告具体地址才能完成导航设置,而在智云互联行车系统Cloudrive2.0上,用户可以根据自己的说话习惯表达。

mg游戏平台手机版 15

科大讯飞汽车事业部总经理刘俊峰告诉记者,Cloudrive2.0系统还加入了“Barge
in”语音打断技术,并支持多轮对话。这解释了它可以允许用户随时打断正在说话的车机终端,直接更正或给新的任务,而车机系统会马上“闭嘴”,及时对新任务指令作出反应。

目前语音适用于系统的三类功能,第一是信息搜索,包括天气、音乐、股票、酒店等生活资讯查询。第二是动态文本输入,比如在通过蓝牙将手机车机连接导入通讯录后,可以语音指令发送短信。还有一块是文本播读,可以阅读一些新闻等长文本。

此外,基于用户大数据,该系统还能“进化”出人性化的服务。比如它可以根据用户习惯推荐音乐、美食,通过倾听车主的声音来识别性别和检测情绪等。

因为语音指令在整个系统内被打通,因此可以在任意页面唤醒语音识别功能,在发布指令上也可使用更加随意的自然语音。诸如“来首摇滚”、“我饿了”这种口语表达,系统也能识别。准确表达“王菲的红豆”之后,可以直接调出准确结果,免去二级页面再操作。下达“我饿了”这类模糊指令之后,给出的数个选项也可以直接口头回复“第二个”实现选择。

“Cloudrive2.0是整体的软件系统,包括信息服务、车和驾驶者的交互。”科大讯飞执行总裁吴晓如介绍说,未来,智能交互系统的功能会更强大,汽车驾驶的技术门槛将变得越来越低,而随着汽车智能化程度的提高,人在车内的体验会越来越轻松。

mg游戏平台手机版 16

《中国科学报》 (2016-07-19 第6版 前沿)

对行车环境而言,除了准确识别,降噪技术也是一个难点。在硬件上,Cloudrive2.0使用麦克风阵列定位人声,两颗面向驾驶和副驾驶位置的麦克风位于中控台的物理按钮附近,定位准确的音源位置。在路上行驶至60公里/小时,车云菌开窗测试了两次风噪较大时的识别表现,系统成功向我们推送了附近美食和崔健的摇滚。