打开APP

科大讯飞雷琴辉:感知输入融合决策,每一台车都将成为懂你的助手

2021年6月17日-19日,由中国汽车工业协会主办的第11届中国汽车论坛在上海嘉定举办。站在新五年起点上,本届论坛以“新起点 新战略 新格局——推动汽车产业高质量发展”为主题,设置“1场闭门峰会+1个大会论坛+2个中外论坛+12个主题论坛”,全面集聚政府主管领导、全球汽车企业领袖、汽车行业精英,共商汽车强国大计,落实国家提出的“碳达峰、碳中和”战略目标要求,助力构建“双循环”新发展格局。其中,在6月18日下午举办的主题论坛“智能网联汽车产业生态的融合与升级”上,科大讯飞智能汽车副总裁雷琴辉发表了主题演讲。以下内容为现场演讲实录:

图片 33.png

非常高兴到上海参加今天论坛,前面有很多主机厂领导友商都提到了我们,今天我就在这里面给大家介绍一下,科大讯飞在智能座舱里面的想法,和大家一起分享。

分两块儿:1.我们希望联合构建智能座舱工程化的协同体系。

2、汇智共创智能座舱产品体验新高度。

我们看一下这里,整车软件开发模式,其实现在在发生变更,从感知输入融合决策,以人工智能为核心的软件体系,成为我们智能汽车的核心竞争力。

在讯飞角度,我们理解分了这么多层,其中用户输入、车辆感知以及智能驾驶座舱的平台软件,我们从感知输入层面到融合决策层面做了这几个事情,这几个事情也是讯飞现在做得比较多的地方。

我们整个传统的智能汽车软件开发面临巨大的挑战,其实问题不用多说,我们也都知道,刚才有些朋友问我,为什么讯飞从单点语音合成到识别,到现在整个智能化都有了,其实想回答并不是讯飞做了这些,而是行业变革了,需要这些东西,所以我们才越做越多了,原来我们做的是合成,原来汽车做TTS就为了导航的播报,“前方左拐”。慢慢合成以后有了识别的需求,识别以后有了自然语言理解的需求,理解完了以后有对话的需求,有了视觉的需求,这些需求包括后面数据的管理,大数据的推动等等,还有场景,都是行业发展使我们有这些东西。

我们构建了讯飞这方面做的事情,我们认为要从全栈的,端到端的产品能力。从云端到产品,从云端产品原子化,解决刚才的问题,我们希望能够不管云端还是本地端能够原子化,能够某些模块为我们所用,不是原来那样的,每个都要特定的定制开发,但是最终肯定面向不同的用户,不同的客户,不同的车有不同的展现形式。

另外科大讯飞通过工具和平台的沉淀,使我们场景工程化高效落地。我们有AI平台、场景平台、知识大脑、有设计工具平台,把角色盒子、大数据平台、对话平台运营管理标注,这是讯飞相对擅长的一块儿。

围绕汽车生命周期,我们协同构建了从产品的开发体系,从产品规划、交付到营销推广售后,全方位推出自己的产品。比如汽车产品规划阶段,我们有自己的产品技术、交互、数据,从交付之后,我们做质量成本定制,营销我们也做量点包装,品牌赋能,产品培训,最后我们对客户问题的响应,对问题的OTA,这一系列东西,是我们工程化的基础。

我们看一下,基于工程化之后,讯飞在智能座舱里面想达到比较好的体验,我们做了哪些想法?与各位领导专家一起分享。

我们目标五条:

1、智能座舱产品持续引领行业变革。

2、我们拥有超级的音效体验产品。

3、每台车都可以不断成长。

4、每个用户都能触达。

5、我们对每一个车都提供无忧的服务。

我们从哪些方面来做?这是讯飞认为汽车全产业链的价值链,或者用户的使用,就不一一给大家念了。

基于从这些用户的链里面推出了智能交互、智能音效,汽车AI营销等四大解决方案,这里面有我们的工程化的底座+AI技术支撑+云平台,一起支持这个事情的呈现。

解决方案里面,如果我们换一个视角看这个事情,我们场景和用户体验驱动我们的设计,这四个产品还在,我们建立自己的数据中心,数据中台,这个也不全是讯飞自己的也可以和各个车厂联合建,我们的人工智能技术还是放在这。

通过这里面打造了一起更加“智能”的,打了一个引号“智能”的各种东西,希望通过人工智能能够在面向整个汽车的全生命链里面,提供我们的能力。刚才有一位兄弟一直问我,讯飞汽车信源怎么样,其实我们是开放、包容的,我们既不站队,也不建队,我们希望自己的技术,我们的产品能够和行业里面优秀的,好的信源,好的内容一块儿,一起往前走。

从用户体验来说,我们的生态,其实这些开放的生态,车厂自己的生态,线下4S店的生态,这是属于原来理解比较多的,咱们比较开放的生态,讯飞自己基本都没建,都是跟大家一起,各位兄弟伙伴给面子合作,抬着我们一起往前走的,比如高德、QQ音乐都有合作,我们不排除任何一家。

讯飞有自己的特色,在这个地方。其实不管我们的玩具、教育、医疗,我们的交通车网,讯飞有很多面向各个行业里面的其他生态,这是我们比较独特的。

我们回过头刚才说了音效,其实讯飞在音效解决方案里面,做了硬件、软件,也跟刚才说的各位朋友一起做了应用,也做了品牌。其实汽车里面,声音大家感知还是蛮强烈的,我开车这么多年,车里面的声音对我们这些人有感觉,而现在其实国内大家都在热,现在人都招不到了,挺热了。而我们布这个事儿是2018年,讯飞从技术底层,从音效算法、合成算法开始往前做,这块儿讯飞有这个想法,听这块儿也要做。

我们最终就是希望每一台车都有懂你的助手,我们从形象、声音、感知、推荐、情感各个方面打造一个助手,刚才威马的林总说了这个事情。

我们看一下,助手有哪些东西?我们有做人设、做形象,有通过各种组件给整合成一个,打造一个符合每一款车都有独特的个性,最终目标希望对每个人有不同的,对这台车的体验有不同的感觉。回过头来,我们是属于技术派,拆出来变成我们做这么多的场景,这些场景里面怎么用技术能够支撑得了它,实现得了它。

这里声音复刻,时间关系不播了,能够让小孩儿变成车上合成的声音,TTS的声音变成你家小孩儿了,这还是挺有用的事情。

另外感知侧我们做了哪些事儿?我们希望这个车可以听得更准,怎么听得更准?我们在这里面做了降噪以及各种分音区,使得我们听得更准,首先车要和你交互,像在座的各位,首先我得有一个扬声器,否则这个声音出不来,扩大不了,它得听清楚。

第二希望看得清楚。前段大会视频或者是远程的感觉还是差一些,在座的各位也有对我这块儿表示鼓励的,也有充满疑惑的,我都能看到大家的表情,我认为这是一件很重要的事情。车上也是一样,如果一辆车听得见,看不见肯定也是有问题,所以它也得看清楚。

基于听得见,看得见,我们将声音和图像结合起来,中间部分就是结合的,身份识别也是可以靠声音,也是可以靠图像,画像也是。咱们通过“纯动+声音”可以极大提高在高噪和恶劣环境下的语音识别效果。这两边是各自有效的事情。

除了刚才说的针对听和看,其实还有一大块儿,后面咱们国内车厂兄弟也会出去,我们还是先放一下,就是要做的,第一大类方言,没法给中国每一个方言做一套识别器,今天上午有媒体朋友问我,我说做不到,因为我是江西人,当时提问两个媒体也是江西的,我们那边说,隔山听不见,隔条河也听不清楚,这是事实,特别是山多、水多的地方,所以不太可能给每个方言做一个语言,但是做大类没有问题。

另一个事情就是多语种,要往前做。国内的车厂,包括合资的还是自主的,合资属于进口转出口,咱们也有从国内做好了,往外卖的,还有自主车厂走出去的,如果我们需要多语种,讯飞在这块儿是义不容辞要布局的,我们也努力将这块儿做好。另外交互我们希望更直接、更简洁地往前走。

除了刚才车本身的能力之外,我们还要看到每个车,它让每个乘客,我们希望它能够做到独享的空间,这个已经做到了,刚才王总提到我们应该也在合作做一些多音区的听,分区听,分区说,还有3D环绕声,在不同的声音上出来这种声音。讯飞还是比较技术的,我们提供了手势、音效、语音识别、合成、交互、回声、分区,目的还是希望能够让各个车厂、合作伙伴能够看菜选单,形成不同的组合的特色产品。

交互里面我们通过视觉知道它在哪里面,这也是我们的目标。有了这些之后还差一点,你感知到了,比如在座的地方感知到我热了,怎么办?它最好能够把空调自己调一下,感知到我口渴了,最好水就过来了这里也是一样,感知到这些动作以后要做推荐,推荐也有算法,为什么讯飞做推荐,或者数据公司的推荐,因为要大数据,这个也是我们为行业提供的能力,我既可以提供推荐,分析数据的能力,归纳数据的能力,也可以做推荐的场景。这个地方要实时刷新,这里也要和各位合作伙伴一起合作,实现共赢的生态。

这里简单的演示,通过定制,刚才的华为领导做过了,他做了ADAS的,我们可以定制整个交互,你想怎么定制怎么定制,定制完了,屏幕可以显示出来,时间关系就不放了。各种配置,看菜单做编程,还不是我们真正写代码,就这样的编程,基本上可以做到各种推荐、配置、界面变化基本都能够出来了。一键下去,这边响应出来,把一个场景通过可视化的方式做出来。

另外我们为智能管家,比如智能化的构建,是专家支持运营。这个事情额外提一句,专家知识比较难搞,我们现在喊得比较多,认得知识构建能力远超过机器,人是很奇特的,我第一次来到这个酒店,第一次来到这个房间,第一次见到各位领导同事,但我很快就知道我在做什么,我在哪里,我要做什么事儿。但是要让电脑完成这个事情是比较困难的,知识图谱这件事情,虽然大家喊得很厉害,但是技术角度来说,这是我们未来人工智能很难的一件事情。

另外我们打造一个沉浸式的体验,比如上车的交互引导、智能问答就不念了,这个事情怎么说好像大家都在做,我们也在做,我们希望做出一点有特色,有亮点的东西过来,然后和各位朋友一起共创更好,更有亮点的东西。

最后是我们在产品,集团数智体验升级。刚才我提到整个车从它的线下实体店,到闭环这么一圈,各个地方离不开。比如OAI消毒系统,我们去年推出来,今年其实不少人想用,确实还有些用处,不能说绝对好用,但确实有些用处,能解决我们很多问题。原来我们传统的,或者我们用最基础的方法,去打电话,去分析电话怎么样,现在机器基本可以替大家完成了。

我们从整个链条里面提供所有的信息和数据的汇总,当然这个车厂可以自己建。最后还是到这一句,我讲得比较快,如果有伙伴、媒体想更多了解,可以线下交流。

最后我们还是希望通过打造智能的五点,让我们在行业继续发挥自己作用,让汽车智能化这个行业,越做越大,因为越做越大,越做越多,我们做软件、算法的,就有更多的市占,对我们来说就是好的事情。

谢谢大家!

来源:第一电动网

作者:王鸣幽

本文地址:

返回第一电动网首页 >

相关内容
全部评论·0
暂无评论
我要评一下