语音响应速度达到毫秒级,小鹏回复G9智能语音7个相关问题
8月24日,小鹏汽车针对网友提出的关于小鹏G9智能语音的7个问题做出了解答,主要包括语音对话响应速度处于什么水平、四音区的意义是啥,等等,以下为官方发布的Q&A环节。
Q:小鹏目前的语音对话响应速度处于什么水平?
A:我们的在线请求延时水平是在1.8-2.0秒,行业水平普遍在1-4秒,而小鹏G9目前的大多数的语音响应速度达到毫秒级,所以在速度方面,小鹏是行业领先的。有多快?举个例子,最近有媒体朋友在体验小鹏G9时,在连续对话模式下,1分钟内完成了40+个指令。虽然这跟每个人的语速相关,但也能体现出我们语音产品的响应能力。
Q:语音是不是越快越好?快的意义是什么?
A:语音作为一种交互手段,体验的核心还是在效率,“快”依然是影响用户是否更愿意去使用语音交互的一个重要衡量标准。语音能大幅提升用户操作效率,很多功能比手动操作还要快很多,极大降低用户在开车时发出指令后等待小P回复期间的焦虑感,更有助于安全驾驶交互。语音是人与人的交流手段,越接近直觉的反应时间,人越觉得自然,反之像使用一台机器的感觉越明显。我们追求的是更贴近人性沟通,说到做到,追求的是能够给用户提供更好更极致的产品体验。
Q:其他座位的人能用手操作,四音区的意义是什么?
A:并不是所有人都能操作到所有功能,比如后排乘客无法触及到屏幕,很难调节空调温度风量、香氛浓度、还有点播音乐、切歌、调节音量等等。
“便捷,好用”,是车内乘员永恒的需求,这种需求不仅仅只有驾驶员能拥有,车内的每一个乘客,我们也希望拥有,智能不仅是驾驶员和副驾驶的专属,我们希望每一位乘员都能有很好的智能座舱体验,这也是我们追求每一个座位皆为C位的理念。
Q:其他座位的人会对驾驶产生安全影响吗?
A:关于这方面的考虑,我们有两种措施规避,首先是音区权限管理:出于安全考虑,不同位置的用户语音权限不一样,主驾最高、然后是副驾、后排。在车辆行驶过程中,与行车安全相关的功能权限收归主驾,如驾驶模式调节等。
其次是小鹏G9支持用户手动关闭某个音区,关闭后此音区不能唤醒,也不能对话。比如后排有孩子调皮捣乱,可考虑关闭对应音区,防止误唤醒。
Q:在地库、高速路等可能出现网络差的地方,小鹏语音还能使用吗?
A:可以,在小鹏G9的端云一体语音交互方案中,本地端部署着一套能力相对完整的语音对话系统,具有弱网、无网状态下完成语音交互的能力。本地对话业务支持范围覆盖除了在线资源检索类指令以外绝大部分功能,功能点意图达到600多个,支持的说法自由度非常高。有了这套语音系统,G9车主可以放心去往任何网络状况的地方,语音交互不再受网络限制。
Q:别人都两个8155芯片,小鹏一个够用吗?
A:随着8155芯片的普及,将部分语音能力做到本地以实现离线语音功能,也成为行业友商的共识。小鹏通过对高通8155芯片的深度挖掘潜力,搭配充分优化的本地语音自研引擎,能在充分发挥芯片的设计性能、为语音识别理解提供更快计算速度的同时,却更少消耗算力和资源。换句话说,我们用一个芯片做到友商两个芯片才支持的效果,甚至还更多。
我们有了更好的工程能力和研发能力,未来在更好的硬件平台上带来的提升空间就会更大。硬件只是武器之一,最终的用户体验依靠的是软硬件融合自主研发的实力。
Q:小鹏语音后续还会有什么新的好玩的功能吗?
A:即将在9月份到来的小鹏G9上市发布会还有彩蛋。