车机语音助手里的“MOSS”,魅族能实现吗?
《流浪地球2》里出现的智能量子计算机550W,是“MOSS”,某种意义上说也算BOSS。
如果切换到当时当下的智能电动车市场,车机语音助手是否也能成为类似存在,对答如流又充满思考性,尚有悬念。但或许,这并不妨碍行业为之持续探索。
2月6日,魅族“FlymeAuto主理人计划”发布第四期议题——更聪明的语音手应该怎样?有评论直接建议“做一个手机版MOSS”。
从2022年11月18日起,“FlymeAuto主理人计划”徐徐展开,从智能座舱和手机的N种连接方式,手机和智能座舱如何协同才能称之为最佳拍档,下车后的便捷操控,到今天这个语音助手相关话题,无一不透露出魅族对车载OS的思考。
FlymeAuto是魅族手机操作系统Flyme在智能座舱上的延续,根据魅族规划,FlymeAuto将建立人与人、人与物、物与物之间的互联互通,最终实现多终端、全场景、沉浸式融合体验。
不过截至目前,FlymeAuto还没有公开任何实质性进展。
结合魅族做过手机的经历,语音助手可能要比之前几期议题更具讨论性。比如,更新到9.3版本的Aicy(前身小溪)可能即将迎来新的OTA升级。至于包含了语音、识屏、纵览、影像和建议的Aicy在车端会有怎样的变化,仍是个未知数。
盖世汽车研究院的数据显示,2022年前8个月里,语音交互功能在座舱的渗透率已经达到73.3%,仅次于中控屏的89.1%。同时近三年里,语音交互功能渗透率不断提升,现已成为汽车标配之一。
但从大约十年前车机语音助手面世以来,其受到的争议就没有间断过。如今已是成熟年纪,却基本都还是小孩子。
语音助手最初目的是解放驾驶员和乘客的双手,利用语音唤醒开启或者关闭各种功能。事实上,市面上大多数语音助手产品还处于“发育不成熟”阶段。“不配合”的情况也时有发生。
比如去年上市的理想L9首度在后排娱乐屏上应用了3D ToF手势交互,而非语音助手,但由于技术欠佳,一度受到诟病。不过在之后的L7、L8新车型上,理想依然坚持选用了车内手势控制。
相较早期的触控方式,语音和手势交互一定程度上有助于驾驶员集中注意力,降低事故发生风险。和手势相比,语音交互的学习成本要更低一些。只是某些场景或者对于听力不佳的驾驶员来说,手势也的确有其优势所在。
而语音和手势若想彻底取代机械和触控交互,前提条件一定是,机器反应足够迅速且失误率低。至于全自动驾驶目标的实现,容错率则是零。
以车机语音交互为例,ASR(包含信号输入、降噪以及音素选取等流程)、NLP(包含NLU与NLG,涉及词性标注与文本信息处理)、TTS(包含语音的后端拼接合成,同时也是语音拟人化核心环节)等构构成三个关键环节,同时也是当前行业发展仍需重点突破的技术模块。
另外,摆在“魅族们”面前的,始终还有一个问题:如何让语音助手更智能,拥有更拟人且连贯的沟通能力。有观点认为,语音助手也可以从ChatGPT的走红中借鉴经验。
行业有毫末智行借鉴其中的人类反馈强化学习RLHF的训练方式,得到人驾自监督认知大模型。大概思路是,先从模型入手得到一个奖励模型(reward model),让其知道什么是好的开法,什么是不好的,以及哪些行为需要改进,从而训练出更高质量的算法模型。
“万物皆可ChatGPT”。从这个角度看,AI语音助手的算法模型或许也能从中受益,创造更接近真人的互动对话。
图片来源:魅族社区
再者,在差异化、定制化被着重强调的时代背景下,语音助手不仅要变聪明,还要有辨识度,以打造不可替代的产品标签。
在已有的车机语音助手基础上,支持自定义唤醒词、开发更有吸引力的虚拟形象、人声,升级离线语音包等等。显然,“魅族们”可以做的事实在太多。最新消息是,魅族在申请注册“无界汽车”商标后,又将目光投到了“无界手机”上,国际分类是科学仪器。
魅族要做的事似乎很多,但最好别丢了西瓜捡芝麻。
来源:盖世汽车
作者:徐珊珊
本文地址:
以上内容转载自盖世汽车,目的在于传播更多信息,转载内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网,如有侵权请联系admin@d1ev.com删除。