车研网CHEYAN.net 首页 资讯 行业评论 查看内容

车机语音助手里的“MOSS”,魅族能实现吗?

2023-2-8 08:38| 发布者: 老黄Charlin| 查看: 174| 评论: 0|原作者: 徐珊珊|来自: 盖世汽车

摘要: 《流浪地球2》里出现的智能量子计算机550W,是“MOSS”,某种意义上说也算BOSS。如果切换到当时当下的智能电动车市场,车机语音助手是否也能成为类似存在,对答如流又充满思考性,尚有悬念。但或许,这并不妨碍行业 ...

《流浪地球2》里出现的智能量子计算机550W,是“MOSS”,某种意义上说也算BOSS。

如果切换到当时当下的智能电动车市场,车机语音助手是否也能成为类似存在,对答如流又充满思考性,尚有悬念。但或许,这并不妨碍行业为之持续探索。

2月6日,魅族“FlymeAuto主理人计划”发布第四期议题——更聪明的语音助手应该怎样?有评论直接建议“做一款手机版MOSS”。

 

从2022年11月18日起,“FlymeAuto主理人计划”徐徐展开,从智能座舱和手机的N种连接方式,手机和智能座舱如何协同才能称之为最佳拍档,下车后的便捷操控,到今天这个语音助手相关话题,无一不透露出魅族对车载OS的思考。

FlymeAuto是魅族手机操作系统Flyme在智能座舱上的延续,根据魅族规划,FlymeAuto将建立人与人、人与物、物与物之间的互联互通,最终实现多终端、全场景、沉浸式融合体验。

不过截至目前,FlymeAuto还没有公开任何实质性进展。

结合魅族做手机的经历,语音助手可能要比之前几期议题更具讨论性。比如,更新到9.3版本的Aicy(前身小溪)可能即将迎来新的OTA升级。至于覆盖了语音、识屏、纵览、影像和建议的Aicy会在车端有怎样的变化,仍是个未知数。 

车机语音助手里的“MOSS”,魅族能实现吗?

盖世汽车研究院的数据显示,2022年前8个月里,语音交互功能在座舱的渗透率已经达到73.3%,仅次于中控屏的89.1%。同时近三年里,语音交互功能渗透率不断提升,现已成为汽车标配之一。

但从大约十年前车机语音助手面世以来,其受到的争议就没有间断过。如今已是成熟年纪,却基本都还是小孩子。 

语音助手最初目的是解放驾驶员和乘客的双手,利用语音唤醒开启或者关闭各种功能。事实上,市面上大多数语音助手产品还处于“发育不成熟”阶段。“不配合”的情况也时有发生。

比如去年上市的理想L9首度在后排娱乐屏上应用了3D ToF手势交互,而非语音助手,但由于技术欠佳,一度受到诟病。不过在之后的L7、L8新车型上,理想依然坚持选用了车内手势控制。

相较早期的触控方式,语音和手势交互一定程度上有助于驾驶员集中注意力,降低事故发生风险。和手势相比,语音交互的学习成本要更低一些。只是某些场景或者对于听力不佳的驾驶员来说,手势也的确有其优势所在。 

而语音和手势若想彻底取代机械和触控交互,前提条件一定是,机器反应足够迅速且失误率低。至于全自动驾驶目标的实现,容错率则是零。

车机语音助手里的“MOSS”,魅族能实现吗?
 

以车机语音交互为例,ASR(包含信号输入、降噪以及音素选取等流程)、NLP(包含NLU与NLG,涉及词性标注与文本信息处理)、TTS(包含语音的后端拼接合成,同时也是语音拟人化核心环节)等构构成三个关键环节,同时也是当前行业发展仍需重点突破的技术模块。

另外,摆在“魅族们”面前的,始终还有一个问题:如何让语音助手更智能,拥有更拟人且连贯的沟通能力。有观点认为,语音助手也可以从ChatGPT的走红中借鉴经验。

行业有毫末智行借鉴其中的人类反馈强化学习RLHF的训练方式,得到人驾自监督认知大模型。大概思路是,先从模型入手得到一个奖励模型(reward model),让其知道什么是好的开法,什么是不好的,以及哪些行为需要改进,从而训练出更高质量的算法模型。

“万物皆可ChatGPT”。从这个角度看,AI语音助手的算法模型或许也能从中受益,创造更接近真人的互动对话。

车机语音助手里的“MOSS”,魅族能实现吗?

图片来源:魅族社区

在差异化、定制化被着重强调的时代背景下,语音助手不仅要变聪明,往往还要有辨识度,以打造不可替代的产品标签。

在已有的车机语音助手基础上,支持自定义唤醒词、开发更有吸引力的虚拟形象、人声,升级离线语音包等等。显然,“魅族们”可以做的事实在太多。最新消息是,魅族在申请注册“无界汽车”商标后,又将目光投到了“无界手机”上,国际分类是科学仪器。

魅族要做的事似乎很多,但最好别丢了西瓜捡芝麻。

"您的鼓励,是我前进的动力"
还没有人打赏,支持一下

鲜花

握手

雷人

路过

鸡蛋

相关阅读

最新评论