他们用AI大模型为新能源车赋能

罗咏浩(右一)与团队成员一起上车测试。(受访者供图)

青春名片

长安汽车AI实验室团队:一群聚焦汽车智能座舱AI研发的年轻人。从理念到产品,他们从零开始、精研磨砺,不断改进长安系智能网联新能源车的用户体验。

“你好小安,向右变道。”

“即将向右变道,请确认。”

4月27日下午,长安科技园某试验车旁,一群年轻人围成一圈,一边看着语音交互,一边盯着显示屏。驾驶员轻声喊出“确认”,汽车迅速开启转向灯,同时方向盘自行转动,一气呵成地完成向右侧变道。大家松了口气,随后一齐欢呼起来。

在重庆长安汽车股份有限公司,有一支青年突击队,他们通过AI大模型技术推进汽车智能座舱AI研发,即将上市的新款车就聚合了他们的创新成果。

摸索中找准研发方向

“人工智能突飞猛进,将对汽车产业带来怎样的影响?”2021年8月底,重庆长安汽车股份有限公司成立AI实验室,“90后”罗咏刚成为项目负责人。

“团队建立时,相关领域的探索刚起步,大家的专业也是天差地别。”为了尽快打开突破口,大家摸索开展了动力底盘、工具链等方面研究,“想了很多办法,但效果并不理想。”罗咏刚回忆说。

没有方向,研发就显得盲目和沉重,但这支年轻的团队依然在咬牙坚持。一年后,随着OpenAI推出GPT-3.5版本,团队受到启发,正式确定了努力方向——聚焦汽车智能座舱AI研发。经过短暂讨论,罗咏刚等决定以多意图控制为切口,打开局面。

多意图控制就是通过AI大模型技术使驾驶员可以同时对车辆进行多项功能控制。罗咏刚解释,在传统驾驶座舱,驾驶员打开车窗、空调、氛围灯等控制行为都是一对一控制,要实现多意图控制,就要给车辆装上AI大模型并升级。

罗咏刚团队用了2个月,初步实现了三意图控制。“开窗开空调同时放首周杰伦的歌。”在试验车上,罗咏刚下达指令,不到一秒,车辆如预想般开窗、开空调、放起音乐,大家顿时欢呼雀跃。“这证明我们的研究方向是正确的,数月的坚持没有白费。”

以“多意图控制”为起点,团队迅速展开攻关,很快在语音编排、服务推荐等领域获得突破。

不断把金点子变成好产品

“小安小安,我要导航去大竹林。”不到1秒,驾驶员便收到汽车回复:“我有3条路线,请问你要选择哪一条呢?”这是长安汽车语音交互模块工作的状态。通过云端建立连接,AI大模型借助语音合成技术对用户需求进行反馈,实现人车沟通交流。

其实,早在2024年10月前,这项技术并不成熟。一旦遇上弱网、断网,交互就会中断,非常影响用户体验。团队副总设计师孟艺凝与部分成员萌生了一个想法:如果增加一个线下语音处理模块,是不是就能解决?

“办法看似简单,但操作很难。”孟艺凝说,线下语音处理模块如果通过CPU处理,最简单高效,但CPU需要处理汽车运行中的海量信息,剩余资源十分有限;若是通过DSP数字信号处理技术处理,又会因数据格式的转化造成信息损失,导致反馈存在偏差。最终,团队决定走一条“中间路线”,将“云端”和车载CPU及相应模块、DSP系统整合在一起,通过不断迭代,实现目标。

另外,他们还针对语音交互中的各种痛点进行了分析,按照用户体验最佳、资源利用最少、技术水平最能实现的原则确定了最优解决方案。

今年6月,孟艺凝负责并开发的自然语言处理模块将正式完成并交付。

集思广益找到关键突破口

4月9日,对于团队成员李翔来说是个特别的日子。由他设计并训练的语音模型,正式通过考核进入量产,这是他首个全流程参与完成的产品。

“车载语音系统承担着识别、分析车主意图的职责。我的工作就是训练语音模型。”李翔需要为每一句话中的关键词打上标记,并建立关键词库。1个多月,他收集了上万句相关提问。模型最终调试完毕,并通过了初步测试。

可好景不长,测试部门很快发现了问题,“有时候语音系统听不懂我们说话。”“车载语音系统的回复明显错误。”

“这是因为关键词库还不足以覆盖生活中常用的提问表述方式。”李翔冷静分析。“既然不够,那就升级扩充关键词库。”但是经过努力,测试部门仍给出“效果不佳”的反馈。

于是,李翔将问题带到例会上,与团队成员展开讨论。最终大家决定,通过嵌入AI大模型解决问题。又经一个月调整,李翔的新语音模型出炉。

“前面风景好美。”测试时,一位同事对着语音大模型说出了这样的话。大模型迅速回复:“是否要打开车窗、调整座椅靠背?”李翔激动地表示,这个回复非常符合驾驶者的心意。

今年4月,李翔等人的语音模型终于通过最终测试。几个年轻人激动得湿了眼眶。(新重庆-重庆日报记者 卞立成)