首页 > 科学

他们用AI大模型为新能源车赋能

罗咏浩(右一)与团队成员一起上车测试。(受访者供图)

青春名片

长安汽车AI实验室团队：一群聚焦汽车智能座舱AI研发的年轻人。从理念到产品，他们从零开始、精研磨砺，不断改进长安系智能网联新能源车的用户体验。

“你好小安，向右变道。”

“即将向右变道，请确认。”

4月27日下午，长安科技园某试验车旁，一群年轻人围成一圈，一边看着语音交互，一边盯着显示屏。驾驶员轻声喊出“确认”，汽车迅速开启转向灯，同时方向盘自行转动，一气呵成地完成向右侧变道。大家松了口气，随后一齐欢呼起来。

在重庆长安汽车股份有限公司，有一支青年突击队，他们通过AI大模型技术推进汽车智能座舱AI研发，即将上市的新款车就聚合了他们的创新成果。

摸索中找准研发方向

“人工智能突飞猛进，将对汽车产业带来怎样的影响？”2021年8月底，重庆长安汽车股份有限公司成立AI实验室，“90后”罗咏刚成为项目负责人。

“团队建立时，相关领域的探索刚起步，大家的专业也是天差地别。”为了尽快打开突破口，大家摸索开展了动力底盘、工具链等方面研究，“想了很多办法，但效果并不理想。”罗咏刚回忆说。

没有方向，研发就显得盲目和沉重，但这支年轻的团队依然在咬牙坚持。一年后，随着OpenAI推出GPT-3.5版本，团队受到启发，正式确定了努力方向——聚焦汽车智能座舱AI研发。经过短暂讨论，罗咏刚等决定以多意图控制为切口，打开局面。

多意图控制就是通过AI大模型技术使驾驶员可以同时对车辆进行多项功能控制。罗咏刚解释，在传统驾驶座舱，驾驶员打开车窗、空调、氛围灯等控制行为都是一对一控制，要实现多意图控制，就要给车辆装上AI大模型并升级。

罗咏刚团队用了2个月，初步实现了三意图控制。“开窗开空调同时放首周杰伦的歌。”在试验车上，罗咏刚下达指令，不到一秒，车辆如预想般开窗、开空调、放起音乐，大家顿时欢呼雀跃。“这证明我们的研究方向是正确的，数月的坚持没有白费。”

以“多意图控制”为起点，团队迅速展开攻关，很快在语音编排、服务推荐等领域获得突破。

不断把金点子变成好产品

“小安小安，我要导航去大竹林。”不到1秒，驾驶员便收到汽车回复：“我有3条路线，请问你要选择哪一条呢？”这是长安汽车语音交互模块工作的状态。通过云端建立连接，AI大模型借助语音合成技术对用户需求进行反馈，实现人车沟通交流。

其实，早在2024年10月前，这项技术并不成熟。一旦遇上弱网、断网，交互就会中断，非常影响用户体验。团队副总设计师孟艺凝与部分成员萌生了一个想法：如果增加一个线下语音处理模块，是不是就能解决？

“办法看似简单，但操作很难。”孟艺凝说，线下语音处理模块如果通过CPU处理，最简单高效，但CPU需要处理汽车运行中的海量信息，剩余资源十分有限；若是通过DSP数字信号处理技术处理，又会因数据格式的转化造成信息损失，导致反馈存在偏差。最终，团队决定走一条“中间路线”，将“云端”和车载CPU及相应模块、DSP系统整合在一起，通过不断迭代，实现目标。

另外，他们还针对语音交互中的各种痛点进行了分析，按照用户体验最佳、资源利用最少、技术水平最能实现的原则确定了最优解决方案。

今年6月，孟艺凝负责并开发的自然语言处理模块将正式完成并交付。

集思广益找到关键突破口

4月9日，对于团队成员李翔来说是个特别的日子。由他设计并训练的语音模型，正式通过考核进入量产，这是他首个全流程参与完成的产品。

“车载语音系统承担着识别、分析车主意图的职责。我的工作就是训练语音模型。”李翔需要为每一句话中的关键词打上标记，并建立关键词库。1个多月，他收集了上万句相关提问。模型最终调试完毕，并通过了初步测试。

可好景不长，测试部门很快发现了问题，“有时候语音系统听不懂我们说话。”“车载语音系统的回复明显错误。”

“这是因为关键词库还不足以覆盖生活中常用的提问表述方式。”李翔冷静分析。“既然不够，那就升级扩充关键词库。”但是经过努力，测试部门仍给出“效果不佳”的反馈。

于是，李翔将问题带到例会上，与团队成员展开讨论。最终大家决定，通过嵌入AI大模型解决问题。又经一个月调整，李翔的新语音模型出炉。

“前面风景好美。”测试时，一位同事对着语音大模型说出了这样的话。大模型迅速回复：“是否要打开车窗、调整座椅靠背？”李翔激动地表示，这个回复非常符合驾驶者的心意。

今年4月，李翔等人的语音模型终于通过最终测试。几个年轻人激动得湿了眼眶。(新重庆-重庆日报记者卞立成)