FunPlus总监级大佬实战分享:创造工具是AI生产力的第二阶段
本文由 FunPlus 音频总监张志伟投稿而来。
01
从 " 让 AI 做音频 " 到 " 让 AI 做工具 "
还记得两年前 AI 生成音乐带来的热潮吗?从那时起,各大游戏厂商争相展示用 AI 生成的音频内容。仿佛一夜之间,游戏音频制作的门槛被彻底拉低。但作为一线音频从业者,我和团队很快发现,这只是 AI 改变游戏音频的第一阶段。
如今,我们正站在第二阶段的起点:AI 不再仅仅是内容的生产者,它开始成为工具的创造者——从 " 让 AI 做音频 " 到 " 让 AI 做工具 "。
坦白说,第一阶段的 AI 生成内容(AIGC)确实很惊艳,也解决了不少问题:研发版本中的配音,可以用 AI 生成;等不了长时间音乐制作流程的需求,用 AI 音乐来救场。这些已经慢慢改变了以往的工作流程和经验。
但是,还有些痛点其实在工具层面。游戏音频主要会用到三类软件:DAW 音频工作站,中间件声音引擎,游戏引擎。它们三者来自不同厂商、不同年代,开发理念也各不相同。如果有工具从本地素材管理开始,一路到制作、创作、声音引擎、验证游戏内效果等环节都能帮助到从业者,那么游戏研发的效率将会有很大提升。
" 我们日常有些工作其实是重复性工作,比如本地文件管理、修改名称、引擎的导入、建立 Event 和 Bank..." 有天我们团队的阿震曾这样抱怨," 如果能把这些时间省下来专注创作,项目质量肯定能提升一个档次。"
这句话成了我们音频团队探索 AI 自编程工具的起点。与其让 AI 替代创作,不如让 AI 创造工具,解放创作者的双手。
过去半年,我们开发了一系列 AI 自编程音频工具,它们不是什么高深莫测的黑科技,而是解决实际问题的 " 及时雨 "。今天,我想和大家分享这些小工具背后的故事。
02
我们用 AI 做的工具
1. 二次元模拟器
有没有在音频工作站和声音引擎、游戏引擎之间,能够快速去体验声音效果和进行交互混音的工具?这是不少音频设计师一直渴望的。
最初我尝试设计一个小软件,把 RPG、SLG,以及即时操作反馈的音效和音乐按照游戏的逻辑运行起来,模拟游戏中的真实效果给策划同学听,也给音频同学辅助混音。
于是有了我们的第一个自研工具:二次元模拟器。

快速读取音频资源后,它可以立即演示游戏效果。有趣的是,这个最初只是一个简单文字界面脚本的工具,后来在 AI 的协助下,进化成了一个带 UI 的独立程序。AI 不仅帮我们优化了算法,还生成了很多代码。
2. 更大规模混音
但是我们很快发现这个工具模拟的类型比较单一,于是我开始考虑,是否可以设计一款 " 交互声音混音 " 工具,进行游戏中各种声音的混合。
在敲定最初的结构设计后,我们做了这样一款软件:Interactive Mixing。

游戏中的战斗、主城、剧情等各种场景,都可以快速地模拟听觉效果,以及进行多事件混音。当然做这样一款软件,也花费了我很多时间,走过许多弯路后,才慢慢地开发出稳定的版本。
3. 让 AI 音乐工具更懂人话
我们知道主流的 AI 音乐软件,主要是通过提示词的方式进行人机交流,text to music。所以提示词的描述非常关键。但如果你用过 AI 音乐生成工具,一定遇到过这个问题:怎么描述你想要的音乐?
" 我想要一段悲伤的音乐 "?有点笼统了。
" 我想要一段 C 小调、80BPM、弦乐为主的配乐 "?太专业了,普通策划说不出口。
在研究了 AI 音乐技术与生成模型原理后,我开发了这款程序:AI 音乐提示词生成器。它就是为解决这个问题而生的。它能将策划,程序员,美术,也包括音频人员的口语化描述,转换为专业、精确的音乐提示词。
在拉近人类自然语言和扩散模型之间的距离之后,它生成的提示词,可以直接转给接入的 Suno 工具接口。在这个程序的帮助下,我们在音乐方面的生成效率有了相当的提高。

4. 为声音引擎设计助理程序
据我们的不完全统计,一个中型游戏项目,音频设计师在 Wwise 界面上的点击次数可能超过 10 万次,其中大部分是重复操作。
如果能实现从本地文件夹,到 Wwise 内容 Audio、Event、Bank 多层结构的一键导入和管理,那设计师的工作效率将提升数倍。
所以我们的一位资深设计师:欧阳大师傅动起了这个脑筋。最初它只是几个诉求和想法,后来我们尝试让 AI 把它一步一步实现出来。令人惊讶的是,AI 不仅优化了代码,还实现了多套工具的底层链接。当然在过程中,大家也踩了很多坑,被动学到了不少东西(苦笑)。
在之前没有这类工具的时候,我们处理四位数句子数量的语音录音文件需要上百小时;但有了它之后,只需要几十分钟。
我们给它取了一个朴素的名称:Wwise_Tools_ 三合一工具

同事们在使用后,这样总结自己的体验:原本要折腾半天的重复劳动,现在喝杯咖啡的时间就能搞定了。
5. 管理海量的音频本地文件
我们还开发了很多小型工具,专攻本地音频文件管理。
比如阿震做的这款修改名称的小工具,可以按照游戏开发的版本,批量进行文件名称管理和修改。

通过这些自研的工具,我们在提高工作效率的同时,对于探索 AI 与游戏的道路也更加充满期待。
03
结语
回顾这些工具的开发历程,我们发现了一个有趣的现象:AI 确实能大幅提高效率,但真正的价值,还是来自人类的创意和需求。
AI 自编程让工具开发变得更快、更精准,但工具的构思和应用场景,仍然需要一线从业者的经验和洞察。我的一个体会是:一旦拥有了开发工具的能力,工具的使用者将会做出自己最迫切需要的内容。这也是为什么我们强调这是 " 第二阶段 " —— AI 不是来替代人类的,而是来增强人类能力的。
在可预见的未来,游戏音频领域可能会出现更多 AI 辅助工具,它们将继续改变我们的工作方式。但无论技术如何发展,人类的创造力和审美判断,仍将是游戏音频的核心。
拓展阅读:《全球 AI 音频研究艺术家:趣加张志伟告诉你如何用 AI 创作音乐》
游戏葡萄招聘内容编辑,
点击「阅读原文」可了解详情
推荐阅读
鹰角音律联觉 | 苏丹的游戏 | 星穹铁道音乐会
成都慢半拍 | 漕河泾「抬棺人」| 91ACT 复活
对话射雕制作人 | 33 号远征队 | 黑暗世界:因与果
游戏行业书籍推荐:
点击下方名片,关注公众号
(星标可第一时间收到推送和完整封面)