Vibe Coding 体验记录和经验分享 / 测试驱动AI开发

原文

最近几天用Vibe Coding高强度地进行游戏项目迭代的实验,得出了一些经验。

相比一年前还没有Agent的交互模式,如今基于本地代码库进行的开发,已经可以确定拥有了实战级代码的输出能力。

无论是业界顶层的技术大牛的评论,还是一线的开发人员的反馈,都已经很明确说明——AI永久改变了编程的方式,我们的工作从手动编程改变到了提出目标和需求,监督AI完成。

技术开发工作的侧重点,从管理和编写一线的技术代码,演变为了制定结构、方案、需求,这几乎确实已经把初/中级开发者的生态地位大幅削弱——或者说重塑了。

当前我使用了两份工具:

  • Codex: 开箱即用,但涉及到敏感操作需要手动批准。
  • OpenCode: 需要一定配置,可以灵活管理权限,包括自动提交git。

关于实际项目:

  • 我们可以通过编写 计划 ,来约束AI执行工作时的目标。
  • 我们可以编写 代码规范架构结构图 等规则,来约束AI生成代码的方式,避免AI将代码胡乱分散在各个地方,完全无法维护。
  • 我们可以使用 AGENTS.md 来强制约束AI遵循一些必要的规则。
  • 我们可以要求AI输出一定规则的配置文件等方式,进而确保我们能够同时兼顾 AI生成代码 + 开发者/策划 调控细节

如何理解AI编程:

  • 当前AI本质上是大语言模型,其发展趋势是不断接近100%的输出正确率,但无法绝对抵达100%。
  • 这种情况下,开发者的工作从手动输出AI也可以输出的内容,演变为了,为AI的输出建立一套保护措施,确保AI生成的内容中的错误能够被及时发现。

所幸软件开发领域早就诞生了 测试 这门技术,我们可以使用AI建立一套单元测试框架,及时发现代码的问题。

尽管我们没有办法100%地保证所有的代码和对应的调用链100%正确,但这已经足够我们应对日常比较基础的生产的情况。

如果你对AI编程还有点顾虑,或者对AI生成的内容质量有焦虑,不妨按照这个思路试试,以测试结果驱动AI开发,做一些复杂工具,或是建设一些核心模块。

我的实验仓库:

更新

刚发布这篇博客,就发现了已经将这套次时代工业化开发流程打包进一个工程的仓库。

生产模式的革命比想象中来得迅猛得多。