哈斯日志
纪录我们在网路上奔波的历程!
AI 编码:从“快感生产力”到“工程闭环能力”的一次校准
星期三, 二月 18, 2026

 

数据正在把幻想拉回地面

过去两年,AI 编码工具的渗透率在持续上升。
2024 年 11 月,某团队内部编码输出直接采用率约 37%,另一团队约 33%;到今天,顶尖模型的“直接采用率”已逼近 44%。这是一个显著的跃迁。

但与此同时,另一组数据开始显露“结构性反噬”。

Veracode 在 2025 年 9 月发布的《GenAI Code Security Report》中,对 80+ 真实任务、100+ 大模型、覆盖 Java / Python / C# / JavaScript 等企业主流语言进行安全扫描,结论清晰而刺眼:
45% 的 AI 生成代码未通过安全测试,且集中于 OWASP Top 10 级别的高危漏洞。

更具冲击力的是效率侧的数据。
METR 在 2025 年 2–6 月对 16 名、平均拥有 5 年以上大型代码库(>100 万行)经验的高级工程师进行对照实验,246 个真实任务中:

  • 开发者主观预测:AI 提速 +24%

  • 客观结果:整体速度 下降 19%

  • 但任务完成后,开发者仍认为自己更快了 20%

这不是技术问题,而是认知问题。


AI 编码的本质不是“写代码”,而是“生成假象”

当前阶段的 AI 编码,有一个被系统性误解的核心:
它极大地提升了“代码出现的速度”,但并不等价于“工程前进的速度”。

原因并不复杂:

  • LLM 并不理解“系统”,只是在复述“模式”

  • 它不知道你的历史决策、技术债、约束条件

  • 它不会为未来三个月的维护成本负责

在新项目、空白项目中,这个缺陷被掩盖;
在成熟系统、复杂仓库中,这个缺陷被无限放大。

AI编码更像是在沙盘不断震荡,进而使得tokens的排布无限接近于编码规范、输入需求规划和目标产出约束的最佳分布。

  1. 沙盘震荡AI 编码在生成过程中,本质上是在一个“概率空间”里进行探索和扰动,每一次输出都是对上下文、prompt、历史 token 的微调尝试。

  2. tokens 排布优化:每一段代码、每一个符号、每一个命名都是 token 的分布,AI 的内部优化目标是在“合理性、可编译性、模式匹配”上逼近最优解。

  3. 编码规范收敛:通过反复震荡和微调,AI 的输出逐渐符合语法、风格、设计模式、甚至潜在业务逻辑的隐性规范。

  4. 输入-输出闭环对齐:最佳的token 分布并非孤立存在,必须同时满足:

    • 输入需求规划(需求意图、约束条件)

    • 目标产出约束(功能正确性、性能、安全、可维护性)

  5. 隐性学习与收敛:在这个过程中,AI 不断“试错”,其内部概率分布像在做蒙特卡洛搜索,震荡最终收敛于一种工程上可接受、与人类审查闭环相兼容的输出分布。

换句话说,AI 编码真正的力量不在于一次输出的正确性,而在于 通过沙盘式震荡不断逼近工程闭环的最优 token 排布。这种思路也暗示了为什么对初学者、实验型项目,它的效率惊人;对成熟系统,它仍然需要人类监督,否则“震荡”可能引入隐性技术债。

因此,AI 编码并没有均匀地提升所有人、所有阶段、所有项目的效率,而是制造了一次明显的分化曲线


从六个视角看清 AI 编码的真实边界


编码效率:快的是“产出”,慢的是“闭环”

AI 的优势集中在:

  • 重复性逻辑

  • 明确范式(CRUD、API glue code)

  • 一次性脚手架

但在真实工程中,编码只是闭环的一小段
你还需要:

  • 写 prompt(本身就是一种隐性编码)

  • 等待响应

  • 审查输出(75% 的开发者逐行阅读)

  • 大幅修改(56% 需要重构)

  • 调试“幻觉式错误”

效率并没有消失,只是被重新分配到了“审查与修正”上。

编码质量:统计正确 ≠ 工程正确

45% 的安全失败并非偶然。
LLM 的训练语料本身就包含大量:

  • 过时实践

  • StackOverflow 式捷径

  • 未修复漏洞的真实代码

模型不区分“对”与“危险”,只区分“常见”与“不常见”。
这意味着:AI 天生是一个“风险复制器”

创造性:AI 在“新项目”中最强,在“既有系统”中最弱

在不存在的项目里,AI 的创造性极具优势:

  • 它能快速探索解空间

  • 能生成多种实现路径

  • 能帮助你“起飞”

但在一个已有 5 年历史、200 个模块、无数隐含约定的系统中,
“创造性”往往意味着 破坏隐性秩序

对新人:这是一次结构性红利

对初级开发者,AI 是:

  • 实时导师

  • 示例生成器

  • 认知补全工具

27%–39% 的效率提升并不夸张。
他们缺的是“模式”,而 AI 恰好擅长模式。

对老员工:这是一次噪音注入

高级工程师的优势在于:

  • 上下文压缩能力

  • 系统性判断

  • 对历史决策的理解

AI 输出的“看似合理代码”,反而打断其思考节奏,制造额外校验成本。
于是,主观更快,客观更慢

对 IT 系统生命周期的影响

  • 新 IT 项目:AI 是“启动加速器”

  • 成熟系统维护:AI 是“风险放大器”

  • 长期演进:AI 只能嵌入闭环,不能替代闭环


重述与强化:真正的分水岭是“是否形成工程闭环”


AI 编码的价值,不在于“会不会写代码”,而在于:

是否被嵌入一个 可验证、可回滚、可审计、可演进 的工程闭环中。

没有测试、没有安全扫描、没有架构约束、没有责任归属的 AI 编码,
不是生产力工具,而是技术债加速器

这也是为什么:
能真正受益的,不是“用 AI 的人”,而是知道什么时候不用 AI 的人


2026 年


AI从无到有创造一个SPA应用或者独立闭环系统,那是没问题的。但是不你能仔细看,如果你做深入的、详尽的代码审查和产品级发布review,就发现很多细思极恐的细节问题。

AI 编码已经是工程现实,但仍处在:

  • 助手阶段

  • 增强阶段

  • 人类主导阶段

它会更强大,也能独立完成特定任务,但不会独立完成一切。
真正的演进方向不是“AI 写更多代码”,而是:

AI 参与更多工程闭环节点,但不拥有最终决策权。

未来的关键能力,不是“Prompt Engineering”,
而是 AI-in-the-loop Engineering ——
把 AI 约束在工程理性之内,而不是沉迷于速度幻觉。

这,才是 AI 编码从工具走向基础设施的真正门槛。

二月 18, 2026 · loverty
微信分享二维码

用微信扫描二维码
分享此文章

0条评论

发表评论

<< Home

AI助手

你好!我是哈斯日志的AI助手

我可以基于当前页面内容回答你的问题。

💡 首次使用可能需要等待模型加载(约20-30秒)

有什么想了解的吗?
刚刚