从驾驭框架到养龙虾：我对Agentic编程的几点思考

senvon2026/4/4大约 11 分钟

从驾驭框架到养龙虾：我对Agentic编程的几点思考

最近这段时间，我在深度使用各种AI编程工具的过程中，脑子里一直冒出一个念头——我们是不是把注意力放错地方了？

所有人都在讨论"哪个模型最强"、"谁的推理能力碾压了谁"，但我越用越觉得，问题根本不在模型本身。今天这篇文章，想和大家聊聊我在Agentic编程这个方向上的一些思考，不装，不端，就是一个码农的真实体感。

AI编程

一、Harness：被忽略的真正战场

模型不是瓶颈，驾驭才是

我先说一个可能颠覆很多人认知的事情：当前AI编程的真正瓶颈，不是模型，而是驾驭模型的方式。

这个观点不是我的原创，而是来自安全研究员Can Bölük在2026年2月发布的一篇文章——《The Harness Problem》（驾驭框架问题）。这篇文章在AI编程圈子里引发了很大的讨论，而我读完之后的感受就是：这不就是我一直想说但没说清楚的话吗？

什么是Harness？简单来说，就是连接大语言模型和实际代码操作之间的那层"桥梁"。模型告诉你"该改哪行代码"，而Harness负责把"该改"变成"真的改好了"。听起来简单对吧？但这层桥梁的质量，直接决定了AI编程的成败。

Bölük在文章里做了一组非常硬核的实验：他用16个模型、3种编辑工具，跑了180个任务×3轮的基准测试。结果呢？仅仅是换了一个编辑工具，同一个模型的成功率就能从6.7%飙升到68.3%。 没看错，十倍的提升，模型本身一行都没动。

这就好比说，你给同一个厨师换了一口好锅，做出来的菜就从"勉强能吃"变成了"米其林三星"。问题出在哪？不在厨师，在锅。

为什么我如此认同这个理念

说句掏心窝子的话，我在日常使用各种代码助手的时候，最崩溃的瞬间从来不是"AI理解不了我的需求"，而是——

"AI明明理解了，但它改出来的代码就是不对。"

有时候是空格没对上，有时候是文件格式搞错了，有时候它说"我把第42行改了"，结果改的是第24行。这种挫败感，用过的人应该都懂。

而Harness的理念，恰恰是在解决这个问题。它告诉我们：与其追求一个全知全能的模型，不如把模型和实际工作之间的"接口"打磨好。就像Bölük说的那句话：

"模型是护城河，harness是桥梁。烧掉桥梁只会让更少的人愿意过来。"

我非常认同。而且我认为，这个理念不仅仅适用于编辑工具，它其实指向了一个更大的方向——整个AI编程的生态，需要从"模型中心主义"转向"工程中心主义"。

桥梁连接

二、每个工程，都该有自己的Agent

从"通用助手"到"专属管家"

在使用oh-my-opencode（现在已经改名叫oh-my-openagent了）以及其他各种AI编程插件的过程中，我逐渐形成了一个非常强烈的观点：

用户应该为每一个工程搭建自己的Agent。

注意，我说的是"每一个工程"，不是"每一种语言"，也不是"每一个技术栈"。是每一个具体的、有血有肉的、正在被开发的工程项目。

为什么？

因为不同的项目，它的技术栈不同、代码规范不同、架构风格不同、甚至团队的沟通方式都不同。你让同一个AI助手去同时服务一个Spring Boot企业级项目和一个人的小玩具项目，它能在两个项目上都表现好吗？很难。

这就像你请了一个管家，他既要在五星级酒店当大堂经理，又要在路边小炒店当跑堂。你说他能同时做好两份工吗？理论上可以，但现实中大概率两边都搞砸。

oh-my-opencode给我的启发与失望

那oh-my-opencode做了什么呢？它提供了一个AGENT.md文件，让用户可以在里面描述当前工程的基本信息——比如项目说明、目录结构、技术栈等等。相当于给AI一份"项目说明书"。

但问题是：oh-my-opencode不能定制Agent。

它只能提供静态的工程描述，不能定义Agent的行为、不能配置Agent的能力、不能给Agent分配不同的角色。你写了一段AGENT.md，AI读了一遍，然后呢？它还是那个通用的AI，只不过现在多知道了一些你的项目信息。这和"为每个工程搭建自己的Agent"之间，差了十万八千里。

打个比方，这就好比你给一个新来的员工发了一份《员工手册》，然后告诉他："好了，你现在是这个项目的人了。"你觉得他看了手册就能上手干活吗？不可能的。他还需要：

了解项目的架构设计思路
知道哪些地方是坑、哪些地方是遗产代码
熟悉项目的开发习惯和工作流
理解之前做过的技术决策和背后的原因

这些东西，一个静态的AGENT.md文件根本装不下。更别说不同工程之间的差异——一个Spring Boot的企业级项目和一个人的Vue小项目，它们需要的Agent配置完全不在一个量级上。

所以我对oh-my-opencode的态度是：方向感是对的，但能力远远不够。 它意识到工程需要个性化配置，但仅仅通过编辑一个AGENT.md文件，就想适配所有的工程，这无异于杯水车薪。

真正需要的是什么

我在大纲里用了"至少"这两个字，是有深意的。

我说的最低标准是：每一个工程至少可以定义自己的Agent和系统提示词。 但oh-my-opencode连这一步都没完全做到——它提供了工程描述，但没有提供Agent定制能力。

实际上，我认为一个真正的"项目级Agent"需要具备以下能力：

可定制的Agent角色：不同的Agent可以承担不同的职责（写手、测试、发布……）
记忆系统：能记住项目的历史、决策过程、踩过的坑
技能库：能沉淀项目专属的操作流程和解决方案
知识库：能理解项目的架构、依赖关系、业务逻辑
进化能力：能随着项目的发展不断学习和适应

举个最简单的例子：我之前写过一篇文章《如何破解AI的长链记忆》，里面提到了一个问题——AI在复杂项目中执行到一半，如果当前步骤出错了，用多轮对话解决当前问题的时候，AI很容易就忘了原来的步骤。

如果Agent只有一个静态的AGENT.md，这个问题依然无解。但如果Agent能被真正定制——有自己的角色定义、有自己的记忆系统、有自己的任务上下文，那这个问题就可以在很大程度上被缓解。因为Agent不需要每次都从零开始理解你的项目，它本身就"长"在你的项目里。

只不过，考虑到目前的工具生态成熟度，"为每个工程定制Agent"确实还是一个理想。就像盖房子，我们现在连地基都还没完全打好。但至少，我们应该知道房子长什么样，而不是对着一张纸说"这就是地基了"。

三、养龙虾哲学：项目开发与记忆进化

OpenClaw的记忆能力

如果说Harness解决的是"怎么用"的问题，oh-my-opencode解决的是"谁来用"的问题，那么OpenClaw的出现，则让我看到了一个全新的维度——"怎么记住"的问题。

OpenClaw，圈内人亲切地叫它"龙虾"🦞，是2025年底爆火的一个开源AI智能体项目。虽然它最近争议不断（安全风险、封杀事件什么的），但它的记忆能力，确实让我非常感兴趣。

OpenClaw的记忆系统有几个特点非常打动我：

跨会话记忆：不同的对话之间，它能记住你的工作习惯和项目细节
本地Markdown存储：所有记忆以Markdown文件的形式存在本地，看得见、摸得着、改得了
主动记忆服务：它不是被动地等你问才想起来，而是会主动提供简报或提醒
递归式技能进化：面对未知任务时，它能自主编写代码、调试、然后将成功经验封装为技能文件

最后这一点，我觉得特别牛。它不是简单地把发生过的事情记下来，而是把"怎么解决问题"的经验沉淀下来，变成自己的"肌肉记忆"。

开发项目应该像养龙虾

看到OpenClaw的记忆能力，我突然冒出一个比喻：开发一个项目，应该像养一只龙虾。

别笑，我是认真的。

养过龙虾（或者说养过任何宠物）的人都知道，养宠物不是一个"做完就结束"的事情。你需要：

了解它的习性
记住它的偏好
根据它的成长不断调整饲养方式
在它生病的时候知道怎么照顾

开发项目也是一样的。一个项目从立项到上线，再到迭代维护，是一个漫长的生命周期。在这个过程中，项目会积累大量的"隐性知识"：

哪个模块最容易出Bug？
上次那个奇怪的问题是怎么解决的？
代码风格更偏向哪种？
数据库表结构改过几次？每次为什么改？
之前的架构决策是基于什么考虑做出的？

这些知识，如果只存在于开发者的脑子里，那就太脆弱了。开发者离职、记忆模糊、文档缺失，任何一个环节出问题，这些知识就可能永久丢失。

但如果你的项目有一套像OpenClaw这样的记忆系统，这些知识就能被沉淀下来，变成项目的一部分。项目不再是一个"静态的代码仓库"，而是一个"有记忆、能成长的活体"。

从"养龙虾"到"龙虾脱壳"

龙虾有一个很有意思的生物学特性——它会不断脱壳。每次脱壳，它都会把旧壳里的钙质回收，然后长出一个更大、更强壮的新壳。

我觉得这个特性完美地隐喻了项目的进化过程：

项目积累经验（就像龙虾在旧壳里生长）
经验达到旧框架的极限（旧壳装不下新的龙虾了）
重构/升级（脱壳）
带着之前的经验进入新阶段（新壳更大更强）

而记忆系统，就是这个"钙质回收"的过程。没有记忆的脱壳，就是忘掉一切从头来过；有记忆的脱壳，则是站在过去的肩膀上，走得更远。

三点思考的内在联系

回到文章开头，我说的三个观点，其实是有内在逻辑的：

Harness的理念告诉我们：AI编程的核心瓶颈在工程层，不在模型层
每个工程自己的Agent告诉我们：工程层的优化，要从"项目个性化"开始
养龙虾式的记忆告诉我们：项目个性化的终极形态，是一个有记忆、能进化的"活项目"

从"模型中心"到"工程中心"，从"通用助手"到"专属Agent"，从"无状态工具"到"有记忆的活体"——这就是我看到的Agentic编程的演进方向。

最后说几句

我知道，这篇文章里提到的一些观点，可能会有人觉得"太理想化了"。比如"每个工程都搭自己的Agent"，在目前大多数团队连AI编程都还没普及的情况下，这确实有点超前。

但我始终相信，技术演进的方向是明确的。就像十年前，谁会想到每个项目都有自己的CI/CD流水线？五年前，谁会想到每个项目都有自己的Docker配置？

今天我们觉得"每个工程都有自己的Agent"很奢侈，也许两年后，这就是标配。

毕竟，龙虾之所以能长到那么大，就是因为它一直在脱壳、一直在进化。

我们的项目，也应该如此。

参考来源：- Can Bölük, "The Harness Problem", 2026年2月12日, https://blog.can.ac/2026/02/12/the-harness-problem/- oh-my-openagent GitHub仓库, https://github.com/code-yeongyu/oh-my-openagent- OpenClaw官方文档及社区资料, https://openclaw.ai