从驾驭框架到养龙虾:我对Agentic编程的几点思考
从驾驭框架到养龙虾:我对Agentic编程的几点思考
最近这段时间,我在深度使用各种AI编程工具的过程中,脑子里一直冒出一个念头——我们是不是把注意力放错地方了?
所有人都在讨论"哪个模型最强"、"谁的推理能力碾压了谁",但我越用越觉得,问题根本不在模型本身。今天这篇文章,想和大家聊聊我在Agentic编程这个方向上的一些思考,不装,不端,就是一个码农的真实体感。

一、Harness:被忽略的真正战场
模型不是瓶颈,驾驭才是
我先说一个可能颠覆很多人认知的事情:当前AI编程的真正瓶颈,不是模型,而是驾驭模型的方式。
这个观点不是我的原创,而是来自安全研究员Can Bölük在2026年2月发布的一篇文章——《The Harness Problem》(驾驭框架问题)。这篇文章在AI编程圈子里引发了很大的讨论,而我读完之后的感受就是:这不就是我一直想说但没说清楚的话吗?
什么是Harness?简单来说,就是连接大语言模型和实际代码操作之间的那层"桥梁"。模型告诉你"该改哪行代码",而Harness负责把"该改"变成"真的改好了"。听起来简单对吧?但这层桥梁的质量,直接决定了AI编程的成败。
Bölük在文章里做了一组非常硬核的实验:他用16个模型、3种编辑工具,跑了180个任务×3轮的基准测试。结果呢?仅仅是换了一个编辑工具,同一个模型的成功率就能从6.7%飙升到68.3%。 没看错,十倍的提升,模型本身一行都没动。
这就好比说,你给同一个厨师换了一口好锅,做出来的菜就从"勉强能吃"变成了"米其林三星"。问题出在哪?不在厨师,在锅。
为什么我如此认同这个理念
说句掏心窝子的话,我在日常使用各种代码助手的时候,最崩溃的瞬间从来不是"AI理解不了我的需求",而是——
"AI明明理解了,但它改出来的代码就是不对。"
有时候是空格没对上,有时候是文件格式搞错了,有时候它说"我把第42行改了",结果改的是第24行。这种挫败感,用过的人应该都懂。
而Harness的理念,恰恰是在解决这个问题。它告诉我们:与其追求一个全知全能的模型,不如把模型和实际工作之间的"接口"打磨好。就像Bölük说的那句话:
"模型是护城河,harness是桥梁。烧掉桥梁只会让更少的人愿意过来。"
我非常认同。而且我认为,这个理念不仅仅适用于编辑工具,它其实指向了一个更大的方向——整个AI编程的生态,需要从"模型中心主义"转向"工程中心主义"。

二、每个工程,都该有自己的Agent
从"通用助手"到"专属管家"
在使用oh-my-opencode(现在已经改名叫oh-my-openagent了)以及其他各种AI编程插件的过程中,我逐渐形成了一个非常强烈的观点:
用户应该为每一个工程搭建自己的Agent。
注意,我说的是"每一个工程",不是"每一种语言",也不是"每一个技术栈"。是每一个具体的、有血有肉的、正在被开发的工程项目。
为什么?
因为不同的项目,它的技术栈不同、代码规范不同、架构风格不同、甚至团队的沟通方式都不同。你让同一个AI助手去同时服务一个Spring Boot企业级项目和一个人的小玩具项目,它能在两个项目上都表现好吗?很难。
这就像你请了一个管家,他既要在五星级酒店当大堂经理,又要在路边小炒店当跑堂。你说他能同时做好两份工吗?理论上可以,但现实中大概率两边都搞砸。
oh-my-opencode给我的启发与失望
那oh-my-opencode做了什么呢?它提供了一个AGENT.md文件,让用户可以在里面描述当前工程的基本信息——比如项目说明、目录结构、技术栈等等。相当于给AI一份"项目说明书"。
但问题是:oh-my-opencode不能定制Agent。
它只能提供静态的工程描述,不能定义Agent的行为、不能配置Agent的能力、不能给Agent分配不同的角色。你写了一段AGENT.md,AI读了一遍,然后呢?它还是那个通用的AI,只不过现在多知道了一些你的项目信息。这和"为每个工程搭建自己的Agent"之间,差了十万八千里。
打个比方,这就好比你给一个新来的员工发了一份《员工手册》,然后告诉他:"好了,你现在是这个项目的人了。"你觉得他看了手册就能上手干活吗?不可能的。他还需要:
- 了解项目的架构设计思路
- 知道哪些地方是坑、哪些地方是遗产代码
- 熟悉项目的开发习惯和工作流
- 理解之前做过的技术决策和背后的原因
这些东西,一个静态的AGENT.md文件根本装不下。更别说不同工程之间的差异——一个Spring Boot的企业级项目和一个人的Vue小项目,它们需要的Agent配置完全不在一个量级上。
所以我对oh-my-opencode的态度是:方向感是对的,但能力远远不够。 它意识到工程需要个性化配置,但仅仅通过编辑一个AGENT.md文件,就想适配所有的工程,这无异于杯水车薪。
真正需要的是什么
我在大纲里用了"至少"这两个字,是有深意的。
我说的最低标准是:每一个工程至少可以定义自己的Agent和系统提示词。 但oh-my-opencode连这一步都没完全做到——它提供了工程描述,但没有提供Agent定制能力。
实际上,我认为一个真正的"项目级Agent"需要具备以下能力:
- 可定制的Agent角色:不同的Agent可以承担不同的职责(写手、测试、发布……)
- 记忆系统:能记住项目的历史、决策过程、踩过的坑
- 技能库:能沉淀项目专属的操作流程和解决方案
- 知识库:能理解项目的架构、依赖关系、业务逻辑
- 进化能力:能随着项目的发展不断学习和适应
举个最简单的例子:我之前写过一篇文章《如何破解AI的长链记忆》,里面提到了一个问题——AI在复杂项目中执行到一半,如果当前步骤出错了,用多轮对话解决当前问题的时候,AI很容易就忘了原来的步骤。
如果Agent只有一个静态的AGENT.md,这个问题依然无解。但如果Agent能被真正定制——有自己的角色定义、有自己的记忆系统、有自己的任务上下文,那这个问题就可以在很大程度上被缓解。因为Agent不需要每次都从零开始理解你的项目,它本身就"长"在你的项目里。
只不过,考虑到目前的工具生态成熟度,"为每个工程定制Agent"确实还是一个理想。就像盖房子,我们现在连地基都还没完全打好。但至少,我们应该知道房子长什么样,而不是对着一张纸说"这就是地基了"。
三、养龙虾哲学:项目开发与记忆进化
OpenClaw的记忆能力
如果说Harness解决的是"怎么用"的问题,oh-my-opencode解决的是"谁来用"的问题,那么OpenClaw的出现,则让我看到了一个全新的维度——"怎么记住"的问题。
OpenClaw,圈内人亲切地叫它"龙虾"🦞,是2025年底爆火的一个开源AI智能体项目。虽然它最近争议不断(安全风险、封杀事件什么的),但它的记忆能力,确实让我非常感兴趣。
OpenClaw的记忆系统有几个特点非常打动我:
- 跨会话记忆:不同的对话之间,它能记住你的工作习惯和项目细节
- 本地Markdown存储:所有记忆以Markdown文件的形式存在本地,看得见、摸得着、改得了
- 主动记忆服务:它不是被动地等你问才想起来,而是会主动提供简报或提醒
- 递归式技能进化:面对未知任务时,它能自主编写代码、调试、然后将成功经验封装为技能文件
最后这一点,我觉得特别牛。它不是简单地把发生过的事情记下来,而是把"怎么解决问题"的经验沉淀下来,变成自己的"肌肉记忆"。
开发项目应该像养龙虾
看到OpenClaw的记忆能力,我突然冒出一个比喻:开发一个项目,应该像养一只龙虾。

别笑,我是认真的。
养过龙虾(或者说养过任何宠物)的人都知道,养宠物不是一个"做完就结束"的事情。你需要:
- 了解它的习性
- 记住它的偏好
- 根据它的成长不断调整饲养方式
- 在它生病的时候知道怎么照顾
开发项目也是一样的。一个项目从立项到上线,再到迭代维护,是一个漫长的生命周期。在这个过程中,项目会积累大量的"隐性知识":
- 哪个模块最容易出Bug?
- 上次那个奇怪的问题是怎么解决的?
- 代码风格更偏向哪种?
- 数据库表结构改过几次?每次为什么改?
- 之前的架构决策是基于什么考虑做出的?
这些知识,如果只存在于开发者的脑子里,那就太脆弱了。开发者离职、记忆模糊、文档缺失,任何一个环节出问题,这些知识就可能永久丢失。
但如果你的项目有一套像OpenClaw这样的记忆系统,这些知识就能被沉淀下来,变成项目的一部分。项目不再是一个"静态的代码仓库",而是一个"有记忆、能成长的活体"。
从"养龙虾"到"龙虾脱壳"
龙虾有一个很有意思的生物学特性——它会不断脱壳。每次脱壳,它都会把旧壳里的钙质回收,然后长出一个更大、更强壮的新壳。
我觉得这个特性完美地隐喻了项目的进化过程:
- 项目积累经验(就像龙虾在旧壳里生长)
- 经验达到旧框架的极限(旧壳装不下新的龙虾了)
- 重构/升级(脱壳)
- 带着之前的经验进入新阶段(新壳更大更强)
而记忆系统,就是这个"钙质回收"的过程。没有记忆的脱壳,就是忘掉一切从头来过;有记忆的脱壳,则是站在过去的肩膀上,走得更远。
三点思考的内在联系
回到文章开头,我说的三个观点,其实是有内在逻辑的:
- Harness的理念告诉我们:AI编程的核心瓶颈在工程层,不在模型层
- 每个工程自己的Agent告诉我们:工程层的优化,要从"项目个性化"开始
- 养龙虾式的记忆告诉我们:项目个性化的终极形态,是一个有记忆、能进化的"活项目"
从"模型中心"到"工程中心",从"通用助手"到"专属Agent",从"无状态工具"到"有记忆的活体"——这就是我看到的Agentic编程的演进方向。
最后说几句
我知道,这篇文章里提到的一些观点,可能会有人觉得"太理想化了"。比如"每个工程都搭自己的Agent",在目前大多数团队连AI编程都还没普及的情况下,这确实有点超前。
但我始终相信,技术演进的方向是明确的。就像十年前,谁会想到每个项目都有自己的CI/CD流水线?五年前,谁会想到每个项目都有自己的Docker配置?
今天我们觉得"每个工程都有自己的Agent"很奢侈,也许两年后,这就是标配。
毕竟,龙虾之所以能长到那么大,就是因为它一直在脱壳、一直在进化。
我们的项目,也应该如此。
参考来源:- Can Bölük, "The Harness Problem", 2026年2月12日, https://blog.can.ac/2026/02/12/the-harness-problem/- oh-my-openagent GitHub仓库, https://github.com/code-yeongyu/oh-my-openagent- OpenClaw官方文档及社区资料, https://openclaw.ai
