开发背景
了解Harness的运行机制以后,我找了个小东西练练手.我选择了浏览器插件.
- 我固执的认为,后续的AI很大概率会以插件的方式存在,而浏览器是一个非常重要的工具.
- 完全了解Harness的原理,冲入一个完全陌生的领域,能检测AI对我的提升.
基于上述2点,我选择了为浏览器开发一个AI插件.
这个是源码,有心人自取.
了解Harness的运行机制以后,我找了个小东西练练手.我选择了浏览器插件.
基于上述2点,我选择了为浏览器开发一个AI插件.
这个是源码,有心人自取.
还记得OpenClaw推出的时候,有人说,这个东东是AI操作系统.
如果真的是操作系统,那么我可以这么推断:
Harness,正是操作系统的cpu调度理论和内存清理理论.
说句题外话,Deepseek4的发布,就像它的发布标题一样,这套操作系统的运行内存,从200k的时代进入到了1M时代,虽然国外早就到2M了.
要知道,现在的计算机,也是从64k内存开始起步的.
最近这段时间,我在深度使用各种AI编程工具的过程中,脑子里一直冒出一个念头——我们是不是把注意力放错地方了?
所有人都在讨论"哪个模型最强"、"谁的推理能力碾压了谁",但我越用越觉得,问题根本不在模型本身。今天这篇文章,想和大家聊聊我在Agentic编程这个方向上的一些思考,不装,不端,就是一个码农的真实体感。
我先说一个可能颠覆很多人认知的事情:当前AI编程的真正瓶颈,不是模型,而是驾驭模型的方式。
这个观点不是我的原创,而是来自安全研究员Can Bölük在2026年2月发布的一篇文章——《The Harness Problem》(驾驭框架问题)。这篇文章在AI编程圈子里引发了很大的讨论,而我读完之后的感受就是:这不就是我一直想说但没说清楚的话吗?
在Trae的SOLO发布以后,这边聊聊AI编程这种模式的最终形态.
先做如下假设:
上述条件我们很容易推导出以下结论:
AI的长链记忆,目前是各大模型公司,一个比较棘手的问题,也是一个非常热门的讨论点。
我在长时间,高强度使用了各个代码助手,模型以后,对于长链记忆,提一些不一样的思考和角度.
我在过去的一段时间,在大范围,高强度的使用各种代码助手和模型,在使用过程中就发现如下问题
注意 前后端请求采用POST+JSON的方式,而AI在执行过程中,如果页面生成不是在一起,后面的页面就会出现Restful的调用方式.记录我在AI编程、大模型应用、Agent开发等方面的一些思考和探索。
现在说到软件就是AI.
软件行业中一直存在一个无所不能的位置.曾几何时,这个位置上坐着的是SOA,后面又换成了微服务,中台.当然,也曾经坐过区块链,web3.0等等.
只不过现在这个位置上坐着的,是AI而已.
笔者正好最近稍微研究了一下,谈谈感受.
到目前为止,人类最牛逼的AI模型,和AI交互的,都是文字.和所谓的大模型,从算法和本质上看,也是一个猜字游戏.
那么好了,因为AI只能处理文字,所以AI的性能和传统应用的性能差距不是一般的大.如果把AI的输入和输出,看成是一个完整的交互的话,那么这个输入和输出的性能和传统的计算机软件相比,是要被喷死的.传统软件的输入输出性能都是按照毫秒为单位的,而AI的输入输出是按照秒为单位的.在不看数字,只看单位就相差1000倍.
现在说到软件就是AI.
软件行业中一直存在一个无所不能的位置.曾几何时,这个位置上坐着的是SOA,后面又换成了微服务,中台.当然,也曾经坐过区块链,web3.0等等.
只不过现在这个位置上坐着的,是AI而已.
笔者正好最近稍微研究了一下,谈谈感受.
到目前为止,人类最牛逼的AI模型,和AI交互的,都是文字.和所谓的大模型,从算法和本质上看,也是一个猜字游戏.
那么好了,因为AI只能处理文字,所以AI的性能和传统应用的性能差距不是一般的大.如果把AI的输入和输出,看成是一个完整的交互的话,那么这个输入和输出的性能和传统的计算机软件相比,是要被喷死的.传统软件的输入输出性能都是按照毫秒为单位的,而AI的输入输出是按照秒为单位的.在不看数字,只看单位就相差1000倍.