2025年底,一款叫 OpenClaw 的开源 AI Agent 工具横空出世。因为 Logo 像只龙虾,因此国内都叫他小龙虾。之前所有的 AI 产品,本质上都是问答机器——你问,它答,然后你自己去执行。OpenClaw 打破了这个边界,它可以直接调用工具、操作浏览器、读写文件、发送消息、定时自动运行……它不只是给你建议,而是帮你把事情做完。
应用宝活动平台系统支撑应用宝内包括 app、pc、手助等产品的所有日常/节假日活动,在今年上半年,我们针对整套系统进行了一次完整的重构。正值这个时间点,Harness Engineering 的概念被提出,我们团队也在重构的过程中,针对新的活动平台系统引入 Harness Engineering 的工程实践,初步搭建了一套 AI 端到端的开发流程。 这篇文章主要记录了团队在践行 Harness 工程化过程中遇到的一些问题以及实践经验,抛砖引玉,欢迎其他团队同学一起探讨。
2026 年,几乎每家企业都在谈 AI Agent。 团队花了三周搭了一个 Agent 原型,接入了内部知识库,看 Demo 效果像那么回事儿。然后呢?上线两周后,Agent 把客户的订单信息张冠李戴,把合同条款搞混,在凌晨三点自动发了一封莫名其妙的邮件。你手忙脚乱地关掉自动化,Agent 又变回了一个需要人盯着的聊天机器人。纯赛博嘉豪! 这个故事正在无数企业里反复上演。时至今日,模型智能早已不是问题,开源模型们的能力已经足够完成大多数企业任务。问题在于:技术团队在用 Demo 阶段的工程方法论,去解决生产阶段的系统问题。 过去四年,AI 工程领域范式迁移轮替了四遍。从 2022 年的 Prompt Engineering,到 2025 年的 Context Engineering,到 2026 年初的 Harness Engineering,再到 2026 年中的 Loop Engineering。 每一次演进到底是"新瓶装旧酒"的造词游戏,还是工程关注点的实质性跃迁?这个问题每个人都有自己的观点,但不可否认的,从 Prompt 到 Loop,改变早已在不经意间悄然发生。
Claude 在代码能力上的领先不是偶然,而是一场精心设计的系统工程胜利。本文将 Anthropic 的公开论文与技术逻辑相结合,推理其背后的核心机制。全文约 12000 字,从可验证奖励的本质,到Constitutional AI 的安全护栏,再到产品飞轮的自激强化,逐层拆解这套自我加速的进化引擎。
Kuikly 是腾讯开源的高性能跨端框架,基于 Kotlin Multiplatform 技术,覆盖 Android、iOS、HarmonyOS、H5、微信小程序、Mac 六大平台,支撑业务日活用户超5亿。当 Kuikly 搭配真正懂它的 AI,开发会怎样——零手写代码,仅凭自然语言,7.5 小时交付一套支持 Android、iOS、鸿蒙三端的 AI 聊天 App。看 AI 如何调研组件、扩展原生模块、自行定位 Bug,感受为什么「AI + Kuikly」是当下客户端开发效率最高的组合之一。
过去两年,AI Coding 从"能写出能跑的代码"走到"能放手让它写一整段功能"。但把这个能力放进真实业务、放进多人协作、放进存量系统里跑时我们发现一件怪事——AI 写得越快,整体节奏并没有同步加快。盘点下来,单看"AI 写出来的代码占比"这个数字一路走高,可真正落到版本节奏上,提效却远没有这个数字好看。出码率和提效之间,裂开了一道缝。从 OpenAI Codex 团队那篇 Harness 工程博客里反复强调的一个观察——"早期进展比预期慢,并不是因为 Codex 不具备相应的能力,而是因为环境的规范不够明确"——开始,整个行业都在补同一件事:给模型搭一套能稳定干活的"工作环境"。这一层最近被业界命名为 Harness Engineering——它不是教模型怎么回答,而是设计模型怎么工作。 在这里,也分享下我们的探索之旅,是踩过的坑、做过的取舍、和到现在还没解决的问题。
本文将从算子优化与融合、并行策略、多级缓存、MTP和异步调度优化、量化与稀疏五大维度,逐一剖析各项技术的设计思路、核心算法与实测收益,全面揭示 Hy3 preview 模型在 Hopper 卡上从算子到系统的极致性能优化实践。
传统程序员就业形式正在下滑,AI 相关岗位走势一片大好,渲染一个 AI 实习生等于 10 个外卖员的焦虑并不可取,忽视 AI 这房间里的大象也是鸵鸟行径。 程序员在 AI 时代需要想清楚三件事:怎么驾驭 AI 工具怎么用 AI Build 产品怎么看清 AI 行业趋势 为了帮助大家深入这三个问题,找出自己的答案,腾讯云开发者联合机械工业出版社制定了本期 AI 好书清单,并将为参与互动的读者送出 10 本作为粉丝福利!