从Transformer验证到团子平台:一个技术团队的Harness群体智能十年暗线

“做它比看到它要难得多”——这是李笛在奇绩创坛DemoDay上说的一句话。那是2024年12月7日,他在压轴登场时系统性地抛出了群体智能理论,对Harness趋势做出了准确预判。彼时OpenClaw还未引发行业震动,行业对多智能体的理解仍停留在“把几个Agent串起来”的阶段。半年后的今天,这条判断已被验证。 从Transformer验证到团子平台:一个技术团队的Harness群体智能十年暗线 IT技术

技术路线的三次关键节点

2022年底是第一个节点。彼时Transformer架构的合理性已被彻底验证,其颠覆性潜力让行业看到了全新可能。李笛团队自筹算力把这条线先跑了起来。但兴奋之余,他们发现一个更为根本的问题:有些障碍不是靠模型能力变强就能绕过去的。 从Transformer验证到团子平台:一个技术团队的Harness群体智能十年暗线 IT技术

这个问题种子早在小冰时代就已埋下。团队最初的目标就不止于打造一个“小冰”,而是构建千千万万个能精准匹配用户需求、且彼此配合的AI。实践中他们发现,单个Agent再聪明,一旦放进多智能体场景,局面就失控了——要么“表演式一致”,要么互相冲突内耗。完全依赖模型自身驱动协同,远远不够。 从Transformer验证到团子平台:一个技术团队的Harness群体智能十年暗线 IT技术

2023年初是第二个节点。团队提出CoT是关键,自研了“小冰链”(X-CoTA)。仅使用GPT-3约2%的参数量,便实现了可观测、可追溯的思维链构建。真正高效的协同,不能只共享结论,更要同步思考过程。 从Transformer验证到团子平台:一个技术团队的Harness群体智能十年暗线 IT技术

2025年12月9日是第三个节点。李笛带领微软小冰创始核心团队成立明日新程(Nextie),手握完全的决策权。团队将核心方向锁定为原生群体智能与认知模型,延续对“多智能体协同”的长期思考。 从Transformer验证到团子平台:一个技术团队的Harness群体智能十年暗线 IT技术

“认知碰撞”:Harness的核心工程方法

明日新程的Harness核心包含三个关键组件:上下文管理、参与其中的多智能体、多智能体协同方法。其中多智能体协同方法最为关键,团队内部称之为“认知碰撞”——通过辩论、挑战、反思、同行评审、投票等方式,让多智能体真正实现思辨与互补。 从Transformer验证到团子平台:一个技术团队的Harness群体智能十年暗线 IT技术

上下文管理确保信息准确、全面且适度;Agent池优化则根据任务需求动态搭配不同功能定位的Agent,实现协同效率最大化。这种体系既能解决OpenClaw等框架的长程协同痛点,让多智能体在长周期任务中保持稳定高效;又能通过群体思辨、共识机制,打破单一Agent的认知盲区。 从Transformer验证到团子平台:一个技术团队的Harness群体智能十年暗线 IT技术

团子平台:从方法论到产品落地

2025年2月,首个原生群体智能平台“团子”(tuanzi.ai)发布内测版。用户提出问题后,几十个Agent成团“围坐一桌”,各抒己见、互相补充、辩论交锋,甚至还有投票表决、同行评审这样的专业环节。 从Transformer验证到团子平台:一个技术团队的Harness群体智能十年暗线 IT技术

评测数据显示,在视角完备性、辩证深度、落地实操性、隐含诉求满足度、决策五维度指标中,Nextie综合表现显著优于竞品。超过ChatGPT-5.2Thinking等单一大模型的同时,在达到同等思考深度情况下,整体Token消耗降低约50%。 从Transformer验证到团子平台:一个技术团队的Harness群体智能十年暗线 IT技术

卫士虾(TuanziGuardianClaw)则是群体智能能力的又一次实战验证——这只专门堵OpenClaw安全漏洞的Agent,完全由团子群体智能体自主协同设计而成。

方法提炼:Harness的本质是“约束换自主”

Harness意为“马具”,类比到AI领域,就是连接“模型”与“人类需求”的核心框架。它不直接参与任务执行,却能通过明确的约束、规范与协同机制,引导多智能体高效协作,避免失控,实现“约束换自主”的核心价值。

包括OpenAI、Anthropic在内,越来越多顶尖团队已意识到Harness是智能体落地的核心支撑。OpenAI在《HarnessEngineering:LeveragingCodexinanAgent-FirstWorld》中通过实验证明,3人工程师小组在5个月时间里利用Agent可构建百万行代码的产品。Anthropic发布的ManagedAgents架构,技术文档中也有反复强调“AgentHarness”。

这个判断,李笛团队早在去年就已给出。如今技术条件、市场环境、团队状态终于迎来同频共振的时刻。粮草已备,多智能体赛道的下半场,正式开始。