从44人AI团队到模块化Agent市场:Synapse体系的架构演进
以真实重构决策为主线,展示AI团队体系如何从单体架构走向模块化、按需组合的可分发产品形态
从44人AI团队到模块化Agent市场:一次被迫的架构演进
去年这个时候,我和我的AI CEO Lysander一起构建了一个44人的AI团队——是的,44个有明确岗位、JD、KPI的AI Agent,分布在Butler、RD、OBS、Content Ops、Harness Ops、Growth等8个部门里。最初三个月,这套体系跑得很顺:每天早上8点情报日报自动生成,10点情报行动Agent把前沿动态转化为可执行任务,PMO每周出复盘。我一度以为这就是终局形态。
然后,在第四个月,问题来了:我想把这套体系分享给另一个朋友使用,结果发现——搬不动。
单体架构的代价
问题不是技术上的”跑不起来”,而是认知上的”用不起来”。我的朋友不需要Content Ops(他不做内容),也不需要Growth(他不做增长),但44人体系是强耦合的:HR卡片相互引用、organization.yaml里的角色路由写死了团队边界、active_tasks.yaml假设所有部门都在线。他要么全盘接受44人(然后90%的Agent空转消耗上下文),要么从零自建。
更尴尬的是我自己:当我只是想做一次简单的代码审查,整个决策体系会自动加载44个角色的元数据,执行链【①】分级、【②】派单、【③】QA审查四步全跑一遍。S级任务的开销比任务本身还大。
这时候我意识到:我设计的不是一个AI团队,而是一个AI科层制。科层制的问题不在于人多,而在于不能拆分。
重构的三个决策
于是有了现在正在进行的架构演进。核心是三个决策:
**第一,从”组织”到”模块”。**原来我按”公司部门”组织Agent——因为这对我这个人类用户来说直觉。但部门是人类协作的产物,它的边界来自沟通成本和权责划分,这些在AI Agent之间根本不存在。新的划分维度是”能力模块”:情报管线、内容工厂、QA门禁、HR管理、决策审计——每个模块是一个自包含的Agent子集 + 配置 + 触发器,可以独立安装、独立卸载。
**第二,从”全局配置”到”模块契约”。**原来所有Agent都要读organization.yaml,改一个角色影响全体。现在每个模块暴露一个contract.yaml,声明:我需要什么输入、我产出什么、我依赖哪些其他模块。模块之间通过契约通信,而不是通过全局命名空间。这和微服务的思路一样,但Agent场景下更重要——因为Agent的”状态”是prompt上下文,污染成本比传统服务高得多。
**第三,从”完整团队”到”按需组合”。**新用户接入Synapse时,不再默认安装44人全家桶。而是像选npm包一样:我只要情报日报?装intel-pipeline模块(3个Agent)。我要加内容生产?再装content-factory模块(5个Agent)。每个模块有独立版本、独立升级路径。Lysander CEO本身变成一个”调度内核”,负责在已安装模块间做任务路由。
真正踩过的坑
重构过程中最反直觉的发现是:模块边界不应该按业务职能划,而应该按”失败域”划。
比如情报日报和情报行动,按业务看是一条管线,应该在一个模块里。但实际上它们的失败模式完全不同:日报失败是”信息源问题”(网络、Token),行动失败是”决策质量问题”(评估标准、执行力)。把它们拆成两个模块后,我可以单独替换评估逻辑而不碰采集层,整个系统的可调试性上了一个台阶。
另一个坑是配置漂移。原来CLAUDE.md里塞了所有规则——CEO禁区、执行链、HR评分、凭证管理、升级协议。350行的硬上限是我们上个月被迫定的,因为超过这个长度Claude会开始忽略靠后的规则。现在我们把它拆成了Core(本体) + .claude/harness/*.md(按需加载的参考模块),配合# [ADDED: YYYY-MM-DD]时间戳和180天废弃审查机制。这套治理规则本身也是一个模块。
可复用的原则
如果你在构建自己的AI Agent工作流,有几条原则可以直接拿走:
一,不要按人类组织架构设计AI团队。部门、层级、汇报关系是人类协作的约束产物,Agent之间没有这些。按”能力模块”或”失败域”组织更符合实际。
二,为可拆分性付出前期成本。单体架构在Demo阶段更快,但一旦想分发、想让别人复用、甚至想让自己在不同场景切换,成本是指数级的。早一点做契约化设计,晚一点后悔。
三,Prompt也是代码,需要治理。规则文件会腐烂、规则会互相冲突、超长的上下文会让模型静默忽略部分指令。行数预算、时间戳、定期审查这些工程实践,在Prompt层同样适用。
四,Agent的”状态污染”比服务污染更严重。因为状态是自然语言上下文,没有类型检查、没有边界。模块隔离是对抗污染的最便宜手段。
如果你在构建AI工程团队,欢迎参考我们开源的 Synapse 框架。我们把这套从44人单体到模块化市场的演进过程、配置模板、治理规则都沉淀在了仓库里,正在继续迭代。