Uber 用 5 个月做出 500 个 AI Skills,对中国企业真正的启示是什么
过去一年,很多企业都在讨论 AI Agent。
有人在做智能客服,有人在做自动写代码,也有人在尝试构建各种“企业 AI 助手”。
但一个更现实的问题是:
为什么很多 AI 项目停留在演示阶段,而无法真正进入企业日常流程?
最近,Uber AI Foundations 团队负责人 Adam Hooda 分享了 Uber 内部推动 Claude Skills 的过程。这并不是一个“AI 概念展示”,而是一场发生在真实复杂企业环境中的工程体系演进。
5 个月时间里,Uber 内部的 Claude Skills 从 2 个增长到 500+,覆盖代码审查、测试验证、生产监控、性能优化、知识调用等多个研发场景。
更值得关注的不是“500 个技能”本身,而是 Uber 采用的方法。
它揭示了一件事:
企业 AI 的核心问题,从来不是模型能力,而是如何把 AI 接入真实业务流程、组织协作和工程体系。
从“做一个 Agent”到“构建 AI 工作系统”
很多企业在推进 AI 时,默认思路是:
- 为某个场景开发一个 Agent
- 给它配置 Prompt
- 接入知识库
- 上线一个聊天界面
但企业很快会发现问题:
- Agent 很难长期维护
- 每个场景都要重复开发
- 规则、权限、审批越来越复杂
- 不同团队之间无法复用
- 一旦业务变化,Agent 很快失效
Uber 的方向并不是不断增加“定制 Agent”。
而是逐渐形成了一种新的结构:
通用 Agent + Skills + 工程治理体系
Claude 是统一入口。
真正沉淀企业能力的,是各种可复用的 Skills。
这些 Skills 并不只是 Prompt,而是包含:
- 流程步骤
- 调用规则
- 系统操作
- 验证逻辑
- 错误处理
- 知识调用
- 输出标准
本质上,它们是在把企业内部原本依赖“经验”和“人”的工作方式,逐步沉淀成可运行、可复用、可治理的 AI 工作机制。
这也是很多中国企业正在进入的新阶段:
不是“有没有 AI”,而是 AI 能否真正进入业务现场。
Uber 真正重要的,不是技术,而是治理结构
很多企业看到“500 个 Skills”,第一反应是:
“怎么管理?”
这恰恰是 Uber 最值得参考的地方。
他们采用的是“双层市场”结构:
第一层:核心技能市场
这一层类似企业级“标准能力库”。
特点是:
- 默认可用
- 有 Owner
- 有评估机制
- 有 CI/CD 流程
- 有效果验证
- 有性能要求
它保证企业核心流程的稳定性。
第二层:团队和个人实验市场
工程师可以自由创建、分享、试验新技能。
有效的能力再逐渐进入核心市场。
这个结构解决了企业 AI 推进中的一个典型矛盾:
- 完全开放,质量会失控
- 完全集中,创新会停滞
很多企业 AI 项目失败,不是因为模型不好,而是因为:
- 没有权限边界
- 没有审核机制
- 没有版本治理
- 没有知识维护机制
- 没有风险分级
- 没有运行监控
结果 AI 只能停留在试验阶段。
真正进入生产环境后,企业需要的不是“一个机器人”,而是一整套运行机制。
企业最重要的资产,不是 Prompt,而是“组织经验”
Uber 有一个很典型的案例。
他们的性能优化技能,并不是 AI 自己“学会”的。
而是由两位长期做 Go 和 Java 性能优化的资深工程师,把多年经验沉淀成了可执行的 Skill。
这件事背后有一个非常重要的变化:
过去企业里的关键经验,通常存在于:
- 资深员工脑中
- 零散文档里
- 聊天记录中
- 各种“只有某个人知道”的流程里
而 AI 的真正价值之一,是第一次让这些经验可以被系统化、流程化、持续复用。
这也是为什么很多企业在推进 AI 时,最终会发现:
真正困难的不是模型接入,而是知识整理。
包括:
- 历史工单
- 操作规范
- 合同规则
- 审批流程
- FAQ
- 系统权限
- 风险规则
- 业务判断标准
如果这些知识本身是混乱的,AI 很难稳定工作。
所以企业 AI 项目的核心,往往不是“训练模型”,而是:
梳理流程、整理知识、定义规则、建立验证机制。
AI 真正进入企业,需要“确定性”
Uber 在访谈里反复强调一个词:
“确定性输出”。
例如一个性能优化 Skill,不应该只告诉工程师:
“我优化了你的代码。”
而应该明确说明:
- 做了哪些优化
- 哪些成功
- 哪些失败
- 为什么失败
- 修改了什么
- 风险是什么
这是企业 AI 和个人 AI 最大的区别之一。
个人场景可以接受“差不多”。
但企业场景必须:
- 可验证
- 可追溯
- 可审计
- 可回滚
- 可监控
尤其在客服、售后、合同、财务、人事、供应链等场景里,AI 不是回答一个问题,而是在参与业务流程。
这意味着:
企业真正需要的,不只是模型能力,而是:
- 权限控制
- 审批机制
- 日志留痕
- 风险识别
- 人工兜底
- 效果评估
- 持续优化
AI 只有进入这些机制,才能真正成为生产工具。
企业 AI 的关键,不是“更聪明”,而是“更可运行”
很多企业仍然在关注:
- 哪个模型更强
- 哪个 Agent 更聪明
- 哪个 Prompt 更好
但从大量实际项目来看,真正决定 AI 能否落地的,通常不是模型上限,而是运行体系。
包括:
- 是否能接入现有系统
- 是否能调用企业数据
- 是否符合权限要求
- 是否能处理异常流程
- 是否能长期维护
- 是否能持续优化
- 是否能被业务团队真正使用
Uber 的经验很重要的一点是:
他们并没有把 AI 当成一个“替代工程师”的系统。
而是把它当成:
一个能够参与整个工作流的协作层。
人仍然负责目标、判断和结果。
AI 负责执行、检索、组合、验证和协同。
这也是企业 AI 更现实的发展方向。
对中国企业来说,真正的窗口期已经开始
过去一年,很多企业已经完成了:
- AI 工具试用
- Prompt 实验
- 内部分享
- 小范围 PoC
接下来真正重要的问题是:
如何把 AI 接入真实业务流程。
这意味着企业需要开始建设:
- 可复用的 AI 能力
- 企业知识体系
- AI 权限与治理机制
- 场景化工作流
- 效果评估体系
- 持续运营能力
AI 不再只是“让员工试试看”。
而是逐渐成为企业流程的一部分。
对于已经具备一定数字化基础的企业来说,现在真正需要的,往往不是再增加一个聊天机器人。
而是找到那些:
- 高频
- 重复
- 依赖知识
- 需要流程判断
- 消耗大量人工时间
同时又能够被治理和验证的业务场景。
从一个真实场景开始,建立第一套可运行机制,再逐步扩展。
这也是企业 AI 能真正落地的开始。
远锦长期关注的,并不是“AI 展示能力”,而是 AI 如何进入企业真实业务现场。
包括客服与售后、内部知识服务、工单处理、合同文档、运营支持等场景。
真正有价值的 AI 项目,最终交付的不是一个机器人,而是一套能够持续运行、持续优化、能够被组织真正使用的工作系统。