Uber 用 5 个月做出 500 个 AI Skills,对中国企业真正的启示是什么

· 曾永强

过去一年,很多企业都在讨论 AI Agent。

有人在做智能客服,有人在做自动写代码,也有人在尝试构建各种“企业 AI 助手”。

但一个更现实的问题是:

为什么很多 AI 项目停留在演示阶段,而无法真正进入企业日常流程?

最近,Uber AI Foundations 团队负责人 Adam Hooda 分享了 Uber 内部推动 Claude Skills 的过程。这并不是一个“AI 概念展示”,而是一场发生在真实复杂企业环境中的工程体系演进。

5 个月时间里,Uber 内部的 Claude Skills 从 2 个增长到 500+,覆盖代码审查、测试验证、生产监控、性能优化、知识调用等多个研发场景。

更值得关注的不是“500 个技能”本身,而是 Uber 采用的方法。

它揭示了一件事:

企业 AI 的核心问题,从来不是模型能力,而是如何把 AI 接入真实业务流程、组织协作和工程体系。


从“做一个 Agent”到“构建 AI 工作系统”

很多企业在推进 AI 时,默认思路是:

  • 为某个场景开发一个 Agent
  • 给它配置 Prompt
  • 接入知识库
  • 上线一个聊天界面

但企业很快会发现问题:

  • Agent 很难长期维护
  • 每个场景都要重复开发
  • 规则、权限、审批越来越复杂
  • 不同团队之间无法复用
  • 一旦业务变化,Agent 很快失效

Uber 的方向并不是不断增加“定制 Agent”。

而是逐渐形成了一种新的结构:

通用 Agent + Skills + 工程治理体系

Claude 是统一入口。

真正沉淀企业能力的,是各种可复用的 Skills。

这些 Skills 并不只是 Prompt,而是包含:

  • 流程步骤
  • 调用规则
  • 系统操作
  • 验证逻辑
  • 错误处理
  • 知识调用
  • 输出标准

本质上,它们是在把企业内部原本依赖“经验”和“人”的工作方式,逐步沉淀成可运行、可复用、可治理的 AI 工作机制。

这也是很多中国企业正在进入的新阶段:

不是“有没有 AI”,而是 AI 能否真正进入业务现场。


Uber 真正重要的,不是技术,而是治理结构

很多企业看到“500 个 Skills”,第一反应是:

“怎么管理?”

这恰恰是 Uber 最值得参考的地方。

他们采用的是“双层市场”结构:

第一层:核心技能市场

这一层类似企业级“标准能力库”。

特点是:

  • 默认可用
  • 有 Owner
  • 有评估机制
  • 有 CI/CD 流程
  • 有效果验证
  • 有性能要求

它保证企业核心流程的稳定性。

第二层:团队和个人实验市场

工程师可以自由创建、分享、试验新技能。

有效的能力再逐渐进入核心市场。

这个结构解决了企业 AI 推进中的一个典型矛盾:

  • 完全开放,质量会失控
  • 完全集中,创新会停滞

很多企业 AI 项目失败,不是因为模型不好,而是因为:

  • 没有权限边界
  • 没有审核机制
  • 没有版本治理
  • 没有知识维护机制
  • 没有风险分级
  • 没有运行监控

结果 AI 只能停留在试验阶段。

真正进入生产环境后,企业需要的不是“一个机器人”,而是一整套运行机制。


企业最重要的资产,不是 Prompt,而是“组织经验”

Uber 有一个很典型的案例。

他们的性能优化技能,并不是 AI 自己“学会”的。

而是由两位长期做 Go 和 Java 性能优化的资深工程师,把多年经验沉淀成了可执行的 Skill。

这件事背后有一个非常重要的变化:

过去企业里的关键经验,通常存在于:

  • 资深员工脑中
  • 零散文档里
  • 聊天记录中
  • 各种“只有某个人知道”的流程里

而 AI 的真正价值之一,是第一次让这些经验可以被系统化、流程化、持续复用。

这也是为什么很多企业在推进 AI 时,最终会发现:

真正困难的不是模型接入,而是知识整理。

包括:

  • 历史工单
  • 操作规范
  • 合同规则
  • 审批流程
  • FAQ
  • 系统权限
  • 风险规则
  • 业务判断标准

如果这些知识本身是混乱的,AI 很难稳定工作。

所以企业 AI 项目的核心,往往不是“训练模型”,而是:

梳理流程、整理知识、定义规则、建立验证机制。


AI 真正进入企业,需要“确定性”

Uber 在访谈里反复强调一个词:

“确定性输出”。

例如一个性能优化 Skill,不应该只告诉工程师:

“我优化了你的代码。”

而应该明确说明:

  • 做了哪些优化
  • 哪些成功
  • 哪些失败
  • 为什么失败
  • 修改了什么
  • 风险是什么

这是企业 AI 和个人 AI 最大的区别之一。

个人场景可以接受“差不多”。

但企业场景必须:

  • 可验证
  • 可追溯
  • 可审计
  • 可回滚
  • 可监控

尤其在客服、售后、合同、财务、人事、供应链等场景里,AI 不是回答一个问题,而是在参与业务流程。

这意味着:

企业真正需要的,不只是模型能力,而是:

  • 权限控制
  • 审批机制
  • 日志留痕
  • 风险识别
  • 人工兜底
  • 效果评估
  • 持续优化

AI 只有进入这些机制,才能真正成为生产工具。


企业 AI 的关键,不是“更聪明”,而是“更可运行”

很多企业仍然在关注:

  • 哪个模型更强
  • 哪个 Agent 更聪明
  • 哪个 Prompt 更好

但从大量实际项目来看,真正决定 AI 能否落地的,通常不是模型上限,而是运行体系。

包括:

  • 是否能接入现有系统
  • 是否能调用企业数据
  • 是否符合权限要求
  • 是否能处理异常流程
  • 是否能长期维护
  • 是否能持续优化
  • 是否能被业务团队真正使用

Uber 的经验很重要的一点是:

他们并没有把 AI 当成一个“替代工程师”的系统。

而是把它当成:

一个能够参与整个工作流的协作层。

人仍然负责目标、判断和结果。

AI 负责执行、检索、组合、验证和协同。

这也是企业 AI 更现实的发展方向。


对中国企业来说,真正的窗口期已经开始

过去一年,很多企业已经完成了:

  • AI 工具试用
  • Prompt 实验
  • 内部分享
  • 小范围 PoC

接下来真正重要的问题是:

如何把 AI 接入真实业务流程。

这意味着企业需要开始建设:

  • 可复用的 AI 能力
  • 企业知识体系
  • AI 权限与治理机制
  • 场景化工作流
  • 效果评估体系
  • 持续运营能力

AI 不再只是“让员工试试看”。

而是逐渐成为企业流程的一部分。

对于已经具备一定数字化基础的企业来说,现在真正需要的,往往不是再增加一个聊天机器人。

而是找到那些:

  • 高频
  • 重复
  • 依赖知识
  • 需要流程判断
  • 消耗大量人工时间

同时又能够被治理和验证的业务场景。

从一个真实场景开始,建立第一套可运行机制,再逐步扩展。

这也是企业 AI 能真正落地的开始。


远锦长期关注的,并不是“AI 展示能力”,而是 AI 如何进入企业真实业务现场。

包括客服与售后、内部知识服务、工单处理、合同文档、运营支持等场景。

真正有价值的 AI 项目,最终交付的不是一个机器人,而是一套能够持续运行、持续优化、能够被组织真正使用的工作系统。