Uber 用 5 个月做出 500 个 AI Skills，对中国企业真正的启示是什么

2026年05月17日 · 曾永强

过去一年，很多企业都在讨论 AI Agent。

有人在做智能客服，有人在做自动写代码，也有人在尝试构建各种“企业 AI 助手”。

但一个更现实的问题是：

为什么很多 AI 项目停留在演示阶段，而无法真正进入企业日常流程？

最近，Uber AI Foundations 团队负责人 Adam Hooda 分享了 Uber 内部推动 Claude Skills 的过程。这并不是一个“AI 概念展示”，而是一场发生在真实复杂企业环境中的工程体系演进。

5 个月时间里，Uber 内部的 Claude Skills 从 2 个增长到 500+，覆盖代码审查、测试验证、生产监控、性能优化、知识调用等多个研发场景。

更值得关注的不是“500 个技能”本身，而是 Uber 采用的方法。

它揭示了一件事：

企业 AI 的核心问题，从来不是模型能力，而是如何把 AI 接入真实业务流程、组织协作和工程体系。

从“做一个 Agent”到“构建 AI 工作系统”

很多企业在推进 AI 时，默认思路是：

为某个场景开发一个 Agent
给它配置 Prompt
接入知识库
上线一个聊天界面

但企业很快会发现问题：

Agent 很难长期维护
每个场景都要重复开发
规则、权限、审批越来越复杂
不同团队之间无法复用
一旦业务变化，Agent 很快失效

Uber 的方向并不是不断增加“定制 Agent”。

而是逐渐形成了一种新的结构：

通用 Agent + Skills + 工程治理体系

Claude 是统一入口。

真正沉淀企业能力的，是各种可复用的 Skills。

这些 Skills 并不只是 Prompt，而是包含：

流程步骤
调用规则
系统操作
验证逻辑
错误处理
知识调用
输出标准

本质上，它们是在把企业内部原本依赖“经验”和“人”的工作方式，逐步沉淀成可运行、可复用、可治理的 AI 工作机制。

这也是很多中国企业正在进入的新阶段：

不是“有没有 AI”，而是 AI 能否真正进入业务现场。

Uber 真正重要的，不是技术，而是治理结构

很多企业看到“500 个 Skills”，第一反应是：

“怎么管理？”

这恰恰是 Uber 最值得参考的地方。

他们采用的是“双层市场”结构：

第一层：核心技能市场

这一层类似企业级“标准能力库”。

特点是：

默认可用
有 Owner
有评估机制
有 CI/CD 流程
有效果验证
有性能要求

它保证企业核心流程的稳定性。

第二层：团队和个人实验市场

工程师可以自由创建、分享、试验新技能。

有效的能力再逐渐进入核心市场。

这个结构解决了企业 AI 推进中的一个典型矛盾：

完全开放，质量会失控
完全集中，创新会停滞

很多企业 AI 项目失败，不是因为模型不好，而是因为：

没有权限边界
没有审核机制
没有版本治理
没有知识维护机制
没有风险分级
没有运行监控

结果 AI 只能停留在试验阶段。

真正进入生产环境后，企业需要的不是“一个机器人”，而是一整套运行机制。

企业最重要的资产，不是 Prompt，而是“组织经验”

Uber 有一个很典型的案例。

他们的性能优化技能，并不是 AI 自己“学会”的。

而是由两位长期做 Go 和 Java 性能优化的资深工程师，把多年经验沉淀成了可执行的 Skill。

这件事背后有一个非常重要的变化：

过去企业里的关键经验，通常存在于：

资深员工脑中
零散文档里
聊天记录中
各种“只有某个人知道”的流程里

而 AI 的真正价值之一，是第一次让这些经验可以被系统化、流程化、持续复用。

这也是为什么很多企业在推进 AI 时，最终会发现：

真正困难的不是模型接入，而是知识整理。

包括：

历史工单
操作规范
合同规则
审批流程
FAQ
系统权限
风险规则
业务判断标准

如果这些知识本身是混乱的，AI 很难稳定工作。

所以企业 AI 项目的核心，往往不是“训练模型”，而是：

梳理流程、整理知识、定义规则、建立验证机制。

AI 真正进入企业，需要“确定性”

Uber 在访谈里反复强调一个词：

“确定性输出”。

例如一个性能优化 Skill，不应该只告诉工程师：

“我优化了你的代码。”

而应该明确说明：

做了哪些优化
哪些成功
哪些失败
为什么失败
修改了什么
风险是什么

这是企业 AI 和个人 AI 最大的区别之一。

个人场景可以接受“差不多”。

但企业场景必须：

可验证
可追溯
可审计
可回滚
可监控

尤其在客服、售后、合同、财务、人事、供应链等场景里，AI 不是回答一个问题，而是在参与业务流程。

这意味着：

企业真正需要的，不只是模型能力，而是：

权限控制
审批机制
日志留痕
风险识别
人工兜底
效果评估
持续优化

AI 只有进入这些机制，才能真正成为生产工具。

企业 AI 的关键，不是“更聪明”，而是“更可运行”

很多企业仍然在关注：

哪个模型更强
哪个 Agent 更聪明
哪个 Prompt 更好

但从大量实际项目来看，真正决定 AI 能否落地的，通常不是模型上限，而是运行体系。

包括：

是否能接入现有系统
是否能调用企业数据
是否符合权限要求
是否能处理异常流程
是否能长期维护
是否能持续优化
是否能被业务团队真正使用

Uber 的经验很重要的一点是：

他们并没有把 AI 当成一个“替代工程师”的系统。

而是把它当成：

一个能够参与整个工作流的协作层。

人仍然负责目标、判断和结果。

AI 负责执行、检索、组合、验证和协同。

这也是企业 AI 更现实的发展方向。

对中国企业来说，真正的窗口期已经开始

过去一年，很多企业已经完成了：

AI 工具试用
Prompt 实验
内部分享
小范围 PoC

接下来真正重要的问题是：

如何把 AI 接入真实业务流程。

这意味着企业需要开始建设：

可复用的 AI 能力
企业知识体系
AI 权限与治理机制
场景化工作流
效果评估体系
持续运营能力

AI 不再只是“让员工试试看”。

而是逐渐成为企业流程的一部分。

对于已经具备一定数字化基础的企业来说，现在真正需要的，往往不是再增加一个聊天机器人。

而是找到那些：

高频
重复
依赖知识
需要流程判断
消耗大量人工时间

同时又能够被治理和验证的业务场景。

从一个真实场景开始，建立第一套可运行机制，再逐步扩展。

这也是企业 AI 能真正落地的开始。

远锦长期关注的，并不是“AI 展示能力”，而是 AI 如何进入企业真实业务现场。

包括客服与售后、内部知识服务、工单处理、合同文档、运营支持等场景。

真正有价值的 AI 项目，最终交付的不是一个机器人，而是一套能够持续运行、持续优化、能够被组织真正使用的工作系统。

文章标签