企业级人工智能现状
The State of Enterprise AI
2025 Report | OpenAI
前言
在 OpenAI,我们的使命是确保人工智能惠及全人类,而帮助企业解决问题,是这一使命的核心部分。
全球大多数具有经济价值的活动发生在组织内部,在那里,创新可以直接转化为员工、客户及其他利益相关者的更好结果。企业问题也为前沿智能带来了最艰巨的技术挑战,需要在大规模场景下实现可靠性、安全性与防护能力。解决这些问题所产生的收入,可以帮助资助面向全球数以亿计人群的广泛、免费的强大 AI 访问能力。
在过去三年中的大部分时间里,AI 的可见影响最明显地体现在消费者端。然而,通用技术(从蒸汽机到半导体)的历史表明,显著经济价值的创造,往往是在企业将底层能力转化为可规模化的具体用例之后。企业级 AI 如今似乎正进入这一阶段,全球许多最大、最复杂的组织开始将 AI 用作核心基础设施。
本报告汇集了来自去标识化、聚合后的企业使用数据,以及多种其他来源的证据,以提供一个扎实的视角,展示 AI 今天是如何在各类组织内部被部署的。
展望未来
企业级 AI 的下一阶段将由以下因素塑造:在高经济价值任务上的更强性能、对组织情境的更深入理解、以及从"向模型索取输出"向"将复杂多步骤工作流委托给模型"的转变。随着这些能力的成熟,我们预期组织不仅会提高效率,还会发现服务客户和创造价值的全新方式。
本报告中的发现代表了 AI 如何开始重塑现代企业的早期信号。随着企业级 AI 的演进,OpenAI 将继续分享关于 AI 如何影响企业、员工以及更广泛经济的真实世界证据。
—— Ronnie Chatterji
首席经济学家,OpenAI
四大关键发现
展望未来
企业级 AI 的下一阶段将由以下因素塑造:在高经济价值任务上的更强性能、更好地理解组织情境、从"向模型索取输出"转向"将复杂、多步骤的工作流委托给模型"。随着这些能力的成熟,我们预计组织不仅会提高效率,还会发现服务客户和创造价值的全新方式。
本报告中的发现代表了 AI 如何开始重塑现代企业的早期信号。随着企业级 AI 的演进,OpenAI 将继续分享关于 AI 如何影响企业、员工以及更广泛经济的真实世界证据。
引言
在过去三年中,企业已经在广泛的用例和运营工作流中集成了 AI 系统。
这些部署为我们提供了洞见:在追求高准确性标准、工作流复杂、且生产力或决策质量的改进又能直接产生经济结果的环境中,AI 是如何重塑工作的。由于世界上大部分具有经济价值的活动都发生在企业内部,因此企业采纳模式为我们清晰地指示了——AI 今天在哪些地方正在创造价值,以及未来很可能会在哪些地方创造价值。
OpenAI 超过 100 万家企业客户的规模和多样性,为我们提供了独特的视角来观察这一转变。本报告总结了来自 OpenAI 企业客户群的关键发现,以及这些模式对企业级 AI 当前状态和发展轨迹的启示。通过考察不同行业和职能的采纳情况,本分析也突出显示了 AI 正在哪些地方深度嵌入企业,以及差距正在哪些地方出现。
报告使用的数据来源
报告中的所有分析均基于去标识化、聚合后的企业使用数据。消息内容通过自动化系统进行分类,在本分析过程中,没有任何 OpenAI 员工审阅过任何单一企业、商业或 API 客户的具体数据。
企业级 AI 使用正在加速并加深
在过去一年中,随着组织在各个职能和业务单元中,将 AI 纳入可重复、多步骤的工作流,企业级 AI 采纳显著增加。OpenAI 目前服务超过 700 万个 ChatGPT 工作场所席位,ChatGPT 企业版席位同比增长约 9 倍。
自 2024 年 11 月以来,企业每周消息总量约增长了 8 倍,平均每位员工发送的消息增加了 30%。这种增长既反映了对 ChatGPT 更频繁的使用,也反映了使用强度的加深。
有两大转变凸显了 AI 正在深度融入企业核心工作流:
自定义 GPT 和 Projects 促进更深的工作流集成
Custom GPT 与 Projects 是在 ChatGPT 之上构建的可配置界面,可以通过指令、知识和自定义动作进行定制,使员工能够执行可重复、多步骤的任务。
Custom GPT 和 Projects 的周活跃用户今年以来增长了约 19 倍。近几个月,约 20% 的企业消息通过 Custom GPT 或 Project 处理。部署最广泛的 GPT,要么将机构知识编码到可复用的助手中,要么通过与内部系统的集成来自动化工作流。一些组织已经形成文化,在大规模上构建和共享 Custom GPT。例如,BBVA 经常使用超过 4,000 个 GPT,表明 AI 驱动的工作流正越来越多地以持久工具的形式被实施并嵌入日常运营。
开发者与 API 工作流正在快速扩展
企业通过 API 构建应用,将模型直接集成到产品和系统中,同时保持较高程度的控制和定制性。随着企业从试验过渡到生产部署,API 消耗快速增长。目前已有超过 9,000 家组织处理了超过 100 亿 token,近 200 家组织的累计使用量超过 1 万亿 token。
每家组织的平均推理 token 消耗在过去 12 个月内增长了约 320 倍,表明更智能的模型正在被系统地集成到不断扩展的产品和服务中。Codex 虽然仍处于企业生命周期的早期阶段,但随着团队采用它来完成端到端的软件任务(代码生成、重构、测试与调试),其使用正在快速增长。
Codex 使用增长(过去六周)
Codex 虽然仍处于企业生命周期的早期阶段,但随着团队采用它来完成端到端的软件任务(代码生成、重构、测试与调试),其使用也在快速增长。在过去六周内,Codex 的使用增长表明 AI 辅助开发正在企业内部快速渗透:
员工报告使用 AI 带来的可度量价值
在大多数情境下,AI 能使员工更快地产出更高质量的工作。然而,生产力本身并不能完全反映 AI 如何重塑工作。来自近 100 家企业的调查数据突出显示了各职能的关键运营收益,以及执行专业与技术工作的角色正在发生转移。
企业员工报告时间节省和各职能结果改善
75% 的受访员工表示,在工作中使用 AI 提高了工作速度或产出质量。平均而言,ChatGPT Enterprise 用户将每天节省 40-60 分钟归功于他们对 AI 的使用,其中数据科学、工程和沟通岗位的员工节省更多(每天 60-80 分钟)。每条消息节省的时间因职能而异:会计和财务用户报告收益最大,其次是分析、沟通和工程。
这些收益转化为各职能广泛的运营改善
这些结果表明,生产力收益不仅仅在早期采纳的技术角色中实现,而是已经在核心企业职能中广泛显现。
技术工作正在突破传统角色边界
AI 不仅在加速现有工作,也在扩展员工可以完成的任务与技能范围。多项研究发现,AI 具有"均衡器"效应,对低绩效员工的帮助尤其明显。与这些发现一致,75% 的员工报告能够完成他们以前无法完成的任务,包括编程支持和代码审查、电子表格分析和自动化、技术工具开发和故障排查、以及自定义 GPT 或代理设计。
个人能力的拓宽在技术环境中尤为明显:非技术团队正越来越多地参与以前仅限于专业角色的编程和数据分析工作。在 ChatGPT Enterprise 用户中,编程相关消息在所有职能中都有增长;在工程、IT 和研究之外,编程相关消息在过去六个月内平均增长了 36%。
更密集使用 AI 的员工报告更高的生产力
在个人层面,员工加深对 AI 的使用时,影响会随之增加。在大量员工样本中,时间节省与使用更高级 ChatGPT 功能(包括 Deep Research、GPT-5 Thinking 和图像生成)相关。消耗最多智能的员工(以积分使用量衡量)报告的时间节省更高。每周节省超过 10 小时的员工不仅在使用更多智能,他们还在使用多种模型、使用更多工具,并将 AI 应用于更广泛的任务范围。
增速因行业与地理区域而异
在过去一年中,随着企业从 AI 试点转向全面部署,整体采纳快速增长,但在不同行业和地区之间存在显著差异。
各行业增长迅速
OpenAI 客户增长呈广泛态势,行业中位数增长超过 6 倍,即使是增速最慢的行业也超过了 2 倍。
增速最快的行业
| 排名 | 行业 | 同比增长 |
|---|---|---|
| 01 | 科技 | 11倍 |
| 02 | 医疗保健 | 8倍 |
| 03 | 制造业 | 7倍 |
在绝对值上,ChatGPT Enterprise 客户目前主要集中在专业服务、金融和科技领域——这些是早期采用者,继续在 AI 使用规模上领先。医疗保健和制造业起点较低,但目前是增长最快的行业,正在快速缩小差距。
API 最常用于构建和扩展面向客户的应用(如产品内助手、搜索和自动化),尤其是科技公司。但使用正在多样化:客户服务和内容生成现在约占 API 活动的 20%,非科技企业的 API 使用同比增长 5 倍。总体而言,这一模式表明采纳正在扩展,超越技术主导的产品嵌入,向更广泛的运营和工作流部署发展。
各行业 API 使用模式
各行业 Top API 用例
| 科技 | 专业服务 | 金融 |
|---|---|---|
| 1. 应用内助手和搜索 | 1. 编程和开发者工具 | 1. 客户支持 |
| 2. 智能工作流自动化 | 2. 内容和创意生成 | 2. 编程和开发者工具 |
| 3. 编程和开发者工具 | 3. 应用内助手和搜索 | 3. 智能工作流自动化 |
| 4. 客户支持 | 4. 客户支持 | 4. 应用内助手和搜索 |
| 5. 数据分析、摘要和提取 | 5. 智能工作流自动化 | 5. 数据分析、摘要和提取 |
企业增长具有全球性且正在加速
虽然早期 AI 采用主要集中在美国,但国际增长正在快速加速:
- 在最大的市场中,澳大利亚、巴西、荷兰和法国的企业客户增长最快,同比增长超过 143%
- 企业客户中的 ChatGPT 使用继续在全球扩展,美国、德国和日本是按消息量计最活跃的市场
- 英国和德国现已跻身美国以外最大的 ChatGPT Enterprise 市场(按客户数量计)
- 国际 API 客户增长在过去 6 个月超过 70%,日本拥有美国以外最多的企业 API 客户
全球增长亮点
- 澳大利亚、巴西、荷兰、法国:付费企业客户同比增长超过 143%,增速最快
- 美国、德国、日本:企业消息量最大的市场
- 英国、德国:美国以外最大的 ChatGPT Enterprise 市场
- 国际 API 客户:过去 6 个月增长超过 70%,日本拥有美国以外最多的企业 API 客户
AI 采纳中日益扩大的分化
在各行业以及企业内部的个人之间,AI 的使用方式存在明显差异。这一差距是扩大还是缩小,将取决于组织如何进行变革管理,以及它们构建成功部署 AI 所需的系统、技能和运营模式的能力。
为了更深入地理解这种分化,可以对比前沿员工(定义为采纳强度处于第 95 百分位的员工)与中位数员工。前沿员工发送的消息数量是中位数员工的 6 倍。即使在数据分析领域的员工中,前沿员工使用数据分析工具的频率也是中位数的 16 倍。
前沿员工与中位数员工之间的差距在写作、编程和分析方面最大。编程呈现最大的相对差距,前沿员工发送的消息量是中位数的 17 倍。
这些差异很重要。将使用数据与调查结果匹配后发现,跨越约 7 种任务类型使用 AI 的用户报告的时间节省,是仅使用约 4 种任务类型用户的 5 倍。换句话说,用户从 AI 中获得的收益与使用深度直接成正比。
即使在活跃的 ChatGPT Enterprise 用户中,许多人也从未尝试过一些最强大的工具。在月活跃用户中,19% 从未使用过数据分析,14% 从未使用过推理,12% 从未使用过搜索。在日活跃用户中,这些比例分别降至 3%、1% 和 1%。
月活用户中从未使用过这些工具的比例
而在日活用户中,这些比例分别降至 3%、1%、1%。
企业提升 AI 成熟度的空间巨大
在企业层面,采纳强度的差距与个人层面观察到的情况类似。前沿企业(第 95 百分位)每席位产生的消息量约为中位企业的 2 倍,发送给 GPT 的消息量是 7 倍,表明其组织整合和工作流标准化程度明显更深。这些企业系统性地投资于将 AI 嵌入为核心组织能力所需的基础设施和运营模式,而非将其视为边缘性的生产力工具。
AI 采纳与业务影响:案例证据
以下案例研究展示了 AI 如何在不同组织背景下产生可衡量的业务成果。它们的影响反映了 AI 在特定运营和战略挑战上的应用,而非一刀切的解决方案。在这些案例中,AI 与收入增长、客户体验改善、手动流程自动化以及产品开发加速相关联。
外部研究支持 AI 与业务绩效的关联
这些效应并非局限于少数企业,外部研究显示 AI 采纳正在开始影响核心财务绩效指标。
波士顿咨询集团(BCG)2025 年的研究发现,在过去三年中,AI 领先者实现了:
他们在非财务指标上也表现出色,如专利产出和员工满意度,将 AI 成熟度与财务和组织实力联系起来。虽然这些证据仍处于早期阶段,但它表明 AI 采纳与财务绩效和组织成果的改善相关。
使用 OpenAI 的 Realtime API 为 Fin Voice 提供低延迟、企业级语音 AI 代理
挑战
Fin 是 Intercom 的客服 AI 代理,在聊天、邮件和社交渠道上提供行业领先的解决率,每月解决数百万客户查询。但将 Fin 扩展到一个新渠道——电话——时,引入了一个关键挑战:延迟。在电话支持中,问题往往很紧迫,即使是短暂的停顿也可能破坏客户体验,导致来电者放弃交互或要求转接人工。
解决方案
Intercom 基于 OpenAI 的 Realtime API 构建 Fin Voice,显著降低延迟,实现自然、可中断的电话对话。Realtime API 的低首 token 时间、强大的指令遵循能力和可靠的工具调用功能,使 Fin Voice 能够高质量和可靠地处理复杂的多步骤请求。
成果
自 3 月以来,通过 Fin Voice 使用 Realtime API 进行答案生成,延迟降低 48%。
凭借 Realtime API 实现的更快响应,客户看到 Fin Voice 平均端到端解决 53% 的来电——鉴于电话通话通常比聊天复杂得多,这是一个重要成果。
客户报告,最终需要人工代理的通话,在 Fin Voice 完成初始步骤后解决速度提升 40%,提高了高接触通话的效率。
考虑到人工处理的支持对话通常成本在 5-20 美元之间(因地区和行业而异),Fin 每年已为客户节省数亿美元。
部署 Mylow 和 Mylow Companion,为每位线上访客和门店员工提供专家级家装指导
挑战
Lowe's 需要将专家级家装指导扩展到线上购物者,并帮助门店员工(尤其是新员工)在 1,700 多家门店中一致地回答复杂问题。
解决方案
Lowe's 在 Lowes.com 部署 Mylow 为客户提供项目和产品建议,并在每家门店部署 Mylow Companion 为员工提供辅助。
成果
自今年 3 月上线以来,Mylow 和 Mylow Companion 每月回答近 100 万个问题,涵盖从产品规格到项目知识再到客户订单状态的各种问题。
Mylow 在 Lowes.com 和获奖的 Lowe's 移动应用上可用。当客户在线访问期间与 Mylow 互动时,转化率提高一倍以上。
Mylow Companion 已部署到 100% 的门店,每周回答数十万个员工问题。当员工使用 Mylow Companion 帮助货架间的顾客时,Lowe's 看到客户满意度评分提升 200 个基点。
使用 GPT 驱动的职位匹配和职业辅导,改善求职者和雇主的招聘成果
挑战
Indeed 的使命是帮助人们找到工作。求职者在搜索、评估匹配度和申请职位时可能面临阻力,而雇主则希望为其开放职位获得更多合格的申请者。双方都能从更深入的个性化和更清晰的背景信息中受益,以了解什么构成强匹配。
解决方案
为解决这一阻力,Indeed 推出了一系列 AI 驱动的产品,使用专有 AI 匹配求职者和雇主,并结合 GPT 驱动的解释来说明为何这是一个好匹配。Indeed Invite to Apply 使用 AI 生成和发送情境化、个性化的职位邀请,帮助候选人理解为何某个角色是强匹配,并提升雇主覆盖范围。Indeed Career Scout 作为 AI 职业教练,加速职位发现并简化求职者的申请流程。
成果
在实验中,带有 LLM 生成解释的 Invite to Apply 与传统匹配相比,启动申请量增加 20%,下游成功率(面试和录用)提高 13%。
早期结果显示,使用 Career Scout 的求职者发现并申请相关职位的速度提升 7 倍,被录用的可能性提高 38%,84% 的用户认为它有价值。
部署法律 AI 聊天机器人,即时验证企业签署授权并加速分行商业运营
挑战
在墨西哥,BBVA 必须在关键交易(如开户、签订合同、发放信贷)进行前执行法律检查(也称为 bastanteo),以确认公司代表有权签署和代表公司行事。这一过程历来依赖专业法律团队响应重复的分行查询,造成延迟、瓶颈,以及对稀缺法律产能的高需求。
解决方案
BBVA 构建了一个生成式 AI 聊天机器人,针对常见的签署授权问题提供对标准化、预验证法律常见问题和文档指导的即时访问。内容由 BBVA 的法务团队开发和审核,减少日常查询的人工处理,使经批准的法律指导持续可用。
成果
使用 ChatGPT Enterprise 构建的解决方案每年自动化超过 9,000 次查询,使 BBVA 能够将相当于 3 名全职员工重新部署用于每年生产超过 11,000 份 bastanteos,达成法务部门年度节省 KPI 的 26%。
部署面向会员的聊天机器人,实时回答福利、费用和一般健康问题,帮助会员导航医疗系统的复杂性
挑战
对许多人来说,医疗系统难以理解和导航。理解福利、找到合适的医生、估算护理费用、获得清晰答案,这些问题往往既具挑战性又耗时。这部分是因为做出正确决策所需的数据往往分散在不同的地方,包括门户网站、福利文档和过去就诊的医生笔记。Oscar 希望创建一个单一、可信赖的入口,帮助会员更好地理解和导航医疗系统。
解决方案
Oscar 开发了一对面向会员的聊天机器人,按需实时回答会员福利、费用和一般健康问题。与通用 AI 聊天机器人不同,它们与 Oscar 系统和数据集成,使其能够从医疗记录、理赔和客服交互中提取信息,以提供个性化响应。其聊天机器人还可以协助常见任务,包括查找网络内医生和续配处方。
成果
结果是一个能够处理广泛问题和任务的平台,包括理解福利、支持症状相关问题、准备就诊和解释后续指导,同时在需要时将会员引导至医疗服务提供者或护理指导。平台即时回答 58% 的福利问题,能够在无需人工升级的情况下处理 39% 的福利消息。如今,它们拥有了未来功能的基础,包括预约、语音交互和特定病症管理。
使用 AI 大幅压缩目标产品概况(TPP)开发时间
挑战
编写目标产品概况(TPP)通常是一项为期数周、涉及临床、产品和营销团队的跨职能工作。团队必须审查和处理大量证据包,有时多达 300 页信息,为产品开发创建这些蓝图。
解决方案
使用 ChatGPT Enterprise,Moderna 简化了 TPP 起草和分析工作流的大部分环节。系统帮助从大型数据包中提取关键事实和假设,生成结构化草稿章节,并向提供人工监督的团队标记重要细节或潜在错误。
成果
TPP 中的延迟或错误可能影响研究规划、跨职能协调和产品发布准备等下游活动。通过减少审查、交叉引用和整合大型证据包所需的时间,团队可以将更多时间用于压力测试权衡和更早做出更高质量的决策。Moderna 报告,该流程中的核心分析步骤在某些情况下已从数周缩短到数小时,并相信早期 TPP 规划中每节省一天,都能帮助公司更快地为患者提供服务。
领先企业的一贯做法
在实践中,领先企业通常会做到以下几点:
通过启用上下文实现深度系统集成
它们开启连接器,让 AI 安全访问核心工具中的公司数据,实现上下文感知的响应和自动化操作。约四分之一的企业仍未采取这一步骤。
工作流标准化与复用
它们积极促进针对常见任务的可重复解决方案的创建、共享和发现。GPT 通常驱动这项工作,而最成熟的组织会将 API 驱动的助手直接嵌入核心内部系统。
高管领导力与支持
它们设定明确的任务、确保资源、协调团队,并为实验创造空间——所有这些都能实现大规模部署。
数据就绪性与评估
它们将机构知识编码为机器可读的程序,为关键数据管道构建 API,并运行持续评估以追踪模型在真实世界结果上的表现。
有意识的变革管理
它们建立加速组织学习的结构,将集中治理和培训与通过嵌入式 AI 倡导者的分布式赋能相结合。
AI 领域正在快速演进;OpenAI 大约每三天就会发布一项新功能或能力。对组织而言,主要制约因素已不再是模型性能或工具,而是组织就绪度。
结论
在 OpenAI 超过 100 万家企业客户中,AI 正被嵌入到不断扩展的工作流、产品和内部系统中。采纳呈广泛态势并在各行业和地区加速,尽管集成深度因组织而异。
数据表明,使用深度很重要。更持续使用高级工具(如推理模型、数据分析、Custom GPT、Projects 和 API)的员工和企业,报告的生产力提升和任务覆盖范围,都大于那些使用有限的人。
AI 也开始改变谁来执行某些类型的技术工作。编程和分析任务越来越多地出现在传统专业角色之外,扩展了一些非技术团队能够做的事情。与此同时,行业模式仍然独特,反映了科技、专业服务、金融、医疗保健、制造业等不同领域的运营需求差异。
尽管 AI 采纳存在日益扩大的分化,但企业级 AI 仍处于早期阶段。企业有机会通过采纳前沿员工和组织的模式来追赶。随着企业级 AI 的成熟,企业将越来越多地将 AI 能力转化为产品和服务,通过更快的迭代、更深的个性化和新体验来提供新的价值来源。成功将这些能力引入面向市场的工作流的组织,将不仅把 AI 用作生产力工具,更将其作为收入增长和竞争优势的持久引擎。