数十亿AI员工上岗倒计时,云计算巨头“没有魔法,只有真能解决问题的Agent”
你是否察觉?2025年的大模型产业正经历一场静默却深刻的分化。一边,明星模型仍在参数上疯狂竞速;另一边,基础设施层已掀起根本性变革:
AI的价值核心,正从“模型炫技”转向“Agent实战”。
亚马逊云科技CEO马特·加曼(Matt Garman)在今日凌晨的2025 re:Invent主题演讲中重磅发声:“Agent彻底改变了AI的轨迹——我们从追逐技术奇迹,迈入了创造真实价值的时代。”
一组反差数据揭示现实:生成式AI全球火热,Amazon Bedrock已服务超10万家企业,处理超1万亿tokens;众多企业仍未收获匹配的AI投资回报。
Garman详解Amazon Bedrock落地实战
“Agent才是企业从AI投资中获取实质性商业回报的关键。”Garman点明拐点,“我坚信,未来每个公司、每个领域都将部署数十亿的Agent。”
一场重塑AI价值的竞赛已然打响。在2025 re:Invent舞台上,AI芯片性能狂飙600%,构建AI Agent的四大支柱全面升级,全栈部署战争进入白热化……企业究竟如何抓住这场变革红利?
云计算巨头的每一步布局,都为我们揭晓了Agent时代的实战答案。
Garman剖析Agent部署核心要素
01.重新定义AI Infra:自研芯片与「AI工厂」的双重革命
算力竞争已进入云巨头自主掌控、性能暴增的新阶段。亚马逊云科技在2025 re:Invent亮出利器:基于自研3nm芯片的Amazon EC2 Trainium 3 UltraServers服务器全面推出,而下一代Trainium 4芯片参数更令人震撼。
“如今Amazon Bedrock上的大多数推理,实则已由Trainium驱动。”Garman透露。更关键的是,亚马逊云科技已部署超100万颗自研Trainium芯片,Trainium 2量产速度达前代芯片的4倍。
最新性能数据凸显算力革命的紧迫:基于首款云端3nm AI芯片Trainium 3,Amazon EC2 Trainium 3 UltraServers极致配置互联144颗芯片,提供362PFLOPS(FP8)算力和超700TB/秒总带宽。
相比前代Trainium 2,其计算性能提升4.4倍,内存带宽提升3.9倍,而能效比——每兆瓦电力处理的AI token数——飙升5倍。
Amazon EC2 Trainium 3 UltraServers服务器性能爆表
更值得关注的是,下一代Trainium 4承诺更大飞跃:预计提供6倍FP4性能、4倍内存带宽、2倍内存容量,支持NVLink Fusion和UALink扩展,专为巨量模型训练而生。
但芯片性能仅是序幕。亚马逊云科技同步推出战略级Amazon AI Factories(AI工厂)服务——企业可在自有数据中心部署专用AI基础设施,同时享受亚马逊云科技全栈服务与管理。
这一举措直击企业生成式AI出海与全球化部署核心痛点:平衡数据主权、合规与性能。企业能在本地掌控数据,复用既有资源;同时无缝接入从Trainium、英伟达GPU到SageMaker和Bedrock的全栈AI能力。
02.模型生态的多元主义:自研模型超GPT-5.1,中国模型占1/4席位
与追逐“万能模型”的潮流相反,亚马逊云科技坚定选择多元化模型战略。“我们从不相信单一模型能统治一切。”Garman明确表示,“未来将涌现众多伟大模型。”
这一理念在Amazon Bedrock平台充分实践。过去一年,平台模型数量翻倍,2025 re:Invent新增18款全托管开源模型,其中包含4款中国顶尖模型,中国模型占据1/4席位,千问、DeepSeek、Kimi及MiniMax等已上线。
对中国企业,这意味着出海时可获得更贴合本土技术的AI支持;对全球用户,这代表了更宽广的技术选择。
亚马逊云科技最新自研Amazon Nova 2系列模型则展现另一路径。四款型号覆盖轻量推理到复杂多模态全场景:
Amazon Nova 2 Lite:快速经济推理模型,在指令遵循、工具调用、信息提取、代码生成等领域全面超越Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash等轻量模型,仅编程能力略逊于GPT-5 mini。
Amazon Nova 2 Pro:系列最智能推理模型,支持文字、图像、视频、语音输入与文本输出,专为高度复杂工作负载尤其Agent场景设计。在两项Agent基准测试中,其表现已超越GPT-5.1(high)、Gemini 3 Pro Preview(high)等前沿模型。
Amazon Nova 2 Sonic:下一代语音转语音模型,为AI应用提供实时类人对话体验。在语音理解与推理任务上,性能已超过GPT Realtime、Gemini 2.5 Flash。
Amazon Nova 2 Omni:业界首款支持文本、图像、视频、音频输入,并生成文本与图像输出的推理模型。目前基准测试成绩尚未公布。
Amazon Nova 2 Omni发布现场震撼演示
可见,在Agent关键能力基准测试中,Amazon Nova 2 Pro表现亮眼,直接回应了企业对生成式AI在实际业务中可靠性的关切。
尤其在企业出海场景中,选择权至关重要(Choice Matters)。AI未来不会由单一模型统治,Amazon Bedrock模型数量已翻倍,DeepSeek、Qwen等中国模型加入,为中国企业出海部署Agent提供丰富选项。
03.数据与模型深度融合:开放训练模型打破“RAG局限”
“你的数据独一无二,这正是你与对手的差异所在。”Garman反复强调。传统RAG(检索增强生成)等技术仅助模型导航数据,无法让其真正“理解”企业深层领域知识,成为Agent价值释放的瓶颈。
亚马逊云科技的破局方案是:Amazon Nova Forge服务,引入“开放式训练模型(Open Training Model)”概念。
亚马逊云科技发布Amazon Nova Forge服务
通过该服务,企业可在模型训练任意阶段,将专有数据与亚马逊训练数据集融合,创建名为“Novellas”的定制模型。此法解决传统微调核心矛盾——在教授模型新知识时,避免其“遗忘”已有推理能力。
Amazon Nova Forge还支持使用远程奖励函数和强化学习微调,以进一步优化模型,让企业将真实环境集成到训练循环。由于基础模型已理解业务,这些后训练技术将更高效。
索尼是该服务早期采用者。通过对Amazon Nova 2 Lite模型微调,索尼创建了深度理解自身业务的定制模型,在引用一致性和文档依据等任务上表现优于基准模型,目标是将合规审查与评估流程效率提升100倍。
显然,对于寻求通过生成式AI实现差异化的企业,这一能力至关重要。它意味着企业能构建真正理解自身业务逻辑、流程与知识的Agent,而非仅用通用AI工具。
04.回归一件事:没有魔法,只有可部署的Agent
2025 re:Invent上最引人瞩目的发布,或许是三类“前沿Agent”的推出。这些Agent代表AI能力的阶跃式提升:自主、大规模可扩展且能长期运行,为开发者树立标杆。
三类前沿Agent展示AI重塑软件开发和运营的潜力:
Kiro autonomous agent彻底颠覆开发范式。它不同于常见代码补全助手,能自主处理复杂任务,如升级关键库时,自动识别所有受影响服务,分析使用模式,按规范更新代码,运行完整测试,并一次性创建所有合并就绪的拉取请求。亚马逊内部案例显示,原需30名开发者18个月的重架构项目,使用Kiro后仅需6人76天完成。
亚马逊云科技推出Kiro autonomous agent
Amazon Security Agent是持续、主动、内置的AI安全专家。将安全实践从“事后检查”变为“持续嵌入”。它在设计阶段审查文档,编码中扫描漏洞,并将渗透测试从昂贵一次性活动转为按需持续验证,确保安全性。
Amazon DevOps Agent重新定义运维响应机制。当警报触发,它能即时诊断根因,提供修复方案,让工程师专注决策而非排查。此能力对保障全球化业务连续性至关重要。
Agent开发基础设施同步强化。Amazon Bedrock AgentCore自SDK预览版发布,5个月内下载量超200万次。新增两项功能直击企业部署Agent核心关切:
Amazon AgentCore Policy(预览版):为Agent与企业工具及数据交互提供实时确定性控制。
它允许开发者在Amazon AgentCore Gateway工具调用运行前拦截,使用细粒度权限策略为Agent行为定义明确界限,如指定使用哪些工具、如何使用,开发者也可通过自然语言创建标准,如“报销超1000美元则阻止退款”。
亚马逊云科技推出Amazon AgentCore Policy
Amazon AgentCore Evaluations(预览版):根据实际行为持续检查Agent质量。
这是一项全托管服务,开发者可使用内置评估器衡量常见质量维度,如正确性、帮助性、工具选择准确性、安全性、目标成功率和上下文相关性,还可创建基于模型的定制评分系统,按自选提示和模型进行业务定制评分。
亚马逊云科技推出Amazon AgentCore Evaluations
除上述更新,Garman在最后10分钟公布25个新发布,包括搭载第五代AMD EPYC的X8i Instances、搭载英特尔至强6的C8ine Instances、EC2 M3 Ultra Mac Instances等覆盖计算、存储、数据库、大数据、安全等多领域新品,均为企业Agent部署提供坚实支撑。
05.结语:AI进入Agent时间,价值落地之战打响
当AI进入Agent时代,2025 re:Invent舞台展示亚马逊云科技对Agent时代的全景布局,这不再是单点技术竞赛,而是全栈能力比拼,其正构建支持Agent从实验到量产的全平台。
此刻,每个产业人都在见证生成式AI从技术演示迈向商业价值,价值落地之战已全面开启。云巨头的“全家桶”式全栈能力,或许正是企业将AI投资转化为真实业务回报所需的基础设施。立即探索,让你的业务乘上Agent浪潮,抢占未来先机!
本文来自微信公众号“智东西”(ID:zhidxcom),作者:李水青,编辑:漠影,36氪经授权发布。
相关问答
云技术是什么意思四年级下册?
云技术(Cloudtechnology)基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云...
云技术的意思解释?
云技术是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。云技术(Cloudtechnology)基于云计...
什么是云技术?
“云技术是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。”云技术基于云计算商业模式应用...
云技术是什么意思?
云技术是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。云技术基于云计算商业模式应用的网络...
云技术是什么?现实生活中有什么应用?
一般都是软件,你最常用的搜索引擎就是,还有很多和数据库之间的交互都用了云技术,以后会越来越多的一般都是软件,你最常用的搜索引擎就是,还有很多和数据库之...
云技术的两个意思是?
1云技术指的是一种将数据、计算资源和服务通过互联网进行分布式管理和利用的技术。2这种技术可以将大量的数据、应用程序和服务“云化”,使得用户可以通过互...
云技术是什么含义20字概括?
云技术是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。云技术基于云计算商业模式应用的网络...
云技术的含义10个字?
云技术是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。云技术是一种新兴的技术,不同于传统...
云技术专业?
云技术是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。云技术(Cloudtechnology)基于云计算...
云技术的介绍语?
云技术是一种通过网络提供计算资源、软件和数据存储等服务的技术,让用户可以方便地使用和管理这些资源,无需自己购买、部署和维护硬件设备。云技术能够降低企...