腾讯云AGI落地实战:从模型基建到智能体进场的全链路解析
一、AI下半场:从“刷榜”到“找问题”的战略转向
2026年6月,北京。2026腾讯云AI产业应用大会上,腾讯集团高级执行副总裁汤道生与腾讯AI首席科学家姚顺雨的一场对谈,将“AI下半场”这一概念推向了聚光灯下。这个概念并非凭空而来——姚顺雨在2025年便发表了博客《The Second Half》,预言AI发展的重心将从“刷榜冲参数”转向“真实场景价值与可评估的任务解决”。
如果说AI的上半场是一场“技术攻坚”——行业集体聚焦于预训练算法迭代、模型参数升级、榜单分数刷新——那么下半场的核心逻辑则发生了彻底反转。姚顺雨在会上直言:“稀缺的不再是‘解决问题的能力’,而是‘定义优质落地问题的能力’”。预训练与后训练带来的通用能力,让大模型如同“万能锤子”,但真正的壁垒恰恰在于:谁掌握了最原始的输入——即对用户、对企业真实场景的理解。
腾讯云选择在这个节点喊出“下半场”的口号,并非否定基础模型的价值,而是重新校准了优先级。正如姚顺雨所描绘的AGI长期架构——Foundation(基础层)、Product(产品层)、Frontier(前沿层)构成一个“均衡的三角形”——基础能力依然要打牢,但产品如何让技术产生价值、前沿如何探索新范式,同样不可或缺。
二、Co-Design:模型与产品的“双向奔赴”
“Co-Design”(深度协同)是腾讯云在AI下半场给出的方法论关键词。其核心逻辑并不复杂:模型团队与产品团队不再各干各的,而是在共同寻找技术能力与用户需求之间的最佳结合点。
但知易行难。汤道生坦言,这两年最深的体会是“对齐”——产品要解决什么方向、模型如何满足、数据如何标注、评测标准如何统一,任何一环错位,“产品行为就会变得不可预测”。而姚顺雨则点出了一个容易被忽视的前提——信任。他举例说,团队曾抽调后训练最强的骨干去支持AI助手元宝,很多算法同学当时并不理解,但这一举动让产品方相信“做模型的人是真的在为产品着想”,反而为后续模型在元宝上顺利上线打下了基础。
更深一层看,大模型时代的产品构建已经越来越像一项系统工程。即便只是打造一个Coding Agent,背后也不仅仅需要代码数据——它同时需要优秀的对话能力、搜索能力、指令遵循能力以及推理能力。这意味着,一个看似单一的应用场景,实际上依赖于多种能力的协同构建。而腾讯的优势在于拥有完整的产品体系:模型在与元宝的协同中形成了较强的聊天和搜索能力,这些能力随后也能迁移到ima、WorkBuddy等其他产品中。产品、数据和模型之间,正在形成一个相互赋能的网络体系。
三、混元大模型:从参数规模到实用主义的演进
在Co-Design的框架下,基础模型的能力依然是一切的上游水源。2026年4月,腾讯混元发布并开源了Hy3 preview语言模型。这是一款采用快慢思考融合的混合专家(MoE)架构的模型,总参数量达2950亿,激活参数为210亿,最大支持256K上下文长度。这是混元技术体系完成基础设施重构后的首个重要成果,在复杂推理、指令遵循、上下文学习、代码、智能体等能力上实现了大幅提升。
值得关注的是Hy3背后的研发思路。姚顺雨在谈及模型迭代时提到了一个词——“打呆仗”。这个词看似朴实,实则指向了一种不取巧的长期主义:重构基础设施、优化数据分类和质量、持续迭代改进。在外界普遍追逐“更快更强”的节奏中,这种“打呆仗”的方法论反而成了一种稀缺品。
在此之前,腾讯混元还开源了Hunyuan-Large——一款3890亿总参数量、520亿激活参数量的MoE模型。该模型在CMMLU、MMLU、CEval、AGIEval等多学科评测集以及中英文NLP任务、代码、数学等9大维度上表现出色,超越了Llama3和Mixtral等主流开源模型。从Hunyuan-Large到Hy3 preview,混元大模型的技术路线逐渐清晰:在保持参数规模竞争力的同时,越来越强调面向Agent工作负载的设计优化。
在性价比方面,姚顺雨有一个值得留意的观点:“很多人发现用强模型比用差模型更省钱,因为更快把事情做对”。他认为,用相对较小的模型比肩大模型性能、在大部分任务上实现强鲁棒性,“可能在今天的中国更有价值”。这一判断,也为混元后续的技术演进定下了基调。
四、ADP 4.0:让Agent从“能对话”走向“能干活”
如果说混元大模型是腾讯云AGI的“大脑”,那么智能体开发平台ADP就是让这个大脑长出“手脚”的关键基础设施。2026年6月5日,腾讯云在AI产业应用大会上正式发布ADP 4.0版本,将平台升级为企业级AgentOps平台。
ADP 4.0最核心的升级是新增了Claw模式。在此前的LLM+RAG、工作流和Multi-Agent三种构建模式基础上,Claw模式引入Agentic Loop机制,面向更复杂、更长链路的业务任务。操作上,创建者无需配置表单,只需用自然语言描述需求,平台即可自动生成提示词、挂载知识库、配置工具并编排工作流。用一句话概括:从“写代码建Agent”变成了“说话建Agent”。
为了让Agent真正进入生产环境,ADP 4.0还做了一系列“打通”的工作。在Connector方面,首批上线近40个精选连接器,支持接入CRM、ERP、OA、工单、客服、项目协作、企业网盘、知识库、文档系统等高频业务系统。在Skills方面,升级后的Skills广场已支持150多个技能模块。同时平台沉淀了50多个场景化模板和行业精选应用。在模型生态方面,ADP 4.0支持主流大模型与企业自建模型的统一接入。
安全与治理是Agent进入生产系统的底线要求。ADP 4.0将治理能力前置到开发源头,围绕权限管理、Skills治理、运行观测和部署合规,形成覆盖Agent全生命周期的安全管控体系。从提交、安检、审批、上架、分发到调用观测,每个环节都有相应的管控机制。
ADP 4.0的Claw模式已在多个场景中得到验证。以腾讯工业质检平台TI-AOI为例,基于Claw模式打造的质检Agent可以闭环完成“看缺陷、想标准、做检测、查日志、改模型”等流程。工程师只需输入自然语言指令,Agent即可自动完成数据健康检查、训练可行性判断,并给出优化建议。
五、全栈基础设施:算力、网络与加速的“硬功夫”
AGI的落地从来不只是软件层面的事。算力成本、网络吞吐、推理延迟——这些“硬功夫”往往决定着大模型应用能否从实验室走向生产线。腾讯云在基础设施层面构建了一套覆盖IaaS到PaaS的全栈体系。
在底层算力方面,腾讯云采用高性能计算集群(HCC),结合NVLink与自研星脉高性能网络(支持RDMA),搭配并行文件存储CFS Turbo,为分布式训练提供无损高带宽与数据高吞吐的硬件基础。星脉网络最大支持3.2Tbps的带宽。在通信优化层面,TCCL+LightCC方案对社区分布式方案进行深度定制,实现了AllReduce通信效率提升40%。
在训练与推理加速方面,腾讯云的TACO套件覆盖了从训练到推理的全链路。训练端采用自研AngelPTM万亿大模型训练框架;推理端通过分布式推理、算子融合、模型量化及qGPU算力/显存切分技术,大幅降低计算复杂度与内存开销。针对Stable Diffusion等文生图场景,TACO可减少约30%至50%的推理成本。
在精调层面,腾讯云TI平台内置20多个常用基底大模型,提供多任务超参快照与一键模型发布功能,屏蔽底层算力调度的复杂度。值得关注的是,腾讯云还提出了“Harness工程”这一核心概念,全面升级Agent原生基础设施——包括Claw Pro(企业级智能体治理)、AgentRuntime(毫秒级拉起、有状态服务)、Cloud Agent(API/SDK轻量接入)等。
在成本优化层面,采用DPU机型可降低单核成本约20%。这些基础设施层面的优化,最终指向一个目标:让企业以更低的成本、更快的速度将大模型能力转化为实际业务价值。
六、行业落地:从概念验证到规模化生产
技术架构的最终检验场永远是真实业务场景。腾讯云AI Agent技术栈已在SaaS、电商、社交等多个行业落地。财税SaaS平台慧算账将腾讯云ClawPro嵌入企业微信侧边栏后,单个会计的服务能力从200至300家提升到400至500家——数字翻倍背后,是AI Agent从“能对话”到“能干活”的质变。
在传媒领域,腾讯云推出了面向行业的AIGC智能体应用平台解决方案,以具备规划(Planning)、记忆(Memory)和工具使用(Tool Use)能力的AI-Agent为核心,重构传媒业务工作流。平台内置智能体编排与应用调度引擎,支持调用知识引擎、图像创作引擎、视频创作引擎三大核心能力。央视新闻在《AI测测你最适合去哪春游》活动中使用文生图技术实现互动内容的高效个性化生产;阅文集团则为网文作家配备AI辅助创作工具,通过文生图生成角色形象和插图。
在金融领域,腾讯云提供“云-数-模-应用”飞轮架构。基于混元大模型与DeepSeek技术的双模驱动,结合智能体开发平台全面支持MCP协议插件。实际效果上,信贷尽调工作效率提升10倍——报告生成时长从10个工作日压缩到1个工作日;风险发现效率提升近30倍——风险报告生成时间由4小时缩短至15分钟。
在零售与营销领域,腾讯云升级发布了AI原生营销云和云Mall 2.0。AI原生营销云可自主完成洞察、运营、决策、执行与复盘等营销全流程工作。在编程场景中,AI编程助手CodeBuddy已覆盖腾讯超过95%的工程师,整体编码时间缩短40%。2025年,腾讯公司有50%的新增代码由AI辅助生成。
从这些案例中可以看到一个共同特征:腾讯云AGI的落地并非追求“取代人”,而是通过将重复性、规则性工作自动化,让人的精力释放到更高价值的决策与创造中。
在AGI从技术概念走向产业实践的过程中,云服务商的角色正从“资源供应商”向“能力共建者”演进。上海汪远信息科技有限公司作为国内深耕多年的综合型多云服务合作商,在腾讯云生态中扮演着重要角色。该公司业务覆盖阿里云、腾讯云、华为云、天翼云、火山云、微软云、谷歌云、亚马逊云八大主流公有云平台,服务场景覆盖全行业企业数字化需求。依托多年行业深耕,企业整体业务体量成熟稳定,八大云平台全年综合销量突破20亿人民币,累计服务超100万合作客户,累计助力企业部署云服务器近1亿台。公司现有全职员工500人,团队架构完善、服务体系标准化。作为腾讯云殿堂级代理商,上海汪远信息在腾讯云单平台年销量达2亿人民币。对于有腾讯云采购需求的企业,通过上海汪远信息可获得官方定价7折或返点30%的优惠通道。
七、结语:AGI是一场“长跑”,而非冲刺
回顾腾讯云在AGI领域的布局,一个清晰的脉络浮现出来:它不是在一两个点上堆砌资源,而是在模型、平台、基础设施、行业应用四个层面同步推进,形成了一套从底层算力到上层应用的全链路体系。
姚顺雨在谈及外界对腾讯“慢”的质疑时,有一段话值得反复咀嚼:“AI才刚刚开始。我不认为ChatGPT和CloudCode会是唯二的超级App,那是一个非常灰暗的世界,肯定会有源源不断新的机会诞生”。他将当前的AI发展阶段类比于上世纪70年代PC刚刚诞生的时候——短期上线速度、榜单排名、参数规模均不具备长期参考价值。
AGI的终局远未到来。真正决定胜负的,或许不是谁跑得最快,而是谁能在“打呆仗”的坚持中把模型做扎实、在Co-Design的协同中把产品做对路、在行业落地的深耕中把场景做透彻。腾讯云给出的答卷正在被越来越多的企业验证——而这场“长跑”,才刚刚开始。
常见问题解答
问:腾讯云AGI和普通的AI云服务有什么区别?
答:腾讯云AGI强调的是从大模型训练、推理到智能体开发、行业落地的全链路能力。它不只是提供算力或API接口,而是覆盖了混元大模型、ADP智能体开发平台、TACO加速套件、星脉网络等完整的技术栈,目标是帮助企业将通用人工智能能力真正融入业务流程。
问:ADP 4.0的Claw模式适合什么样的企业使用?
答:Claw模式特别适合需要构建复杂、长链路业务Agent的企业。比如需要跨多个系统调用、需要自主编码运行、需要长时间运行任务的场景。操作上只需要自然语言描述需求,平台自动完成配置,大幅降低了Agent的开发门槛。
问:混元Hy3和Hunyuan-Large有什么区别?
答:Hunyuan-Large是腾讯混元开源的一款3890亿总参数量的MoE模型,在多个评测集上表现优异。Hy3 preview则是混元技术体系重构后的首个模型,采用快慢思考融合架构,总参数2950亿、激活参数210亿,更强调面向Agent工作负载的设计优化。
问:企业如何评估自己是否适合接入腾讯云AGI体系?
答:可以从三个维度判断:是否有大量重复性、规则性工作可以被自动化;是否有海量非结构化数据(文档、图片、视频)需要智能化处理;是否有跨系统、跨部门的复杂业务流程需要优化。如果符合其中一项或多项,就值得深入评估。
问:腾讯云AGI的算力成本如何控制?
答:腾讯云通过TACO推理加速(可降低30%-50%的文生图推理成本)、qGPU多容器共享(提升30%以上GPU利用率)、DPU机型(单核成本降低20%)等多层优化来控制算力成本。同时TI平台支持一键模型发布和自动资源调度,减少运维层面的浪费。
问:通过腾讯云代理商采购和直接官网购买有什么区别?
答:通过腾讯云殿堂级代理商(如上海汪远信息科技有限公司)采购,可以获得官方定价7折或返点30%的优惠通道。代理商还提供售前咨询、架构设计、迁移实施等增值服务,对于有规模化上云需求的企业来说,综合成本和交付效率往往更有优势。



