设为首页 加入收藏
  • 首页
  • 综合
  • 休闲
  • 热点
  • 焦点
  • 当前位置:首页 > 热点 > 腾讯云Agent Runtime沙箱助力MiniMax打造生产级Agent RL底座

    腾讯云Agent Runtime沙箱助力MiniMax打造生产级Agent RL底座

    发布时间:2026-05-11 21:34:58 来源:威能网 作者:热点

    近日,腾讯国际领先的沙生产AI大模型厂商MiniMax与腾讯云正式达成深度合作,双方围绕Agent RL强化学习训练的箱助核心场景,基于腾讯云Agent Runtime沙箱产品展开全链路技术与业务协同。打造底座

    MiniMax深耕通用人工智能领域,近期发布的沙生产Agent RL框架Forge,旨在突破大模型在复杂任务中的箱助逻辑推理、代码执行与自主决策能力,打造底座而其大规模训练对底层基础设施的腾讯弹性、并发、沙生产安全提出极高要求。箱助

    此次与腾讯云的深度合作,让Forge框架实现了强化学习场景中大规模交互环境的腾讯毫秒级拉起、百万级吞吐、沙生产十万级并发、箱助瞬时销毁,大幅提升了训练吞吐量和稳定性。

    图:Agent RL(智能体强化学习)端到端闭环技术架构

    腾讯云Agent Runtime沙箱自发布以来,已深度适配多个国际领先大模型,在智能编程、数据处理、自动化评测、浏览器交互等多元化业务场景实现规模化落地。此次与MiniMax的合作,针对Agent RL大规模数据合成、训练、评估的核心需求,实现了毫秒级沙箱启动、百万级实例并发、全场景环境模拟与安全隔离的技术突破,既是腾讯云Agent沙箱产品能力在头部客户核心场景的重磅验证,更标志着其完成了从技术打磨到规模化商业落地的关键跨越。

    随着AI智能体从会话式向执行式加速演进,大模型厂商在Agent RL等核心场景落地中,普遍面临四大行业痛点:一是Prompt注入、越权执行带来的安全合规风险,缺少可控的安全执行边界;二是传统K8s架构为微服务设计,与Agent会话亲和、即用即销毁的资源模型错配,引发资源浪费、调度效率低等问题;三是容器/VM冷启动延迟高,无法支撑RL训练万级并发、交互式Agent百毫秒级启动的性能需求;四是行业协议标准不统一,存量业务迁移改造成本高,海量镜像分发易引发TB级带宽瓶颈。

    针对上述行业痛点,腾讯云Agent Runtime沙箱打造了全场景适配的定制化解决方案,实现了性能、安全、成本的三重突破。

    在性能层面,通过多级轻量架构与设备池化设计,规避传统K8s调度瓶颈,实现58秒内启动3万个4C+8G规格沙箱实例,单镜像场景下每分钟可创建60万沙箱、QPS超1万,SWE RL场景下压测吞吐达16w QPM,P99延迟稳定在1秒内且成功率达4个9;通过镜像按需加载、就近缓存、块级去重三大优化,解决海量镜像分发带宽难题,将镜像实际读取占比从全量降至约10%,大幅降低存储与传输成本;更通过资源池化与快照恢复技术,实现80ms级沙箱交付,较原有方案冷启动耗时降低96%。

    在安全层面,基于腾讯云自研Cube沙箱技术构建虚拟化级隔离,通过独立内核、会话/网络/存储三层隔离机制,彻底消除容器逃逸、敏感凭证泄露的高危风险,为Agent自主试错构建坚实安全边界。

    图:腾讯云自研三层安全隔离机制

    在适配层面,原生兼容E2B协议,支持SDK/MCP/CLI/云API多方式接入,MiniMax仅需修改环境变量即可完成存量Agent业务迁移,实现零改造成本规模化落地。

    此次合作中,双方共同验证了3A infra已经成为Agent时代基础设施发展的核心方向。该标准已在元宝、混元、微信读书等多个头部客户场景完成落地验证,为行业选型提供全方位参考。

    Agent First以智能体为生产主体,重构基础设施设计范式,扭转传统架构以人为服务目标的设计原则,原生适配Agent会话亲和、短时高频调用的特性,同时通过开箱即用的工具链让开发者聚焦业务逻辑,大幅降低开发门槛;

    Agent native打通技术与业务落地壁垒,不重构企业现有生产体系,原生适配Agent Serving无状态执行、Agent RL长时任务等全场景业务特性,更支持数十万自定义镜像免重构接入,实现与企业IT体系、业务流程的深度融合;

    Agent ready筑牢规模化落地核心底座,凭借ms级交付、数十万级实例秒级并发的极致性能,突破Agent规模化训练与服务的性能天花板,更构建从环境隔离到行为审计的全链路安全防线,结合智能资源调度实现成本优化,在元宝AI编程场景中,迁移后资源核时消耗降低95.8%,实现“高性能、高安全、低成本”的规模化落地。

    作为腾讯云为AI智能体量身打造的新一代任务执行环境,腾讯云Agent Runtime沙箱具备四大核心优势:一是全链路安全防护,构建环境隔离、权限管控、行为审计的完整安全防线;二是Agent原生资源架构,支持沙箱暂停/恢复/快照能力,实现资源高效调度;三是极致弹性性能,支撑数十万实例秒级并发、毫秒级启动,应对脉冲式业务需求;四是全生态兼容,多方式接入且原生兼容主流行业协议,可与腾讯云HAI、混元大模型、高性能存储、全球算力资源池等全栈产品深度联动,提供从算力、模型到执行环境的端到端解决方案。同时,该沙箱还支持代码、浏览器、移动端、电脑端等全场景交互环境模拟,提供精准轨迹记录、断点快照回放、全链路可观测的实验支持能力,完美匹配Agent RL训练的核心需求。

    双方共同表示,未来将持续深化技术协同与场景拓展,不断打磨Agent原生基础设施能力,助力大模型厂商降低技术门槛与使用成本,推动AI智能体在千行百业的规模化落地,加速通用人工智能(AGI)时代的到来。

    • 上一篇:太嚣张!广东一男子加满价值640元的油后,竟拒不付款、猛踩油门逃离现场,逃窜时同行人还对监控“比耶”;警方:嫌疑人彭某目前已被行拘
    • 下一篇:陕西发布高温蓝色预警:升温节奏快、体感燥热!

      相关文章

      • 凯迪拉克领队:周冠宇将代表凯迪拉克车队首次试车
      • 玻色量子、北京金控等拟设1亿元“京工量子生态基金”
      • 多家在线旅游平台公告:持续推动算法向上向善
      • 欧盟出台措施应对航空燃油供应紧张
      • 天舟十号货运飞船与空间站组合体完成交会对接
      • 赵心童当选最佳球员并入选名人堂 世界斯诺克巡回赛年度奖中国球员“丰收”
      • 俄乌双方同意延长停火并换俘
      • 岱顶海棠次第开 “五岳之首”泰山引客来
      • 女子硕士入学清华后参与智力测验,仅得25分属“智力中下”:工作、学习都没遇到过困难,看到测试结果大受震撼
      • 全国大部地区大气扩散条件较好,西北部分地区有扬沙或浮尘天气

        随便看看

      • 新股上市大涨!中一签最高赚4.8万!
      • 新民视频 | 魔都周末,在最美老建筑里逛摄影展!爱拍照的人都在这
      • 百万粉丝博主直播精华:你的财富是怎么一点点漏掉的?
      • 汉坦病毒是个啥?会引发大流行吗?如何预防?一文了解
      • 升温13日达顶峰!天气将翻脸?两波降雨排好队,南北走势大不同
      • 俄罗斯同意延长停火并换俘 乌克兰称不会袭击红场阅兵
      • 68元一杯白酒咖啡,五粮液开始做“日咖夜酒”,正餐时间消费者可选购川菜融合菜套餐,两人正餐套餐约200元
      • 世卫组织:已启动应对汉坦病毒疫情行动
      • 盟市动态 | 乌海市:“家长夜校”点亮家庭教育星火
      • 30年前捐赠书画去向不明?天津美院通报:40件作品均完整在库保管
      • Copyright © 2026 Powered by 腾讯云Agent Runtime沙箱助力MiniMax打造生产级Agent RL底座,威能网   琼ICP备2025056076号-18 sitemap