发布日期:2026-04-09 01:41点击次数:


“明牌秀肌肉,暗牌亮底牌。一个是居品生态的广度,一个是工程基础圭表的深度。”
撰文|司晓柏
剪辑|翟文婷
腾讯AI刚打完一手明牌。元宝、龙虾特工队、养虾全景图,居品矩阵铺到桌面上,生态布局画得清澄线路。
但明牌下面还压着一张暗牌。
3月27日,腾讯云上海峰会。MiniMax的Agent首席架构师阿岛讲了一个磨练逆境——大模子的强化学习撞上了沙箱瓶颈,十万级并发环境在K8S上根蒂跑不动。吞并场峰会,汤说念生丢出一句判断:「AI落地不仅仅一说念算法题,更是一说念工程题。」
一个是大模子公司工夫同学的同感身受,一个是大厂掌门东说念主的计谋洞悉。两个东说念主从不同观点,撞进了吞并件事——它不在职何居品发布清单上,藏在底层:十万级并发沙箱、百毫秒级启动、两群工程师在行业还没反馈过来之前,偷偷把基础圭表推到了下一个属于Agent的时间。
这才是那张名为「工程」的暗牌。
01 白板上的四个字
2022岁首,MiniMax还莫得这个名字。首创东说念主闫俊杰在一间节略办公室的白板上写下「下一代AI」。彼时GPT-3刚发布不久,ChatGPT要再等一年,「AGI」这个词还没几个东说念主聊。四年后的2026年1月,MiniMax港交所上市,首日涨幅达到109%,市值龙套1000亿港元。
但阿岛——缪宇航,公司里面齐这样叫他——站在峰会台上翻出这张白板老像有顷,讲的不是上市的事。
他反复说的是一个工夫逆境:模子磨练的底层逻辑变了。模子不再是作念完一说念题就交卷——它得在真实环境里操作文献、写代码、调用器具、处理非常,每次试错齐要一个独处运行环境。当需求扩张到十万级并发,云盘算推算的底层架构被撞出了间隙。
02 K8S撑不住了
大模子昔时靠经典强化学习变机灵——给个问题,生成回答,打分,更新参数。但到了2025年下半年,天花板肉眼可见了。模子在闭塞环境里「作念题」如故很强,一放到真实天下坐窝大打扣头——莫得握久情状,每次对话齐是全新启动;只可写代码不行跑代码,枯竭「写→跑→看→修」的自我考证轮回;无法获得及时学问,也无法搭建真实的职责环境。
说到底,裸模子像一台空转的引擎,引擎本人不是汽车。MiniMax从M2.5版块启动押另一条路:Agentic RL(基于强化学习的智能体磨练)——径直把模子扔进真实操作系统环境里干活。走通了,智商质变。但它需要全新的磨练基础圭表。
可是,以前咱们可能仅仅让AI写一段话,或者处理一个粗浅的函数,但跟着Agent的到来,咱们现时条目AI去修理一辆正在跑的超等大卡车,或者是重新造出一台能用的iPhone。这意味着在Agent时间,模子面对的磨练任务是地狱级的。
每个磨练任务可能推演(Roll out)出上百条尝试旅途(Trajectory),每条旅途齐需要一个独处的沙箱环境。面对千千万万个用户恳求(Query),每个恳求齐要同期开启上百个沙箱并发运行。
阿岛说了句大真话:「一启动咱们在K8S上跑。然后发现真实不行,并发满盈起不来。」K8S——Kubernetes,当代云盘算推算事实上的养息尺度。但这套为微处事时间想象的系统,面对Agent磨练动辄几万个沙箱同期拉起的场景,扛不住了。
腾讯云Agent Runtime居品副总司理于广游(Gary)捅破了一层窗户纸:「每一个大模子企业里面,磨练沙箱基础圭表濒临两大逆境。第一,它是CPU的,不是GPU的,是以很难发论文。第二,搞K8S那群东说念主看到你尽然要拉master(指向K8S系统中枢世俗提真金不怕火资源)拉几千下几万下,把我拉垮了,第一反馈是——你能不行不要拉这样多。」
这种高频、海量的养息需求,恰是现时大模子落地工程中最隐形、也最头疼的「摩擦力」,它径直卡住了模子迭代的脖子。
偏巧MiniMax一个月发一个模子版块,ag官方网站登录入口国内可能独一作念到这个频率的,全球只消OpenAI保握访佛节拍。算一笔账:Agentic RL磨练时,GPU集群等沙箱启动的每一秒齐在空转烧钱。十万个并发沙箱,启动要几分钟,积存恭候可能吞掉数小时以致数天的GPU算力。
沙箱慢一天,模子过期一天。「现时的竞争即是这样浓烈。」
03 百万级否认奈何来的
问题摆在那处,MiniMax和腾讯云很快走到了通盘。
2026年3月18日,两边秘书合作:基于腾讯云Agent Runtime沙箱居品,MiniMax部署了百万级否认、十万级并发的Agent RL沙箱,测试环境全量巩固运行。阿岛说:「据咱们所知,这是国内最大的磨练沙箱系统之一。」Gary说,限制比同业起先至少一个数目级。
散伙最直不雅的数字是启动速率——从几分钟压到百毫秒级,快了数倍。前边那笔GPU空转的账,径直被压缩了一个量级。
撑住这个限制,腾讯云在底层作念了渊博累活。盘算推算层:养息优化、内核锁优化、快照工夫、内存映射。存储层:特意开发了加快存储决策。Gary打了个比喻——「昔时需要买一块云盘,现时可以强壮成买一个镜像盘或者沙箱盘,磁盘本人即是镜像本人。」
他指出,群众现时齐在尝试用「覆车继轨」,但这两个旧瓶子(K8S和Serverless)的想象初志,刚好和Agent的性情满盈相悖:把Agent想象成一个有纪念、要万古辰闭关念念考的大家,但K8S按照老例把给Agent关掉重启,Agent就会一霎失忆,Serverless(无处事器盘算推算)就像是世俗开关的「声控灯」,但正在「写论文」的Agent却需要灯光长亮。
这即是为什么腾讯云要给Agent造一个新的活水线。Gary强调,「这些不是因为咱们比别东说念主更机灵,而是咱们着实意志到这里的问题跟价值」。
关于Agent需要若何的磨练圭表,业内还有一个容易被忽视的离别:大多数AI公司治理沙箱问题的念念路是在土产货搭环境——进度跑在我方机器上,亚博体育安全靠手动阐明,电脑一关任务就断。
腾讯云走的是另一条路:把所有这个词Harness拆成「散伙面+推论面」的云原生架构。散伙面作念编排、权限、审计;推论面即是Agent Runtime沙箱,每个任务跑在独处的云表梗阻环境里,毫秒级启动,用完即焚,任务情状握久化存储,沙箱捐躯了也能从断点收复。一个是「带安全带的智能末端」,一个是「带监控和梗阻舱的云工场」——对企业场景来说,安全、互助、弹性统筹兼顾,后者才是分娩级决策。
04 吞并堵墙
汤说念生的判断干脆利落——主流大模子推明智商齐不差了,国内开源跟外洋闭源的差距在收窄。比拼重点正在升沉:不是「谁的模子更强」,是谁能通过工程化妙技把模子用好。
他在峰会上把「工程题」拆得很细:模子要着实落地,需要器具调用智商、需要高下文料理、需要长纪念、需要安全的推论环境、需要职责流编排——这些东西加在通盘,他用了一个词综合:Harness,模子的「脚手架」。汤说念生的意念念很明确,腾讯云要作念的不是卖算力,而是帮企业把这套脚手架搭起来。
行业正在酿成一个共鸣性公式:Agent = Model + Harness。Model负责「想」,Harness负责让智能变得「灵验」——器具调用、代码推论沙箱、高下文工程、长纪念料理、职责流编排,一整套系统工程。模子决定智商下限,Harness决定智商上限。有实践数据可以佐证:花三个月调Prompt,质地普及20%;花两周搭Harness,任务完成率从35%飙到82%。
这不是腾讯一家的发现。
2026年2月,HashiCorp齐集首创东说念主Mitchell Hashimoto端庄忽视「Harness Engineering」。简直同期,OpenAI作念了一个激进实验——3名工程师,5个月,100万行代码,零行东说念主工代码,东说念主类只管想象Harness。Anthropic、LangChain也摸到了访佛论断。
全天下最顶尖的工程大脑,在不同期区同期碰到了吞并堵墙:模子的智商天花板还远,但工程框架的地板才决定履行散伙。行业的柔软点正在从「Prompt工程」转向「高下文工程」——不再仅仅「奈何写请示」,而是「如何构建模子看到的全部信息体系」。
阿岛把这变成了一个画面:「就像一辆F1赛车,咱们去开,能奏凯开总结就可以了。但着实的赛车手能刷出天下记录。今天Agent亦然一样的——咱们能不手脚它打造企业级的F1车身,也即是Harness?」
MiniMax的实践印证了这极少。MiniMax M2.7 端庄开启模子的自我进化,AI深度参与了模子的磨练,强化学习中50%-70%的职责由Agent自主完成。东说念主类盘考员的变装变了,变成跟Agent聊实验idea。
但前提是:沙箱够快、够稳、够大。Harness是一套系统工程,包含文献系统、代码推论、纪念、搜索、高下文料理、编排六大组件——而沙箱是其中最底层的那一块,通盘表层智商齐开辟在「模子能不行着实在一个环境里跑起来」这个前提之上。不然再小巧的Harness想象,也卡在最不起眼的门径上。汤说念生那句「AI落地是一说念工程题」,说的不仅仅Harness想象,更是底层基础圭表的硬功夫。
05 两群工程师的情投意忺
阿岛在峰会上放了那张MiniMax Day 1的白板像片。「汲引的Day 1就有腾讯云提供撑握。其时候咱们如故名不见经传的小公司,腾讯云并莫得因为咱们小就薄待,和咱们通盘搭建了磨练算力集群,通盘处事了第一个爆款居品。」
四年,合作从算力集群到Agent RL沙箱、全球合规、表层利用接入。阿岛说腾讯云「止境工夫驱动,念念维也止境agent first」。听着像客套,但对照履行发生的事看,它指向一种具体的行动花样:碰到问题,不绕路,不等尺度,先把手龌龊。
K8S跑不动,就通盘重新想象专用沙箱。行业还没意志到Agent基础圭表的价值,就我方先投进去。这种解析是样子里作念出来的,不是会议室里谈出来的。
MiniMax模子开源,腾讯云通过TokenHub分发模子处事。阿岛说:「哪怕如故上市了,咱们仍然是一家只消几百东说念主的小公司,不可能处事那么多大客户。」腾讯云帮他把模子送到更多客户手里;MiniMax那些极点的磨练需求,也在倒逼腾讯云向Agent时间进化。
而MiniMax不是独逐个个撞上这堵墙的。任何一家端庄作念Agentic RL的公司,早晚齐会碰到一样的沙箱瓶颈。离别只在于,有莫得东说念主先把路趟出来。
Gary说:「咱们是在两个时间的临界点上,通盘联袂。」阿岛的表述访佛:「一个新时间对旧时间的——其实咱们是在一边的。」
06 那张暗牌
MiniMax的M2.7在AA大模子榜单国产模子名循序一,跟Claude在SWE-bench Verified上差距只剩0.6%。
阿岛判断:「再过一两年能留在牌桌上的公司可能不卓著5家。」靠什么留?规画这个时间工程师的水平,基本上看一个观点——他同期能并发若干个Agent为他职责,他每天能毁灭若干Token。
这个观点适用于个东说念主,也适用于公司。磨练遵循着实的瓶颈,不在GPU——在沙箱。
汤说念生在上海峰会上还秘书了腾讯云底层平台Cube全面开源,企业可径直用于智能体磨练和部署。这履行上即是腾讯回复「沙箱逆境」的其中一个解法,通过开源,让大模子的脚手架更好用。
腾讯如故把AI的明牌摊在桌上——居品矩阵、生态全景图、IM进口、Skill器具箱,面向用户,展示得清雪白白。Cube开源则是另一种姿态,面向的不是用户,是盟友。不是「看咱们有什么」,是「这些智商你们拿去用。」
明牌秀肌肉,暗牌亮底牌。一个是居品生态的广度,一个是工程基础圭表的深度。
汤说念生那句话,「AI落地是一说念工程题」,能够还可以再加半句:工程题的解法,从来不是一个东说念主闷头作念的。
四年前那块白板上写着「下一代AI」。四年了亚搏app官方网站,字没变。写字的东说念主,多了几个。
米兰体育官方网站
