MWC围观、OpenClaw屠榜!2026 AI变天:从“陪聊”到“干活”,中国模型成全球开发者首选_Flash_Step_Agent
- 人气:
智东西
作者 | 王涵
编辑 | 漠影
3月2日,西班牙巴塞罗那,持续四天的世界移动通信大会MWC 2026正式开幕。在春节后的首场全球科技盛会上,中国科技厂商的展台面前人头攒动。
智东西在逛展时便发现,围绕人工智能的新技术新应用,在本届MWC大会上无处不在。
从字节跳动和努比亚合作的“豆包AI”手机到荣耀新发布的机器人手机,展台都被来自世界各地的参会者围得水泄不通,他们都想要亲自上手体验,看AI到底是如何操作手机、如何做事的。
在同一天,一度让全球开发者为之疯狂,连AI大神卡帕西都曾盛赞为“令人惊叹的科幻级爆发现象”的开源AI Agent助手OpenClaw,已经超越了所有GitHub开源软件项目,正式成为史上最受欢迎开源项目。
OpenClaw本质上是一个能直接操作你电脑的AI Agent,开发者们疯狂地为它接入各种大模型,只为了一个目的:让AI真的动起来,帮自己干活。
这两件事看似没有关联,但他们都不约而同地反映出2026年AI发展的一个核心趋势,那就是:AI正在从能听懂你的话,进化到可以帮你做事了。
一、阶跃星辰新模型,凭何成为全球爆火OpenClaw玩家的拥趸?
同样是使用OpenClaw来干活,活干得怎么样,背后的大模型就至关重要。在知名模型聚合平台OpenRouter上,OpenClaw的调用量榜单成了衡量模型“动手能力”的直接体现。
就在3月2日,国内大模型头部创企阶跃星辰在2月新开源的Agent基座模型Step 3.5 Flash单日调用量已超过40B,在OpenClaw的调用量榜中排名第二,超过Kimi K2.5、Gemini 3 Flash Preview、Claude Sonnet 4.5等一众国内外主流模型。
对于OpenClaw这种需要复杂推理、长时间运行的Agent系统,用户更加倾向速度快、推理强、成本低的模型。而Step 3.5 Flash恰恰满足了OpenClaw用户的痛点。
Step 3.5 Flash***用稀疏MoE架构,每个token仅激活约110亿参数(总计1960亿),在单请求代码类任务上最高推理速度可达每秒350个token。在Agent场景和数学任务上,Step 3.5 Flash的能力逼近闭源模型,能够胜任复杂、长链条任务,是阶跃星辰迄今最强的开源基座模型。
这款模型一经发布,便受到大量海外开发者的关注好评,向来低调的阶跃星辰研发团队,罕见现身Reddit r/LocalLLaMA社区回答全球开发者有关Step 3.5 Flash的提问。
有开发者提问:在规划Step 3.5 Flash时,你们是否心中已经瞄准了这个特定的“最佳平衡点”:89 tokens/参数,并且正好卡在消费级硬件规模的上限(128GB 用于 Q4 量化,11B 激活参数以保证实用的运行速度)?
阶跃星辰CTO朱亦博回复称,团队的确有明确目标,即让相关模型能够运行在128GB内存系统中。他发现,目前市场上约230B规模的模型,刚好超出了其个人MacBook Pro设备4位量化的承受范围,因此他便要求团队对模型规模进行了适当缩减。
从开发者的角度去研发产品,而不是让开发者来适应产品。有开发者说,这正是他觉得兴奋的地方。
有外网网友分享称,对Step 3.5 Flash的印象很深刻,已经将该模型作为自己OpenClaw的主力Agent。
二、有求必应,阶跃星辰Step 3.5 Flash全链路“开诚布公”
在与阶跃星辰研发团队的沟通中,有开发者希望阶跃星辰可以将基础模型与指令/思考模型一起发布,这样社区就可以对它进行微调了。
阶跃星辰对开发者有求必应,阶跃星辰将Step 3.5 Flash的Base权重、Midtrain权重、Steptron训练框架一同开源,希望通过更彻底的开源,让开发者能够以Step 3.5 Flash为基座进行更深度模型定制,打造真正属于自己的Agent。
这一举动在当前大模型开源趋于保守的环境下,显得颇为彻底。开源不到24小时,海外社区对阶跃星辰的进一步开源的反馈十分热烈。
还有开发者赞叹说,Step 3.5 Flash速度十分惊艳,与OpenClaw的自然兼容性也很出色。
三、开发者用脚投票:从应用出发,才能让AI更好地应用
从全球开发者们使用大模型构建Agent的实践反馈中,我们也可以看出:
最近一两年,AI的核心是“理解用户”,大模型比拼的是谁更懂人的语义、谁的上下文更长。而2026年的分水岭在于,AI的核心正在向“执行任务”迁移,比的是谁能让AI真正操作工具、谁能帮人类做更多的事情。
而阶跃星辰的技术路线,正是围绕着“让AI做事”展开。
在阶跃星辰团队与全球开发者的交流中,他们说了这样一句话:“Step 3.5 Flash的目标,从一开始就是三件事:智能密度、推理与生成速度、Agent能力。目标清晰后,算法、数据与基础设施会自然对齐。”
这句话很清晰地反映出了阶跃星辰“让AI做事”的技术路径。在他们的逻辑里,一个模型好不好,不再只看它在基准测试上刷了多少分,而是看它能不能在开发者的本地机器上跑起来、跑得快、跑得稳。
最近,阶跃星辰也登上了央视焦点访谈,首席战略官李璟在节目中说到,在这半年以来,阶跃星辰在AI应用与融入人们生活的方面投入了更多的研发力量,AI已经从能听懂你说话进化到能帮你做事。
以应用来作为牵引指导多模态的发展,用应用落地的目标倒推基座大模型的研发,是阶跃星辰的发展主线。
结语:阶跃星辰选择了一条难走但正确的路
如果说2025年是国产大模型的“爆发之年”,那么2026年或将成为AI的“分水岭”,谁能找准AI落地价值与场景,谁就有可能突出重围。
阶跃星辰认准的“应用牵引多模态发展”发展路径,是一条难走但正确的路,他们认准AI的价值不在于对话,而在于它能走进多少人的生活,能帮人们做到多少事。这或许正是国产大模型从“流量竞争”走向“价值竞争”的一个缩影。
喧嚣终会退去,真正留下的是那些能扎根场景、解决实际问题的技术。返回搜狐,查看更多
- 2025-06-22请问运行windows游戏,steam os和windows哪个效率高?
- 2025-06-22养鱼一年要花费多少钱?
- 2025-06-22前端是不是快没了?
- 2025-06-22下一次星舰试飞有可能直接上V3吗?
- 2025-06-22单发六代机有没有搞头?
- 2025-06-22为什么工厂流水线的工人们宁愿每天做重覆的工作也不愿意去学一门技术?
- 2025-06-22JetBrains 放弃 AppCode 是否是一个错误决定?
- 2025-06-22自己拥有一台服务器可以做哪些很酷的事情?
- 2025-06-22以色列为什么突然敢打伊朗了?不怕被报复?
- 2025-06-22如何让你推荐一款个人待办、笔记、管理软件,你会推荐哪一个呢?
- 2025-06-22如何评价“寡姐”斯嘉丽·约翰逊的身材?
- 2025-06-22三只羊是不是被人做局了?
- 2025-06-22为什么有些NAS用户弄那么多硬盘?
- 2025-06-22目前美军还有哪些领域是明显领先于解放军的?
- 2025-06-22明星现实中真的很漂亮吗?
- 2025-06-22Office和WPS哪个好用些?
-
现在河南流行娶外国女(比如越南、老挝)结婚了吗?
我看某音上有不少河南老乡在非洲教会很多当地人说河南方言,最有 -
我国的军工能力可以实现一天5000枚火箭弹连着炸三个月吗?
一天5000枚啊,我给你算个账。 我就给你一枚火箭弹算一吨 -
为什么Go仅仅160MB的安装包就可以编译程序,而Rust却还需要几个GB的VC++才能编译?
我觉得吧,很多时候,解释是没有用的。 在这方面Go确实要比其 -
中年夫妻有多少是生活和谐的?
2025.06.14 周末了,把娃送回老家,可以不用陪娃了,




