每日经济新闻

    印奇挂帅阶跃星辰一周抛“端侧王牌”:Step 3.5 Flash演示“网购比价”

    每日经济新闻 2026-02-05 19:56

    每经记者|李卓 实习记者 郑欣蔚    每经编辑|张益铭    

    印奇出任董事长官宣仅一周,阶跃星辰抛出“端侧王牌”。

    2月2日,有着“AI(人工智能)六小虎”之称的国产大模型创业公司阶跃星辰正式发布开源Agent(智能体)基座模型Step 3.5 Flash。该模型以350TPS(每秒生成词元数)推理速度、1960亿参数稀疏MoE(混合专家模型)架构及256K上下文处理能力,成为国内面向Agent场景的又一重磅开源模型。

    围绕AI如何真正“落地办事”、走向规模化应用的“巷战”已然打响。阶跃星辰这次更新,究竟解决了AI落地哪些问题?在这场明星大模型扎堆的技术竞赛中,阶跃星辰将靠什么破局?

    “一次有效的应用破壁”

    据阶跃星辰官方介绍,Step3.5 Flash模型在单请求代码类任务中推理速度最高可达350TPS,同时在Agent场景和数学任务上,这款开源模型的表现已能媲美主流闭源大模型。阶跃星辰披露的基准测试成绩显示,在数学与推理能力、编码能力、智能Agent能力上,该模型的各项表现都排在前列。与此同时,Step3.5 Flash能够高效处理256K的上下文,胜任复杂、长逻辑链条任务。

    “Step 3.5 Flash模型具备很强的底座潜力,标志着国产模型正式从‘参数崇拜’转向‘智能密度’竞争,即从‘更大’转变为‘更聪明’。”快思慢想研究院创始院长田丰在接受记者采访时指出,Step 3.5 Flash模型MoE架构的效率创新使其能以更低功耗提供更深的思考,最高每秒350个token(词元)的生成速度表现则解决了终端侧最头疼的“打字机效应”。

    田丰进一步解释:“作为对比,主流大中型模型的文字回复速度平均水平是每秒20~80个token,轻量级模型平均是每秒80~150个token。350TPS的更高速度意味着首字延迟更短,语音交互能实现瞬时响应,跨多个Agent之间的‘内部对话’速度极快。在车载语音交互或手机实时翻译场景下,只有低于100ms的首字延迟才能称之为‘通用底座’,用户才能获得丝滑的人机对话体验。”

    Step 3.5 Flash具体能做什么?在阶跃星辰官方列举的实用场景中,Step 3.5 Flash可以快速计算复杂数学题并输出正确答案;可以智能体编程,基于一段文字prompt(提示词),自动编程并输出可视化平台结果。

    在阶跃星辰展示的视频演示中,用户提出对比Mac Mini M4在各大电商平台的价格,Step 3.5Flash作为“云端大脑”,将这一复杂需求拆解成针对淘宝、京东和拼多多的具体子任务。随后Step 3.5Flash汇总结果,识别出拼多多为最低价平台,并提供购买指南。据称,这种云端规划降低了本地StepGUI的执行难度,使其在从各应用抓取实时数据时获得更高成功率。

    知名经济学家、工信部信息通信经济专家委员会委员盘和林向记者解读称,这是阶跃星辰进行的“一次有效的应用破壁”,“其应用场景对用户还是有吸引力的,未来也能和电商等App(手机应用软件)融合,从而用AI增加电商获客量,是有可能实现商业化落地的”。

    田丰则对记者指出,阶跃星辰展示的网购比价本质是模型对复杂长链条任务的拆解能力,以往App之间是信息孤岛,而Step 3.5Flash表现出的Agent智能,能够理解“比价”背后的逻辑(搜价格、算优惠、比库存),这与豆包手机让“AI成为系统底层的指挥官”思路一致。他认为,Step 3.5 Flash接入类似“豆包手机”这样的深度定制化终端在技术上并不是难题,最大的挑战来自“生态主权”。

    “技术上,模型已经能在128GB RAM的设备(如Mac Studio甚至高端国产手机)上流畅运行,但在现实中,如何让淘宝、京东、美团等平台对Agent开放深层数据权限,而非简单的网页爬取,这不仅是技术集成,更是商业利益链的重新分配。”田丰称,“我倡议互联网巨头能够提供标准商业API(应用程序编程接口)接口、MCP(模型上下文协议)接口,让Agent真正站在个人用户角度来提供更好的贴身服务,而非巨头疆域边界内的‘笼中雀’。”

    “能跑端侧的顶级智力”

    阶跃星辰此次基座模型的最新发布,恰逢一场围绕Agent的行业“卡位战”。

    在行业近期的模型密集上新期,智能体能力已成为头部公司竞相角逐的核心之一。1月26日,阿里巴巴发布旗舰推理模型Qwen3-Max-Thinking,宣称其在Agent能力基准测试中刷新SOTA(最佳技术表现)纪录;次日,月之暗面开源万亿参数的多模态模型Kimi K2.5,同样宣布在开源Agent场景中取得SOTA表现。

    作为大模型技术落地的关键载体,这些头部公司正多维度加速推进其智能体战略,并展现出各自的鲜明路径。

    业务版图宏大的互联网巨头阿里强调“模型+生态”闭环。在1月15日举行的产品发布会现场,阿里宣布其千问App全面接入淘宝、支付宝、高德等业务,整合AI点外卖、订机票等功能,上线超400项服务。

    千问C端(面向消费者)事业群总裁吴嘉当时表示:“AI在拥有超强大脑之后,开始长出了能够触达真实世界的手和脚……我们的独特优势在于千问最强模型与阿里最丰富生态的结合。”而近期被官方称为“阿里规模最大、能力最强的千问推理模型”Qwen3-MaxThinking的上新为其Agent落地应用生态的升级提供了更多期待。

    相比之下,AI原生公司月之暗面选择一条更“炫技”的路径:让AI学会“分身术”。其最新发布的Kimi K2.5模型的核心突破,是从一个“超级单兵”进化为一支可以随时组建的“AI军团”。

    据月之暗面创始人杨植麟介绍,Kimi K2.5能够即时创建并协调上百个专项Agent并行工作,通过无预设的团队式协作处理复杂任务,这意味着其最新模型已经实现从“单一智能体”到“智能体集群”演进,展现出通过多智能体动态调度以攻克超复杂问题的新方向。

    同样作为AI初创公司,阶跃星辰的新模型则彰显出其以部署成本效率解决Agent落地痛点的尝试。Step 3.5 Flash模型通过稀疏MoE与MTP-3等技术,在降低激活参数的同时实现高速推理,并坚持全面开源,旨在降低开发者在消费级设备上本地部署高性能Agent的门槛。

    这一技术方向与公司押注终端场景的战略高度一致。此前,阶跃星辰已与OPPO、吉利等合作探索手机、汽车等终端侧Agent应用。例如,OPPO已基于阶跃星辰的Step系列模型推出“一键问屏”“一键全能搜”等功能,用户可直接指令AI进入任意App完成任务,真正实现端侧Agent。

    “随着50亿元融资落地和产业资本进入,阶跃星辰的重心正快速向手机、PC(个人电脑)及智能座舱倾斜,印奇挂帅则彰显出阶跃星辰‘模硬一体’的战略突破方向。Step 3.5 Flash极大概率会以端云协同的方式进入定制化终端。虽然车机、手机是目前AI主流载体,但我非常期待新型AI原生硬件的大胆尝试。”田丰表示,新模型发布是阶跃星辰不再单纯“卷”万亿参数闭源大模型的明确信号,它“卷”的是“能跑在端侧的顶级智力”,如果能继续采用开源战略,或许能抢夺AI新硬件市场的“安卓地位”。

    在2025年2月的生态开放日上,阶跃星辰创始人姜大昕阐释公司对智能体发展的底层思考,他指出,多模态感知与长链慢思考推理是推动智能体进化的两大关键。随着Step 3.5 Flash这一解决复杂、长链条问题能力更突出的技术底座推出,它能在多大程度上赋能阶跃星辰的终端智能体蓝图,仍有待检验。

    版权声明

    1本文为《每日经济新闻》原创作品。

    2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。

    上一篇

    Claude Cowork爆火,阿里、MiniMax等悉数入场

    下一篇

    《中国双向投资报告2025》发布:亚洲发展中经济体仍是全球最大FDI流入量接收地



    分享成功
    每日经济新闻客户端
    一款点开就不想离开的财经APP 免费下载体验