每经AI快讯,3月4日,阶跃星辰官微宣布开源Step3.5 Flash的预训练权重(Base)、中训练权重(Midtrain)以及配套的Steptron训练框架。据了解,Step3.5 Flash采用稀疏MoE架构,总参数1960亿,但推理时仅激活约110亿参数,单请求代码任务下推理速度最高可达350TPS。
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。
上一篇
港股油气设备股多数走低 百勤油服跌超20%
下一篇
存储芯片价格持续上涨,佰维存储主动预告业绩:今年前两月将扭亏为盈,净利润同比增加921%至1086%
每日经济新闻客户端
National Business Daily Mobile Version
一季度全社会用电量同比增长5.2% 专家:第二产业成用电量增长主要拉动力
“DeepSeek启动融资”消息引爆创投圈!资本布局大模型赛道逻辑生变
3家上市公司同日下修去年业绩预告 东华能源由预盈变预亏