3月4日,阶跃星辰官微宣布开源Step3.5 Flash的预训练权重(Base)、中训练权重(Midtrain)以及配套的Steptron训练框架。据了解,Step3.5 Flash采用稀疏MoE架构,总参数1960亿,但推理时仅激活约110亿参数,单请求代码任务下推理速度最高可达350TPS。
内容无需标注
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。
上一篇
福特中国官宣:杨美虹将退休
下一篇
大跌8%!韩国交易所启动KOSDAQ指数熔断机制
每日经济新闻客户端
National Business Daily Mobile Version
华为系“顶流”再扩容!尊界S800典藏大观138.8万元起售,鸿蒙智行售价最高的MPV下半年正式入场
加码Harness人才布局,DeepSeek的AI发展路径由轻转重?
贵金属价格深度回调!水贝料商 :白银“抄不完底”,不过交易量已开始回升