3月4日,阶跃星辰官微宣布开源Step3.5 Flash的预训练权重(Base)、中训练权重(Midtrain)以及配套的Steptron训练框架。据了解,Step3.5 Flash采用稀疏MoE架构,总参数1960亿,但推理时仅激活约110亿参数,单请求代码任务下推理速度最高可达350TPS。
内容无需标注
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。
上一篇
福特中国官宣:杨美虹将退休
下一篇
大跌8%!韩国交易所启动KOSDAQ指数熔断机制
每日经济新闻客户端
National Business Daily Mobile Version
深夜,利空突袭!美股全线下跌,纳指跌超500点,芯片股大跳水,英伟达跌超3%,英特尔跌近7%!中概股普跌,黄金白银走低|美股开盘
“黑色星期五”!美股芯片股大跳水,美光科技跌超13%,英特尔跌11%,金银、原油、比特币也全线下跌!特朗普紧急发声 | 美股收盘
两年30万台,安吉尔如何凭空间大师强势领跑行业?