每经AI快讯,3月4日,阶跃星辰官微宣布开源Step3.5 Flash的预训练权重(Base)、中训练权重(Midtrain)以及配套的Steptron训练框架。据了解,Step3.5 Flash采用稀疏MoE架构,总参数1960亿,但推理时仅激活约110亿参数,单请求代码任务下推理速度最高可达350TPS。
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。
上一篇
港股油气设备股多数走低 百勤油服跌超20%
下一篇
存储芯片价格持续上涨,佰维存储主动预告业绩:今年前两月将扭亏为盈,净利润同比增加921%至1086%
每日经济新闻客户端
National Business Daily Mobile Version
火山引擎发布豆包大模型2.1 Pro;正行创新完成近亿美元天使轮系列融资|未来商业早参
每经实探甲酰胺风波下的纸尿裤货架:山姆支持好奇纸尿裤全额退款,Babycare门店贴出检测报告,线下涉事品牌销量受到影响
黄金白银,双双大跌:金价跌破4100美元,白银跌破62美元!事关金银投资,多家银行大幅收紧 | 金银价格