每经AI快讯,3月4日,阶跃星辰官微宣布开源Step3.5 Flash的预训练权重(Base)、中训练权重(Midtrain)以及配套的Steptron训练框架。据了解,Step3.5 Flash采用稀疏MoE架构,总参数1960亿,但推理时仅激活约110亿参数,单请求代码任务下推理速度最高可达350TPS。
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。
上一篇
港股油气设备股多数走低 百勤油服跌超20%
下一篇
存储芯片价格持续上涨,佰维存储主动预告业绩:今年前两月将扭亏为盈,净利润同比增加921%至1086%
每日经济新闻客户端
National Business Daily Mobile Version
世界杯还没开踢,中国球迷先“退票”了
快手可灵,大消息!接近交易人士最新透露
“微信状态可看访客记录”爆上热搜,腾讯张军最新回应:“访客和已读功能”已焊死,不会开发,此次小范围测试浏览人数展示功能已停止