每经北京2月11日电(记者杨昕怡)豆包大模型团队今日宣布,团队提出了全新的稀疏模型架构UltraMem,该架构有效解决了MoE(混合专家模型)推理时高额的访存问题,推理速度较MoE架构提升2~6倍,推理成本最高可降低83%。该研究还揭示了新架构的Scaling Law(规模定律),证明其不仅具备优异的Scaling特性,更在性能上超越了MoE。
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。
上一篇
港股万科企业短线拉升,现涨超5%
下一篇
券商股尾盘拉升,天风证券涨超6%
每日经济新闻客户端
National Business Daily Mobile Version
长城易趣拍App运营实体中国长城计算机进出口公司,被公示为涉非法集资“失联企业”
深圳今年拟供应保障房4万套;招商蛇口调整第四届董事会专门委员会委员 | 房产早参
长征八号运载火箭成功将千帆星座第九批18颗组网卫星送入预定轨道;SpaceX最早将于6月11日确定首次公开发行价格,股票将于6月12日上市;美国三大移动运营商组建“卫星直连”合资公司,扩大D2D通讯覆盖——《投资早参》