每经北京2月11日电(记者杨昕怡)豆包大模型团队今日宣布,团队提出了全新的稀疏模型架构UltraMem,该架构有效解决了MoE(混合专家模型)推理时高额的访存问题,推理速度较MoE架构提升2~6倍,推理成本最高可降低83%。该研究还揭示了新架构的Scaling Law(规模定律),证明其不仅具备优异的Scaling特性,更在性能上超越了MoE。
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。
上一篇
港股万科企业短线拉升,现涨超5%
下一篇
券商股尾盘拉升,天风证券涨超6%
每日经济新闻客户端
National Business Daily Mobile Version
特朗普称美伊有望“一两天内”达成协议;国际油价跌超7%,美三大股指涨超1%;7家电商平台被罚没近36亿元;张雪机车又拿下第二名丨每经早参
2.39亿美元收购案“黄了”!三安光电终止联合收购Lumileds,美国以“国家安全”叫停交易
公募基金绩效考核新规落地!投资者盈亏首次纳入考核,四大要点抢先看