每日经济新闻

    面壁智能发布基于稀疏-线性混合架构SALA训练9B模型

    每日经济新闻 2026-02-12 11:53

    每经AI快讯,面壁智能公众号2月12日宣布,正式发布稀疏-线性注意力混合架构SALA,以及基于该架构的文本模型MiniCPM-SALA,模型仅有9B参数。据介绍,MiniCPM-SALA不使用投机采样等加速算法,在云端推理芯片上,当序列长度为256K词元时推理速度高达Qwen3-8B的3.5倍,并支持在云端芯片和消费级端侧GPU上进行高达一百万词元上下文长度的推理。

     

    版权声明

    1本文为《每日经济新闻》原创作品。

    2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。

    上一篇

    优彩资源:取得授予发明专利权通知书

    下一篇

    *ST汇科:公司《2025年年度报告》的预约披露时间变更为2026年4月10日



    分享成功
    每日经济新闻客户端
    一款点开就不想离开的财经APP 免费下载体验