每日经济新闻

腾讯混元AI Infra核心技术开源:推理吞吐提升30%

每日经济新闻 2026-02-04 18:49

每经AI快讯,2月4日,腾讯混元AI Infra团队正式推出开源生产级高性能LLM推理核心算子库 HPC-Ops。在真实场景下,基于HPC-Ops,混元模型推理 QPM 提升30%,DeepSeek模型 QPM 提升17%。同时,在单算子性能方面,HPC-Ops实现Attention相比 FlashInfer/FlashAttention 最高提升2.22倍;GroupGEMM 相比 DeepGEMM 最高提升1.88倍;FusedMoE 相比 TensorRT-LLM 最高提升1.49倍。

版权声明

1本文为《每日经济新闻》原创作品。

2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。

上一篇

赛微微电:公司及控股子公司对外担保总额为2000万元

下一篇

海南海药:云南国际信托有限公司持股比例已降至4.99%



分享成功
每日经济新闻客户端
一款点开就不想离开的财经APP 免费下载体验