每日经济新闻

小米开源首个原生端到端语音大模型

每日经济新闻 2025-09-19 09:27

每经AI快讯,据Xiaomi MiMo微信公众号消息,9月19日,小米正式开源首个原生端到端语音模型——Xiaomi-MiMo-Audio,它基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于ICL的少样本泛化,并在预训练观察到明显的“涌现”行为。据介绍,在通用语音理解及对话等多项标准评测基准中,MiMo-Audio大幅超越了同参数量的开源模型,取得7B最佳性能;在音频理解基准MMAU的标准测试集上,MiMo-Audio超过Google闭源语音模型Gemini-2.5-Flash;在面向音频复杂推理的基准Big Bench Audio S2T任务中,MiMo-Audio同样超越了OpenAI闭源的语音模型GPT-4o-Audio-Preview。

版权声明

1本文为《每日经济新闻》原创作品。

2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。

上一篇

9月19日A股三大指数开盘涨跌不一,上证指数开盘下跌0.03%,创业板指上涨0.08%

下一篇

云南临沧市耿马县发生3.6级地震 震源深度10千米



分享成功
每日经济新闻客户端
一款点开就不想离开的财经APP 免费下载体验