每日经济新闻

    阿里云通义开源长文本模型及推理框架 百万Tokens处理速度提升近7倍

    每日经济新闻 2025-01-27 11:17

    每经记者 叶晓丹    每经编辑 张海妮    

    1月27日凌晨,阿里云通义开源支持100万Tokens上下文的Qwen2.5-1M模型,推出7B及14B两个尺寸,均在处理长文本任务中稳定超越GPT-4o-mini;同时开源推理框架,在处理百万级别长文本输入时可实现近7倍的提速。

    百万Tokens长文本,可换算成10本长篇小说、150小时演讲稿或3万行代码。两个月前,Qwen2.5-Turbo升级了百万Tokens的上下文输入能力。如今,开源社区可基于全新的Qwen2.5-1M系列模型,进行长篇小说或多篇学术论文的解析,或是探索仓库级代码的分析和升级。

    版权声明

    1本文为《每日经济新闻》原创作品。

    2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。

    上一篇

    韩国坠机初步调查报告:两侧发动机吸入花脸鸭

    下一篇

    沪深京三市成交额突破7000亿元



    分享成功
    每日经济新闻客户端
    一款点开就不想离开的财经APP 免费下载体验