每日经济新闻

    Deepseek、Kimi争相对标o1,初创公司能打破“技术”和“用户”二选一魔咒吗?

    每日经济新闻 2025-01-22 11:04

    1月20日,Deepseek和Kimi相继发布新模型DeepSeek-R1与k1.5多模态思考模型,二者均在技术性能上对标OpenAI的o1正式版。这些动作反映了大模型领域内的激烈竞争态势和技术竞赛的升级。面对互联网大厂的竞争压力,大模型创业公司正探索不同的战略路径,试图在技术和市场间找到平衡点。

    每经记者 杨昕怡    每经编辑 文多    

    春节将至,国内大模型创业公司集体“凑热闹”,发布了多个对标OpenAI o1的新模型。

    发布密集程度从1月20日Deepseek和Kimi的“前脚后脚”中可见一斑,在Deepseek发布新模型DeepSeek-R1后的两小时内,Kimi推出了k1.5多模态思考模型。


    图片来源:微信截图

    据Kimi官方介绍,新模型在数学、代码、多模态推理能力等方面全面对标“Open AI满血版o1”,这也是Open AI之外的公司首次达到o1正式版水准的多模态推理性能。

    “Kimi探索的是C端场景,它探索了一个不同于Deepseek V3的基座模型方案,通过进行长模型和短模型的权重合并,以及短模型的特化RL(意为强化学习),最大化保留了类o1模型的能力。”一位国内头部大模型的算法工程师在20日接受《每日经济新闻》记者采访时表示。

    大模型是需要“重仓”投入人才、资金甚至耐心的领域,因此相对于互联网大厂而言,以“AI六小龙”为代表的大模型创业公司面临着更多艰难的选择题。

    “创业公司就得做取舍。”在近期的一次采访中,MiniMax创始人闫俊杰认为用户数等指标并非AI竞争的核心,他把技术迭代作为最重要的目标。而Kimi创始人杨植麟在2024年11月接受《每日经济新闻》记者采访时表示,将提升用户留存视为Kimi眼下最核心的任务。

    或许正因如此,2024年下半年公众讨论Kimi时多谈及其C端用户体量优势,而Deepseek却以鲶鱼之姿成为了国内大模型的技术焦点。如今,Kimi推出了k1.5,Deepseek也在本月上线了自有App,大模型初创公司在技术和用户上能做好两手抓吗?

    集体对标o1,Deepseek、Kimi相继推出新模型

    1月20日晚,Deepseek发布了DeepSeek-R1,并同步开源模型权重。据官方介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1正式版。

    官方披露,DeepSeek-R1 API(应用程序编程接口)服务定价为每百万输入Tokens1元(缓存命中)/4元(缓存未命中),每百万输出Tokens16元。(注:Tokens指文本被分割成的基本单位)

    随后,Kimi也在当晚推出了全新的k1.5多模态思考模型。官方介绍称,从基准测试成绩看,k1.5多模态思考模型实现了SOTA(意为特定时间背景下的最高水平)级别的多模态推理和通用推理能力。

    一位国内头部大模型的算法工程师向《每日经济新闻》记者表示:“Kimi探索了一条不同于Deepseek V3的基座模型方案,通过进行长模型和短模型的权重合并,以及短模型的特化RL,最大化保留了类o1模型的能力。”

    从表现数据来看,在短链思考(short-CoT)模式下,Kimi k1.5的数学、代码、视觉多模态和通用能力,均超越了全球范围内短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平;在长链思考(long-CoT)模式下,Kimi k1.5的数学、代码、多模态推理能力,也达到长思考SOTA模型OpenAI o1正式版的水平。

    此外,字节跳动旗下的豆包于1月20日推出了实时语音大模型;“AI六小龙”之一的阶跃星辰也在同天上线了Step-2系列语言模型的两款新品,即参数量小、性价比更高的Step-2 mini以及针对内容创作领域推出的“Step文学大师版”。不难看出,作为当下最为炙手可热的行业,大模型领域的技术竞赛日趋激烈。

    技术和用户,初创公司必须取舍吗?

    玩家们仍在同一田径场内竞争,但起跑线和赛道已经不同。2025年刚刚开始,国内“AI六小龙”和互联网大厂等有代表性的大模型选手就在战略方向、侧重点上出现了分野。

    1月7日,大模型创业公司零一万物CEO李开复回应媒体称,只有大厂能够“烧”(指投入巨资研发)超大模型,零一万物2024年以来的目标,是做小参数、适中的行业模型。 “(零一万物团队中)愿意继续训练超大参数模型的成员,加入了零一万物和阿里云成立的‘产业大模型联合实验室’。”他介绍。

    李开复还表示,除了模型训练策略的调整,零一万物还考虑将游戏、金融等方向的AI业务拆分,进行独立运营和融资。

    “我们是一家商业公司,而非单纯的技术实验室。”李开复似乎已经用零一万物的转型回答了,大模型初创公司难以兼得“月亮”和“六便士”。

    “‘六小龙’的估值增长得非常快,但整体业务的落地收入、用户规模等情况都不太理想。所以投了大模型的投资人在2024年实际上是比较焦虑的。”一位AI领域的投资人在接受《每日经济新闻》记者采访时表示,大模型的商业化路径难题也影响到了投资人的投资心态。

    “在产品上,豆包(的用户体量)现在超出了;在技术上,Deepseek、阿里的通义做得也比‘小龙们’好。”在该投资人看来,面临大厂的挑战时,以“AI六小龙”为代表的大模型创业公司需要一定的“生存战略”,这些创业公司要么有产品上的差异化定位,要么有一个足够的时间窗口“往前跑”。

    在相对有限的资源、时间之下,“取舍”“聚焦”成为了国内多家大模型创业公司在2024年的战略关键词。

    “(2024年)最大的痛苦是不知道要做取舍。当知道了,就不痛苦了。我现在把技术迭代作为我们最重要的目标。”闫俊杰在近期接受媒体采访时表示,如果面对“产品驱动”和“技术驱动”二选一的局面,他会选择后者。

    他举例解释,如果要上线一个算法变化,而这可能会影响用户数据,那他会根据算法趋势来决策,“2023年时还会纠结,2024年基本不纠结了”。

    而这大概率不是Kimi的想法。杨植麟在2024年11月接受《每日经济新闻》记者采访时表示,将提升用户留存视为Kimi眼下最核心的任务,这一点也能从Kimi在C端用户的争夺力度、既有规模体量上看出。

    商业智能数据服务商QuestMobile发布的数据显示,截至2024年12月份,豆包、Kimi、文小言在AI原生App领域的“三强格局”已经形成,月活跃用户规模分别为7523万、2101万和1224万。然而,12月份,豆包与Kimi、文小言的重合用户已分别达到754.1万、409.8万,相比6月份分别上升了5.5%、0.6%。

    从以上数据来看,豆包的持续扩张给Kimi带去了不言而喻的压力。

    “希望更多技术人才可以通过这份技术报告,了解到Kimi在模型训练方面所做的部分工作。如果感兴趣的话,欢迎加入我们,一起登月。”在官方对k1.5的介绍文章中,Kimi把对人才的招揽也放在了显眼的位置。对于技术迭代和用户规模,Kimi似乎不想做选择题,但如果公司打算兼得二者,则要看Kimi在人力物力上的储备还有多少了。

    封面图片来源:视觉中国

    版权声明

    1本文为《每日经济新闻》原创作品。

    2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。

    上一篇

    德联集团:预计2024年净利润同比上升85%—150%

    下一篇

    中投公司:增强主权财富基金核心功能,优化国有金融资本受托管理



    分享成功
    每日经济新闻客户端
    一款点开就不想离开的财经APP 免费下载体验