Deepseek、Kimi争相对标“o1”，初创公司能打破“技术”和“用户”二选一魔咒吗？

春节将至，国内大模型创业公司集体“凑热闹”，发布了多个对标OpenAI o1的新模型。

发布密集程度从1月20日Deepseek和Kimi的“前脚后脚”中可见一斑，在Deepseek发布新模型DeepSeek-R1后的两小时内，Kimi推出了k1.5多模态思考模型。

图片来源：微信截图

据Kimi官方介绍，新模型在数学、代码、多模态推理能力等方面全面对标“Open AI满血版o1”，这也是Open AI之外的公司首次达到o1正式版水准的多模态推理性能。

“Kimi探索的是C端场景，它探索了一个不同于Deepseek V3的基座模型方案，通过进行长模型和短模型的权重合并，以及短模型的特化RL（意为强化学习），最大化保留了类o1模型的能力。”一位国内头部大模型的算法工程师在20日接受《每日经济新闻》记者采访时表示。

大模型是需要“重仓”投入人才、资金甚至耐心的领域，因此相对于互联网大厂而言，以“AI六小龙”为代表的大模型创业公司面临着更多艰难的选择题。

“创业公司就得做取舍。”在近期的一次采访中，MiniMax创始人闫俊杰认为用户数等指标并非AI竞争的核心，他把技术迭代作为最重要的目标。而Kimi创始人杨植麟在2024年11月接受《每日经济新闻》记者采访时表示，将提升用户留存视为Kimi眼下最核心的任务。

或许正因如此，2024年下半年公众讨论Kimi时多谈及其C端用户体量优势，而Deepseek却以鲶鱼之姿成为了国内大模型的技术焦点。如今，Kimi推出了k1.5，Deepseek也在本月上线了自有App，大模型初创公司在技术和用户上能做好两手抓吗？

集体对标o1，Deepseek、Kimi相继推出新模型

1月20日晚，Deepseek发布了DeepSeek-R1，并同步开源模型权重。据官方介绍，DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1正式版。

官方披露，DeepSeek-R1 API（应用程序编程接口）服务定价为每百万输入Tokens1元（缓存命中）/4元（缓存未命中），每百万输出Tokens16元。（注：Tokens指文本被分割成的基本单位）

随后，Kimi也在当晚推出了全新的k1.5多模态思考模型。官方介绍称，从基准测试成绩看，k1.5多模态思考模型实现了SOTA（意为特定时间背景下的最高水平）级别的多模态推理和通用推理能力。

一位国内头部大模型的算法工程师向《每日经济新闻》记者表示：“Kimi探索了一条不同于Deepseek V3的基座模型方案，通过进行长模型和短模型的权重合并，以及短模型的特化RL，最大化保留了类o1模型的能力。”

从表现数据来看，在短链思考（short-CoT）模式下，Kimi k1.5的数学、代码、视觉多模态和通用能力，均超越了全球范围内短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平；在长链思考（long-CoT）模式下，Kimi k1.5的数学、代码、多模态推理能力，也达到长思考SOTA模型OpenAI o1正式版的水平。

此外，字节跳动旗下的豆包于1月20日推出了实时语音大模型；“AI六小龙”之一的阶跃星辰也在同天上线了Step-2系列语言模型的两款新品，即参数量小、性价比更高的Step-2 mini以及针对内容创作领域推出的“Step文学大师版”。不难看出，作为当下最为炙手可热的行业，大模型领域的技术竞赛日趋激烈。

技术和用户，初创公司必须取舍吗？

玩家们仍在同一田径场内竞争，但起跑线和赛道已经不同。2025年刚刚开始，国内“AI六小龙”和互联网大厂等有代表性的大模型选手就在战略方向、侧重点上出现了分野。

1月7日，大模型创业公司零一万物CEO李开复回应媒体称，只有大厂能够“烧”（指投入巨资研发）超大模型，零一万物2024年以来的目标，是做小参数、适中的行业模型。 “（零一万物团队中）愿意继续训练超大参数模型的成员，加入了零一万物和阿里云成立的‘产业大模型联合实验室’。”他介绍。

李开复还表示，除了模型训练策略的调整，零一万物还考虑将游戏、金融等方向的AI业务拆分，进行独立运营和融资。

“我们是一家商业公司，而非单纯的技术实验室。”李开复似乎已经用零一万物的转型回答了，大模型初创公司难以兼得“月亮”和“六便士”。

“‘六小龙’的估值增长得非常快，但整体业务的落地收入、用户规模等情况都不太理想。所以投了大模型的投资人在2024年实际上是比较焦虑的。”一位AI领域的投资人在接受《每日经济新闻》记者采访时表示，大模型的商业化路径难题也影响到了投资人的投资心态。

“在产品上，豆包（的用户体量）现在超出了；在技术上，Deepseek、阿里的通义做得也比‘小龙们’好。”在该投资人看来，面临大厂的挑战时，以“AI六小龙”为代表的大模型创业公司需要一定的“生存战略”，这些创业公司要么有产品上的差异化定位，要么有一个足够的时间窗口“往前跑”。

在相对有限的资源、时间之下，“取舍”“聚焦”成为了国内多家大模型创业公司在2024年的战略关键词。

“（2024年）最大的痛苦是不知道要做取舍。当知道了，就不痛苦了。我现在把技术迭代作为我们最重要的目标。”闫俊杰在近期接受媒体采访时表示，如果面对“产品驱动”和“技术驱动”二选一的局面，他会选择后者。

他举例解释，如果要上线一个算法变化，而这可能会影响用户数据，那他会根据算法趋势来决策，“2023年时还会纠结，2024年基本不纠结了”。

而这大概率不是Kimi的想法。杨植麟在2024年11月接受《每日经济新闻》记者采访时表示，将提升用户留存视为Kimi眼下最核心的任务，这一点也能从Kimi在C端用户的争夺力度、既有规模体量上看出。

商业智能数据服务商QuestMobile发布的数据显示，截至2024年12月份，豆包、Kimi、文小言在AI原生App领域的“三强格局”已经形成，月活跃用户规模分别为7523万、2101万和1224万。然而，12月份，豆包与Kimi、文小言的重合用户已分别达到754.1万、409.8万，相比6月份分别上升了5.5%、0.6%。

从以上数据来看，豆包的持续扩张给Kimi带去了不言而喻的压力。

“希望更多技术人才可以通过这份技术报告，了解到Kimi在模型训练方面所做的部分工作。如果感兴趣的话，欢迎加入我们，一起登月。”在官方对k1.5的介绍文章中，Kimi把对人才的招揽也放在了显眼的位置。对于技术迭代和用户规模，Kimi似乎不想做选择题，但如果公司打算兼得二者，则要看Kimi在人力物力上的储备还有多少了。

封面图片来源：视觉中国

春节将至，国内大模型创业公司集体“凑热闹”，发布了多个对标OpenAI o1的新模型。发布密集程度从1月20日Deepseek和Kimi的“前脚后脚”中可见一斑，在Deepseek发布新模型DeepSeek-R1后的两小时内，Kimi推出了k1.5多模态思考模型。图片来源：微信截图据Kimi官方介绍，新模型在数学、代码、多模态推理能力等方面全面对标“Open AI满血版o1”，这也是Open AI之外的公司首次达到o1正式版水准的多模态推理性能。 “Kimi探索的是C端场景，它探索了一个不同于Deepseek V3的基座模型方案，通过进行长模型和短模型的权重合并，以及短模型的特化RL（意为强化学习），最大化保留了类o1模型的能力。”一位国内头部大模型的算法工程师在20日接受《每日经济新闻》记者采访时表示。大模型是需要“重仓”投入人才、资金甚至耐心的领域，因此相对于互联网大厂而言，以“AI六小龙”为代表的大模型创业公司面临着更多艰难的选择题。 “创业公司就得做取舍。”在近期的一次采访中，MiniMax创始人闫俊杰认为用户数等指标并非AI竞争的核心，他把技术迭代作为最重要的目标。而Kimi创始人杨植麟在2024年11月接受《每日经济新闻》记者采访时表示，将提升用户留存视为Kimi眼下最核心的任务。或许正因如此，2024年下半年公众讨论Kimi时多谈及其C端用户体量优势，而Deepseek却以鲶鱼之姿成为了国内大模型的技术焦点。如今，Kimi推出了k1.5，Deepseek也在本月上线了自有App，大模型初创公司在技术和用户上能做好两手抓吗？集体对标o1，Deepseek、Kimi相继推出新模型 1月20日晚，Deepseek发布了DeepSeek-R1，并同步开源模型权重。据官方介绍，DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1正式版。官方披露，DeepSeek-R1 API（应用程序编程接口）服务定价为每百万输入Tokens1元（缓存命中）/4元（缓存未命中），每百万输出Tokens16元。（注：Tokens指文本被分割成的基本单位）随后，Kimi也在当晚推出了全新的k1.5多模态思考模型。官方介绍称，从基准测试成绩看，k1.5多模态思考模型实现了SOTA（意为特定时间背景下的最高水平）级别的多模态推理和通用推理能力。一位国内头部大模型的算法工程师向《每日经济新闻》记者表示：“Kimi探索了一条不同于Deepseek V3的基座模型方案，通过进行长模型和短模型的权重合并，以及短模型的特化RL，最大化保留了类o1模型的能力。” 从表现数据来看，在短链思考（short-CoT）模式下，Kimi k1.5的数学、代码、视觉多模态和通用能力，均超越了全球范围内短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平；在长链思考（long-CoT）模式下，Kimi k1.5的数学、代码、多模态推理能力，也达到长思考SOTA模型OpenAI o1正式版的水平。此外，字节跳动旗下的豆包于1月20日推出了实时语音大模型；“AI六小龙”之一的阶跃星辰也在同天上线了Step-2系列语言模型的两款新品，即参数量小、性价比更高的Step-2 mini以及针对内容创作领域推出的“Step文学大师版”。不难看出，作为当下最为炙手可热的行业，大模型领域的技术竞赛日趋激烈。技术和用户，初创公司必须取舍吗？玩家们仍在同一田径场内竞争，但起跑线和赛道已经不同。2025年刚刚开始，国内“AI六小龙”和互联网大厂等有代表性的大模型选手就在战略方向、侧重点上出现了分野。 1月7日，大模型创业公司零一万物CEO李开复回应媒体称，只有大厂能够“烧”（指投入巨资研发）超大模型，零一万物2024年以来的目标，是做小参数、适中的行业模型。 “（零一万物团队中）愿意继续训练超大参数模型的成员，加入了零一万物和阿里云成立的‘产业大模型联合实验室’。”他介绍。李开复还表示，除了模型训练策略的调整，零一万物还考虑将游戏、金融等方向的AI业务拆分，进行独立运营和融资。 “我们是一家商业公司，而非单纯的技术实验室。”李开复似乎已经用零一万物的转型回答了，大模型初创公司难以兼得“月亮”和“六便士”。 “‘六小龙’的估值增长得非常快，但整体业务的落地收入、用户规模等情况都不太理想。所以投了大模型的投资人在2024年实际上是比较焦虑的。”一位AI领域的投资人在接受《每日经济新闻》记者采访时表示，大模型的商业化路径难题也影响到了投资人的投资心态。 “在产品上，豆包（的用户体量）现在超出了；在技术上，Deepseek、阿里的通义做得也比‘小龙们’好。”在该投资人看来，面临大厂的挑战时，以“AI六小龙”为代表的大模型创业公司需要一定的“生存战略”，这些创业公司要么有产品上的差异化定位，要么有一个足够的时间窗口“往前跑”。在相对有限的资源、时间之下，“取舍”“聚焦”成为了国内多家大模型创业公司在2024年的战略关键词。 “（2024年）最大的痛苦是不知道要做取舍。当知道了，就不痛苦了。我现在把技术迭代作为我们最重要的目标。”闫俊杰在近期接受媒体采访时表示，如果面对“产品驱动”和“技术驱动”二选一的局面，他会选择后者。他举例解释，如果要上线一个算法变化，而这可能会影响用户数据，那他会根据算法趋势来决策，“2023年时还会纠结，2024年基本不纠结了”。而这大概率不是Kimi的想法。杨植麟在2024年11月接受《每日经济新闻》记者采访时表示，将提升用户留存视为Kimi眼下最核心的任务，这一点也能从Kimi在C端用户的争夺力度、既有规模体量上看出。商业智能数据服务商QuestMobile发布的数据显示，截至2024年12月份，豆包、Kimi、文小言在AI原生App领域的“三强格局”已经形成，月活跃用户规模分别为7523万、2101万和1224万。然而，12月份，豆包与Kimi、文小言的重合用户已分别达到754.1万、409.8万，相比6月份分别上升了5.5%、0.6%。从以上数据来看，豆包的持续扩张给Kimi带去了不言而喻的压力。 “希望更多技术人才可以通过这份技术报告，了解到Kimi在模型训练方面所做的部分工作。如果感兴趣的话，欢迎加入我们，一起登月。”在官方对k1.5的介绍文章中，Kimi把对人才的招揽也放在了显眼的位置。对于技术迭代和用户规模，Kimi似乎不想做选择题，但如果公司打算兼得二者，则要看Kimi在人力物力上的储备还有多少了。

Deepseek、Kimi争相对标“o1”，初创公司能打破“技术”和“用户”二选一魔咒吗？

集体对标o1，Deepseek、Kimi相继推出新模型

技术和用户，初创公司必须取舍吗？

关联专题

版权声明