大模型公司都来上影节“抢生意”｜对话智象未来联合创始人王科：过去三年我们“隐形”，现在我们会适当走到台前，但节奏仍然克制

营收7亿元、亏损超过46亿元、市值超6200亿元……悬殊的数据下，是市场给予“大模型第一股”智谱华章的成长空间，也反映了当前资本对AI（人工智能）大模型的集中看好。

“当风口来了的时候，我们也不要吝惜自己的子弹。”6月中旬，在第28届上海国际电影节上，另一家风头正劲的大模型公司“智象未来”联合创始人兼首席运营官王科在接受《每日经济新闻》记者（以下简称“NBD”）专访时说出这样一句话。这家成立三年多的大模型公司，2025年全年营收过亿元，2026年保持迅猛增长态势。

王科参加“2026影视产业海上论坛” 图片来源：主办方

在6月新鲜出炉的全球第三方文生图评测榜单中，智象未来的商用图像模型（HiDream-O1-Image-1.5）综合评分超越谷歌同类模型，排名位居全球第三，仅次于OpenAI的两款模型。而依托这套全模态架构延伸出的AI视频能力，正是该公司切入商业营销、影视赛道、社媒创作并拉动业务的核心支点。

在如今的国内各大影视节展上，视觉类AI大模型厂商风头正劲：Minimax携手上影节推出AI影视工作坊，快手“可灵”、字节跳动“Seedance”主动奔走对接上下游影视企业。背后的逻辑清晰：在烧钱的大模型研发竞速中，影视赛道正是各家寻求变现、跑通商业闭环的核心抓手。

“图像是通往世界模型、让大模型读懂真实物理世界的关键入口，势必会成为大家技术角逐的核心焦点。”王科认为。

“选B”还是“选C”，创始人也纠结过

6月10日，智象未来的模型在Artificial Analysis（全球知名独立AI模型评测与分析平台）的文生图榜单拿到总榜第三、国内第一的成绩，这代表着中国公司用极少的训练算力，通过全新的UiT架构（统一原生全模态架构）和算法突破，就能达到世界领先水平。用王科的话来说，这是中国大模型公司企业跳出“大力出奇迹”的行业惯性，依靠底层架构迭代走出独有的技术路径。

NBD：智象未来是“硬科技圈”风头正劲的关注对象，仅4月、5月两轮融资合计突破6亿元，为什么你们这家C端用户不熟悉的大模型公司，却备受投资人青睐？

王科：虽然公司成立才三年多，但我们的团队在AI视觉、多模态领域已深耕近二十年。我们的CEO（首席执行官）梅涛院士（加拿大工程院外籍院士）有二十多年经验，是这个领域最权威的科学家之一。UiT架构是我们首创自研的底层架构，也是我们区别于OpenAI、Google、可灵等国内多数视频厂商DiT（扩散模型）路线的核心技术底座，核心目标是适配世界模型，让AI统一理解文字、图片、视频、空间物理信息。这让我们脱离了“大力出奇迹”的路数，通过算法的迭代，用极少的算力资源，实现大模型的突破。我们认为，这是突破当前技术天花板的架构。

其次，在2023年成立之初，我们就聚焦多模态生成式AI。那一年，（大语言模型）ChatGPT横空出世，大家都认为生成式大模型时代已至，我们就有一种强烈的使命感——多模态的“ChatGPT时刻”应该由我们来完成，于是一拍即合，三位创始人迅速搭建团队创业。当时市场的主流关注度是大语言模型，还没有多少人押注多模态，结果到2024年所有人都在说多模态时，我们已经“跑了一年”。

智象未来原生全模态模型架构(UiT) 图片来源：企业供图

NBD：为什么你们在大众领域有些“隐身”？

王科：一个很重要的原因是我们是以To B端业务为主的大模型公司。其实到底选B还是选C，我们几个创始人也讨论过。这个过程中我们尝试过很多，后来回到“第一性原理”：生成式AI是生产力革命，先从供给侧改变，降本增效、提升质量，B端是最直接的价值变现，给客户创造真实价值。而C端本质还是流量生意，利润都被流量平台赚走了，AI目前撬不动流量寡头的商业模式。所以，我们沉淀下来聚焦B端。

C端我们也在做，但不是靠投流，而是靠自然流量，主要目的是获取用户反馈数据来反哺模型迭代。目前，我们有5000万C端用户，他们给的数据比付的钱更重要。未来，当流量平台模式改变后，C端才可能成为主战场。过去三年，我们“隐形”是因为我们选择深耕B端、不炒焦虑、不追热度。现在，随着榜单成绩和业务爆发，我们会适当走到台前，但节奏仍然克制。

图像驱动的全模态模型必将成为竞争的焦点

用“日新月异”甚至都不足以形容当下的大模型竞争格局。厂商一边加码技术研发，一边全力寻找商业化落地窗口。AI短剧、AI影视工具成为大模型公司的兵家必争之地。王科透露，近期一家专业短剧工作室已整体加入智象未来，不是在意其收益，而是想要拆解短剧领域“know-how”（技术诀窍）。

NBD：今年字节跳动的Seedance2.0发布后，AI短剧的大规模生产迅速成为现实，而第一个打出视频类大模型旗号的Sora已悄然退场。对此，你怎么看？

王科：字节有足够的财力、足够的数据、足够的人才密度，它训练了一个基于红果和抖音场景、针对中国社交媒体和短剧生态的大模型Seedance。其最大特点就是把影视导演的一些能力融到模型里面去了。短时间内，我觉得它领先于很多外国视频类模型。

而国外视频类大模型发展的一个标志性事件就是Sora的退场。虽然Sora研发成本高昂，但行业竞争激烈，且其用户多为娱乐创作的普通个人，盈利空间有限。叠加OpenAI的估值居高不下，资本市场对其业务增长要求严苛。因此，当Sora相关业务未能跑出增长后，OpenAI会义无反顾地把它砍掉。

这给我们一个很大的启发——不要贪图炫酷和一时的辉煌，不要想着要把所有光环都集于一身，而是要老老实实把一个行业、一个场景甚至是一个痛点吃透。

NBD：视频类模型赛道接下来的竞争重点是什么？

王科：图像是所有视觉的入口，所以我们叫多模态大模型。在这个领域，中美科技公司“必有一战”。图像最典型的特征是“一图胜千言”。相比文字，图像包含的信息量大得多，也更直观。此外，图像是跨国界的，不存在语言障碍。基于这两点，图像可视为未来世界模型的入口。

这一仗我们正在打。智象未来在文生图模型领域已经超越了Google，下一步要挑战OpenAI。我们认为，图像模型一定会成为视频模型的新起点。未来视频应用，需依托图像模型能力，搭建更强的视频生成模型。最终目标是全模态，即任意模态输入、任意模态输出。

未来，若想抢占制高点，图像驱动的全模态模型必将成为竞争的焦点。我们希望在这次竞争中担当主力，也有信心打赢这场仗。

6月发布的Artificial Analysis文生图榜单，智象未来模型已经超过Google同类模型，排名第三图片来源：企业供图

当风口来临时，也不要吝惜自己的子弹

创业第四年，主要负责市场的王科每天都非常忙碌，“不是在见客户就是在见客户的路上”。这也是他今年出现在网络视听大会、上影节等影视类行业活动中的原因。他表示，前几年“公司缺资金时”，自己还有很多沮丧时刻，但今年明显感觉“没时间沮丧了”，更多的是兴奋。

现在，他时常思考的是如何迅速把生态搭建起来。“随着业务爆发，我们看到希望，心态是：风来了，不要吝啬子弹，要加大力度获取用户、赋予价值。”

NBD：智象未来的2025年全年收入约1亿元，2026年单季度已超过这个数，爆发式增长的核心引擎是什么？

王科：增长的爆发主要是两个浪潮叠加。第一个浪潮是今年春节前后AI应用“龙虾”的爆发。

第二个多模态的浪潮主要归功于中国影视文化全产业链的生态优势。中国人口众多，短视频普及率全球最高；同时，短剧彻底改变了中国人的文化消费习惯。

当视频模型的效果接近实拍，或者观众无法分辨内容是AI生成还是传统拍摄时，行业界限就被打破了。这个突破始于2025年6月，当时“漫剧”成为爆发点。传统漫剧需要设计师手绘、排版、渲染，逐帧制作，成本极高；而AI通过几个指令搭建工作流，先生图再生视频，或使用首尾帧控制就能完成制作。在盲测中，AI生成的效果与传统方式已难以区分，而前者成本只有后者的五分之一甚至十分之一。

我们公司虽然低调，但也赶上了风口。

NBD：在AI短剧、AI短视频营销领域，你们的市场占有率如何？

王科：市占率不好说，因为市场还在爆发初期。比如红果平台每天大量短剧上线，虽然我们只喝到一口汤，但空间巨大，因为我们会逐渐被市场熟知。AI短视频营销的市场体量是AI短剧的百倍量级。在AI短视频营销领域，我们既服务头部电商平台，也覆盖中小跨境商家与线下实体门店，同时还有软硬件一体化的营销产品。

今年一季度，我们的签约收入已经超过去年全年。我们会尽力保证收入质量的长期可持续，并且在风口来临时也不会吝啬投入，加大力度获取用户，为用户创造更多价值。最终目的是在模型迭代、产品迭代和用户信任三个方面实现长期发展。

大模型的终局不会“赢家通吃”

智象未来的机构股东呈现多元化布局。其中，既有安徽省、合肥市系列国有产业基金长期加注，也汇集东方富海、深创投等一线创投；科大讯飞、京东科技提供技术产业协同，长江电影集团、华策影视等影视企业相继入股，为公司AI影视、短剧业务落地带来内容与渠道资源支撑。战略性融资不断时，盈利问题也备受关注。

NBD：AI研发投入很大，智象未来的盈利路线是什么？何时能够盈利？

王科：赚钱当然要思考，这也是投资人会问我们的问题。如果把研发的投入成本算上，我们目前肯定还是亏损的。但我们愿意持续投入，因为我们有能力、有使命去打这场仗。

NBD：芯片问题仍然是制约中国大模型公司的因素之一吗？

王科：客观来说是的。如果我们缺芯片，训练速度就会慢。

NBD：之前你们提到投入了“超2000亿参数”，这意味着什么？会不会“技术越强、亏得越快”？

王科：首先，“2000亿参数”不是盲目堆算力就能训出来的，参数大了，模型容易崩溃。根据我们掌握的信息，当前市面上能用2000亿参数训练且模型还不崩的只有两家，我们是其中之一。这考验的是算法架构和数据能力。

其次，算力消耗不是随参数线性增长的。我们比较克制，不会为了争“月度榜单第一”而狂烧算力，而是选择“两三个月一个大版本迭代”。

所以，我觉得“技术越强亏得越快”这个论断不成立。技术强不等于烧钱多，它体现在算法架构、数据回流、算力使用效率上。“2000亿”不是客户体验的直接卖点，而是底层能力的支撑。

NBD：有一种观点认为，大模型的终局是“一家通吃”，其他公司只有被收购或合并。你如何看待这一观点？

王科：我不认可。AI本身是技术平权，应该是百花齐放。各家大厂有其自身的基因和路线，Google、OpenAI、字节、阿里、智谱等都在做，谁都没有独门秘技。所以，我觉得“一家通吃”可能性不大，当前也没有看到哪家有这样的能力。唯一值得警惕的是，有的海外公司正试图通过垄断数据来建立壁垒，比如在扫描典籍后销毁原始数据。我觉得，这种做法是对人类的不负责，会受到反噬。真正的壁垒是服务于整个生态，生态起来才是真壁垒。

封面图片来源：主办方

大模型公司都来上影节“抢生意”｜对话智象未来联合创始人王科：过去三年我们“隐形”，现在我们会适当走到台前，但节奏仍然克制

“选B”还是“选C”，创始人也纠结过

图像驱动的全模态模型必将成为竞争的焦点

当风口来临时，也不要吝惜自己的子弹

大模型的终局不会“赢家通吃”

关联专题

版权声明