每日经济新闻

大模型公司都来上影节“抢生意”|对话智象未来联合创始人王科:过去三年我们“隐形”,现在我们会适当走到台前,但节奏仍然克制

2026-06-17 20:11

智象未来作为大模型公司,成立三年多营收迅速增长,在文生图领域超越谷歌,全球排名仅次于OpenAI。公司以To B端业务为主,聚焦多模态生成式AI,首创UiT架构。公司联合创始人兼首席运营官王科在接受每经记者专访时表示,其爆发式增长得益于AI应用浪潮和中国影视文化生态优势。王科认为,大模型终局不会“赢家通吃”,真正的壁垒在于服务生态。

每经记者|丁舟洋  舒冬妮    每经编辑|黄博文    

营收7亿元、亏损超过46亿元、市值超6200亿元……悬殊的数据下,是市场给予“大模型第一股”智谱华章的成长空间,也反映了当前资本对AI(人工智能)大模型的集中看好。

“当风口来了的时候,我们也不要吝惜自己的子弹。”6月中旬,在第28届上海国际电影节上,另一家风头正劲的大模型公司“智象未来”联合创始人兼首席运营官王科在接受《每日经济新闻》记者(以下简称“NBD”)专访时说出这样一句话。这家成立三年多的大模型公司,2025年全年营收过亿元,2026年保持迅猛增长态势。

王科参加“2026影视产业海上论坛” 图片来源:主办方

在6月新鲜出炉的全球第三方文生图评测榜单中,智象未来的商用图像模型(HiDream-O1-Image-1.5)综合评分超越谷歌同类模型,排名位居全球第三,仅次于OpenAI的两款模型。而依托这套全模态架构延伸出的AI视频能力,正是该公司切入商业营销、影视赛道、社媒创作并拉动业务的核心支点。

在如今的国内各大影视节展上,视觉类AI大模型厂商风头正劲:Minimax携手上影节推出AI影视工作坊,快手“可灵”、字节跳动“Seedance”主动奔走对接上下游影视企业。背后的逻辑清晰:在烧钱的大模型研发竞速中,影视赛道正是各家寻求变现、跑通商业闭环的核心抓手。

“图像是通往世界模型、让大模型读懂真实物理世界的关键入口,势必会成为大家技术角逐的核心焦点。”王科认为。

“选B”还是“选C”,创始人也纠结过

6月10日,智象未来的模型在Artificial Analysis(全球知名独立AI模型评测与分析平台)的文生图榜单拿到总榜第三、国内第一的成绩,这代表着中国公司用极少的训练算力,通过全新的UiT架构(统一原生全模态架构)和算法突破,就能达到世界领先水平。用王科的话来说,这是中国大模型公司企业跳出“大力出奇迹”的行业惯性,依靠底层架构迭代走出独有的技术路径。

NBD:智象未来是“硬科技圈”风头正劲的关注对象,仅4月、5月两轮融资合计突破6亿元,为什么你们这家C端用户不熟悉的大模型公司,却备受投资人青睐?

王科:虽然公司成立才三年多,但我们的团队在AI视觉、多模态领域已深耕近二十年。我们的CEO(首席执行官)梅涛院士(加拿大工程院外籍院士)有二十多年经验,是这个领域最权威的科学家之一。UiT架构是我们首创自研的底层架构,也是我们区别于OpenAI、Google、可灵等国内多数视频厂商DiT(扩散模型)路线的核心技术底座,核心目标是适配世界模型,让AI统一理解文字、图片、视频、空间物理信息。这让我们脱离了“大力出奇迹”的路数,通过算法的迭代,用极少的算力资源,实现大模型的突破。我们认为,这是突破当前技术天花板的架构。

其次,在2023年成立之初,我们就聚焦多模态生成式AI。那一年,(大语言模型)ChatGPT横空出世,大家都认为生成式大模型时代已至,我们就有一种强烈的使命感——多模态的“ChatGPT时刻”应该由我们来完成,于是一拍即合,三位创始人迅速搭建团队创业。当时市场的主流关注度是大语言模型,还没有多少人押注多模态,结果到2024年所有人都在说多模态时,我们已经“跑了一年”。

智象未来原生全模态模型架构(UiT) 图片来源:企业供图

NBD:为什么你们在大众领域有些“隐身”?

王科:一个很重要的原因是我们是以To B端业务为主的大模型公司。其实到底选B还是选C,我们几个创始人也讨论过。这个过程中我们尝试过很多,后来回到“第一性原理”:生成式AI是生产力革命,先从供给侧改变,降本增效、提升质量,B端是最直接的价值变现,给客户创造真实价值。而C端本质还是流量生意,利润都被流量平台赚走了,AI目前撬不动流量寡头的商业模式。所以,我们沉淀下来聚焦B端。

C端我们也在做,但不是靠投流,而是靠自然流量,主要目的是获取用户反馈数据来反哺模型迭代。目前,我们有5000万C端用户,他们给的数据比付的钱更重要。未来,当流量平台模式改变后,C端才可能成为主战场。过去三年,我们“隐形”是因为我们选择深耕B端、不炒焦虑、不追热度。现在,随着榜单成绩和业务爆发,我们会适当走到台前,但节奏仍然克制。

图像驱动的全模态模型必将成为竞争的焦点

用“日新月异”甚至都不足以形容当下的大模型竞争格局。厂商一边加码技术研发,一边全力寻找商业化落地窗口。AI短剧、AI影视工具成为大模型公司的兵家必争之地。王科透露,近期一家专业短剧工作室已整体加入智象未来,不是在意其收益,而是想要拆解短剧领域“know-how”(技术诀窍)。

NBD:今年字节跳动的Seedance2.0发布后,AI短剧的大规模生产迅速成为现实,而第一个打出视频类大模型旗号的Sora已悄然退场。对此,你怎么看?

王科:字节有足够的财力、足够的数据、足够的人才密度,它训练了一个基于红果和抖音场景、针对中国社交媒体和短剧生态的大模型Seedance。其最大特点就是把影视导演的一些能力融到模型里面去了。短时间内,我觉得它领先于很多外国视频类模型。

而国外视频类大模型发展的一个标志性事件就是Sora的退场。虽然Sora研发成本高昂,但行业竞争激烈,且其用户多为娱乐创作的普通个人,盈利空间有限。叠加OpenAI的估值居高不下,资本市场对其业务增长要求严苛。因此,当Sora相关业务未能跑出增长后,OpenAI会义无反顾地把它砍掉。

这给我们一个很大的启发——不要贪图炫酷和一时的辉煌,不要想着要把所有光环都集于一身,而是要老老实实把一个行业、一个场景甚至是一个痛点吃透。

NBD:视频类模型赛道接下来的竞争重点是什么?

王科:图像是所有视觉的入口,所以我们叫多模态大模型。在这个领域,中美科技公司“必有一战”。图像最典型的特征是“一图胜千言”。相比文字,图像包含的信息量大得多,也更直观。此外,图像是跨国界的,不存在语言障碍。基于这两点,图像可视为未来世界模型的入口。

这一仗我们正在打。智象未来在文生图模型领域已经超越了Google,下一步要挑战OpenAI。我们认为,图像模型一定会成为视频模型的新起点。未来视频应用,需依托图像模型能力,搭建更强的视频生成模型。最终目标是全模态,即任意模态输入、任意模态输出。

未来,若想抢占制高点,图像驱动的全模态模型必将成为竞争的焦点。我们希望在这次竞争中担当主力,也有信心打赢这场仗。

6月发布的Artificial Analysis文生图榜单,智象未来模型已经超过Google同类模型,排名第三 图片来源:企业供图

当风口来临时,也不要吝惜自己的子弹

创业第四年,主要负责市场的王科每天都非常忙碌,“不是在见客户就是在见客户的路上”。这也是他今年出现在网络视听大会、上影节等影视类行业活动中的原因。他表示,前几年“公司缺资金时”,自己还有很多沮丧时刻,但今年明显感觉“没时间沮丧了”,更多的是兴奋。

现在,他时常思考的是如何迅速把生态搭建起来。“随着业务爆发,我们看到希望,心态是:风来了,不要吝啬子弹,要加大力度获取用户、赋予价值。”

NBD:智象未来的2025年全年收入约1亿元,2026年单季度已超过这个数,爆发式增长的核心引擎是什么?

王科:增长的爆发主要是两个浪潮叠加。第一个浪潮是今年春节前后AI应用“龙虾”的爆发。

第二个多模态的浪潮主要归功于中国影视文化全产业链的生态优势。中国人口众多,短视频普及率全球最高;同时,短剧彻底改变了中国人的文化消费习惯。

当视频模型的效果接近实拍,或者观众无法分辨内容是AI生成还是传统拍摄时,行业界限就被打破了。这个突破始于2025年6月,当时“漫剧”成为爆发点。传统漫剧需要设计师手绘、排版、渲染,逐帧制作,成本极高;而AI通过几个指令搭建工作流,先生图再生视频,或使用首尾帧控制就能完成制作。在盲测中,AI生成的效果与传统方式已难以区分,而前者成本只有后者的五分之一甚至十分之一。

我们公司虽然低调,但也赶上了风口。

NBD:在AI短剧、AI短视频营销领域,你们的市场占有率如何?

王科:市占率不好说,因为市场还在爆发初期。比如红果平台每天大量短剧上线,虽然我们只喝到一口汤,但空间巨大,因为我们会逐渐被市场熟知。AI短视频营销的市场体量是AI短剧的百倍量级。在AI短视频营销领域,我们既服务头部电商平台,也覆盖中小跨境商家与线下实体门店,同时还有软硬件一体化的营销产品。

今年一季度,我们的签约收入已经超过去年全年。我们会尽力保证收入质量的长期可持续,并且在风口来临时也不会吝啬投入,加大力度获取用户,为用户创造更多价值。最终目的是在模型迭代、产品迭代和用户信任三个方面实现长期发展。

大模型的终局不会“赢家通吃”

智象未来的机构股东呈现多元化布局。其中,既有安徽省、合肥市系列国有产业基金长期加注,也汇集东方富海、深创投等一线创投;科大讯飞、京东科技提供技术产业协同,长江电影集团、华策影视等影视企业相继入股,为公司AI影视、短剧业务落地带来内容与渠道资源支撑。战略性融资不断时,盈利问题也备受关注。

NBD:AI研发投入很大,智象未来的盈利路线是什么?何时能够盈利?

王科:赚钱当然要思考,这也是投资人会问我们的问题。如果把研发的投入成本算上,我们目前肯定还是亏损的。但我们愿意持续投入,因为我们有能力、有使命去打这场仗。

NBD:芯片问题仍然是制约中国大模型公司的因素之一吗?

王科:客观来说是的。如果我们缺芯片,训练速度就会慢。

NBD:之前你们提到投入了“超2000亿参数”,这意味着什么?会不会“技术越强、亏得越快”?

王科:首先,“2000亿参数”不是盲目堆算力就能训出来的,参数大了,模型容易崩溃。根据我们掌握的信息,当前市面上能用2000亿参数训练且模型还不崩的只有两家,我们是其中之一。这考验的是算法架构和数据能力。

其次,算力消耗不是随参数线性增长的。我们比较克制,不会为了争“月度榜单第一”而狂烧算力,而是选择“两三个月一个大版本迭代”。

所以,我觉得“技术越强亏得越快”这个论断不成立。技术强不等于烧钱多,它体现在算法架构、数据回流、算力使用效率上。“2000亿”不是客户体验的直接卖点,而是底层能力的支撑。

NBD:有一种观点认为,大模型的终局是“一家通吃”,其他公司只有被收购或合并。你如何看待这一观点?

王科:我不认可。AI本身是技术平权,应该是百花齐放。各家大厂有其自身的基因和路线,Google、OpenAI、字节、阿里、智谱等都在做,谁都没有独门秘技。所以,我觉得“一家通吃”可能性不大,当前也没有看到哪家有这样的能力。唯一值得警惕的是,有的海外公司正试图通过垄断数据来建立壁垒,比如在扫描典籍后销毁原始数据。我觉得,这种做法是对人类的不负责,会受到反噬。真正的壁垒是服务于整个生态,生态起来才是真壁垒。

封面图片来源:主办方

版权声明

1本文为《每日经济新闻》原创作品。

2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。

上一篇

鼎邦科技(871135):公司拟对全资子公司个旧展创有色冶金技术研究中心有限公司现金增资2000万元

下一篇

ST拜特(834596):联睿达供应链服务(深圳)有限公司增持1亿股



分享成功
每日经济新闻客户端
一款点开就不想离开的财经APP 免费下载体验