每日经济新闻

    专访FutureLabs首席专家胡延平:DeepSeek冲击下算力需求反而会增强,智能体将“井喷”,电脑手机端侧模型已数以亿计

    每日经济新闻 2025-02-13 14:51

    近日,中国AI初创公司深度求索(DeepSeek)训练出性能可与海外头部企业模型相媲美的模型,吸引全球目光。该模型降低了算力需求,但FutureLabs未来实验室首席专家胡延平在接受每经记者采访时指出,算力与硬件仍在增强。他同时提到,低成本、高效能的技术创新,促使思考和重估算力基础设施投资,AI应用进入快速导入期。未来,AI将走向内生智能和自主智能。

    每经记者 宋欣悦    每经编辑 兰素英    

    近日,中国AI初创公司深度求索(DeepSeek)用“白菜价”的成本,训练出性能可与海外头部企业OpenAI和谷歌旗下顶尖模型相媲美的模型,成功吸引了全球的目光。

    百度创始人李彦宏在World Governments Summit 2025峰会上称,如今,每12个月,大模型的推理成本就可以降低90%以上。OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)表示,随着AI成本的持续下降,AI将得到更频繁的使用。

    目前,包括华为、荣耀、OPPO、魅族在内的众多国产手机均已官宣接入DeepSeek-R1。此外,吉利、极氪、宝骏等车企也宣布完成与DeepSeek模型的深度融合。

    尽管DeepSeek在提高AI模型效率方面取得了突破,但李彦宏仍然坚持认为,持续投资AI基础设施对于保持竞争力至关重要。奥尔特曼也表示,对AI基础设施进行大规模投资“仍然很重要”。

    DeepSeek有哪些创新点?随着模型训练成本的降低,AI应用开发是否将迎来类似“安卓时刻”的爆发?未来的AI发展又将走向哪些方向?

    胡延平 图片来源:受访者供图

    针对上述疑问,《每日经济新闻》记者(以下简称NBD)专访了FutureLabs未来实验室首席专家胡延平。他认为,Deepseek几乎每一个有所突破的方向都不是首创,但DeepSeek在这几个重要方向都有进一步创新。

    他提到,尽管DeepSeek的模型降低了算力需求,但胡延平强调,算力与硬件不仅没有被削弱,反倒在增强,总体趋势是算力需求依然呈现大幅增长。

    对于DeepSeek及其他低成本、高效能、开源模型带来的影响,胡延平指出,以基座模型为基础,后训练、微调以及与检索增强生成(RAG)、智能体(Agent)等结合的个性化垂类模型及其应用场景,很快将成为一个数量庞大的后市场。

    对于AI的未来发展方向,胡延平认为,通用人工智能(AGI)、超级人工智能(ASI)不是终极目标,也不是根本目的。如果以更长的时间尺度来看,目前的AI,未来将走向内生智能(EI),更远的将来是自主智能(II)。

    DeepSeek冲击下算力需求反而会增强

    NBD:DeepSeek旗下模型因低算力训练和强推理能力引发了热议。从技术上来讲,您认为DeepSeek有哪些创新?

    胡延平:DeepSeek几乎每一个有所突破的方向都不是首创,但DeepSeek在这几个重要方向都有进一步创新。

    一是全球最大体量的开源混合专家模型(MoE),且内置中枢小模型;二是预训练FP8与FP32混合精度,既节约算力又确保了模型的高性能;三是采用结果激励,而不是过程激励的强化学习后训练机制,催生了模型的长思考多步推理能力;四是高效蒸馏技术;五是多头注意力机制;六是多Token预测;七是汇编PTX(并行线程执行),提高算力效率。

    DeepSeek的V3和R1处在大语言模型(LLM)AI 2.0初始周期的一线水平,追平了OpenAI的GPT-4o,具备o1的部分能力。但不及o3系列,且没有多模态能力,也不能进行语音交互等,所以还不算是全球领先水平。

    NBD:您认为DeepSeek低成本、高效能的技术创新,将对英伟达等依赖高端GPU的公司产生怎样的影响?

    胡延平:大语言模型的单位智能的训练和推理成本一直在持续降低,DeepSeek的贡献是这个趋势的一部分,促使思考和重估算力基础设施投资。英伟达股价受到影响,已经有所下调,但是正在到来的多模态、时空智能、面向物理现实世界的模型更吃算力。实质上,包括DeepSeek在内的AI大模型的用户数量正在大幅增长,AI应用进入快速导入期,推理这个部分的算力需求呈现增长。

    算力与硬件不仅没有被削弱,反倒在增强。总体趋势是算力需求依然呈现大幅增长AI赋能导致硬件复兴。具备一定算力和联网能力的智能终端正在成为AI超级入口。

    图片来源:视觉中国

    NBD:随着DeepSeek-V3等低成本大模型的问世,传统的大规模数据中心和高投入大模型训练是否仍然值得继续推进?

    胡延平:AI数据中心(AIDC)建设应需而建,整体上依然在增加。

    AI大模型的发展表现为两条曲线,一条向上,数据资源投入增加、原理进化、从LLM走向基于感知理解的物理现实世界模型,带来更强的智能,是走向AGI、ASI的必由之路。另一条曲线向下,芯片能效比、模型量效比变化等,带来训练和推理的单位智能的产生与使用成本下降。

    但是由于智能水准提升,拥有更强、更好、更多的智能,总体上意味着算力能源等总体消耗上升。AI大模型发展的“双曲线”特征,不仅是AI经济学,也是AI大模型技术产品市场演进的底部规律之一。

    后训练、智能体等后市场将“井喷”

    NBD:目前,DeepSeek-R1在GitHub上的开发者点赞数量已经超过Llama。DeepSeek激发创新竞争之后,您认为AI应用开发是否将迎来类似“安卓时刻”的爆发?

    胡延平:AI大模型不再只来自头部少数几家企业。以基座模型为基础,后训练、微调以及与检索增强生成(RAG)、智能体(Agent)等结合的个性化垂类模型及其应用场景,很快将成为一个数量庞大的后市场。不同开源模型相互结合的变体也会有一堆。之前主要是为数不多的几家头部模型。在后市场,很快会看到产业腰部的出现和长尾的涌现,生态成型,涌现在即。

    NBD:花旗研报认为,DeepSeek和其他中国模型的高效低成本将有助于加速全球AI应用开发,并可能在全球引发更多技术创新,从而推动今年AI应用的拐点。现在,经过R1微调的70亿参数小模型能够在个人笔记本中运行,这是否意味着开发者可以更轻松地进行本地化部署,推动更多创新型应用的诞生?

    胡延平:实际上我就在电脑里安装运行了R1-Distill-Llama-70B,我安装的体量最大的模型是Mistral-123B,只不过速度比较慢。

    开源端侧模型同等体量下的智能水平越来越高,不仅使得各行业和企业更有积极性部署在各自业务场景,也使得个人用户的普遍使用成为可能。实际上,个人手机、电脑里的端侧模型已经数以亿计。这些模型赋能各类应用,生发出极有活力的创新场景。

    图片来源:视觉中国-VCG41N1472123004

    AI的下一站:内生智能,现实、感知会越来越重要

    NBD:在您看来,未来的AI发展将走向哪些方向?

    胡延平:从2020~2050年,如果以更长的时间尺度来看,目前的AI,未来将走向内生智能(EI),更远的将来是自主智能(II)。AI学习知识、AI开始思考、AI睁开眼睛和AI感知世界,是AI发展的四进阶。AI的生成能力、工作能力和行为能力将基于以上四个方面进化。现实、感知会变得越来越重要

    通用人工智能(AGI)、超级人工智能(ASI)不是终极目标,也不是根本目的。模型完成新任务的能力,Agent完整执行工作流的能力,智能体内生自主的理解现实的行为能力,是智能进化所追求的方向。提升智能本身的水准,发展脑能力,始终是智能发展到第一性原理。原理意味着原力,原力领域会有真正的创新。

    NBD:您刚才提到大模型发展的“双曲线”理论,向上是追求通用智能,向下是优化算力和效率。您认为AI进化中的“向下曲线”和“向上曲线”各自面临哪些挑战?

    胡延平:向下的曲线是有下限的,曲线向下的走势主要取决于这两方面的变化,芯片算力的能效比、模型的量效比。而推动向上的曲线,有赖于模型新原理探索、芯片算力的摩尔定律、模型训练的规模法则(Scaling Law)以及感知智能的到来。

    智能汽车等从自动驾驶走向场景智能,机器人等具身智能领域,可能更加会促使视觉理解走向现实、感知智能,比LLM这条线一路走来的AIGC派更可能激发时空智能,催生出未来的物理世界模型。

    版权声明

    1本文为《每日经济新闻》原创作品。

    2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。

    上一篇

    港股医药外包概念股震荡下跌,维亚生物、方达控股均跌近6%

    下一篇

    半导体板块震荡走弱 乐鑫科技跌超11%



    分享成功
    每日经济新闻客户端
    一款点开就不想离开的财经APP 免费下载体验