2月6日,据外媒报道,李飞飞等研究人员用不到50美元和16张英伟达H100GPU,耗时26分钟训练出s1-32B人工智能推理模型。据外界分析,该模型基于预训练模型微调,成本未涵盖前期“烧钱”部分,且只在特定测试集上超过o1-preview,未超过“满血版”o1和DeepSeek-R1。在“白菜价”的背后,李飞飞团队重点研究了如何以简单方式实现“测试时拓展”,即模型在推理时多次迭代优化结果,还构建了高质量数据集s1K,降低了训练成本。
今日凌晨3点,OpenAI宣布向所有用户开放ChatGPT搜索功能,无需注册。该搜索能更快抓取网络信息,可解读用户搜索想法并提供源地址。同时,OpenAI加大研发布局人形机器人,上周五提交人形机器人商标申请,去年11月重建机器人团队。此外,OpenAI还投资了挪威机器人初创公司1XTechnologies,与FigureAI终止合作。
2月5日,A股三大股指收盘涨跌不一,DeepSeek概念掀涨停潮。多家平台宣布上线DeepSeek大模型,如中国联通、京东云、华为计算、安恒信息、腾讯云、百度智能云、阿里云等。DeepSeek以中国技术团队和本土算力资源引领全球技术创新,有望推动AI应用和终端技术普及,加速AGI时代到来。国海证券认为其突破提振了全球AI工作者信心,激发了创新活力。
2月5日,FigureAI宣布因已取得“重大突破”,将终止与OpenAI合作,专注内部人工智能研发。这离FigureAI宣布双方的合作关系不到一年时间。FigureAI称,终止合作是因OpenAI的关注重点不在嵌入式人工智能。另外,据外界推断,OpenAI或已自研硬件。受此消息刺激,节后首个交易日,A股机器人执行器板块大幅上涨。预计到2030年,中美人形机器人市场需求将达约203万台,市场空间约3185亿元。
2月以来,多个平台宣布与DeepSeek大模型合作。其中,潞晨科技联合华为发布推理API及云镜像服务;安恒信息集成DeepSeek完成安全大模型训练;腾讯云推出“开发者大礼包”;百度智能云上架DeepSeek模型并限时免费;阿里云支持一键部署DeepSeek模型。此外,1月31日,英伟达、亚马逊和微软也宣布接入该模型。
春节假期期间,DeepSeek概念股节前走强,多家券商发布相关研报并举办路演会议。美国OpenAI首席执行官奥特曼表示,公司没有计划起诉DeepSeek。DeepSeek以低成本、高性能优势引发市场波动,或推动投资者重新评估中国科技企业在AI赛道的技术潜力。节前20%涨停的A股公司每日互动发布异动公告称,未持有DeepSeek股权,也尚未向其提供语料数据。
当地时间2月2日,OpenAI在其官网上发布了一款名为“深层研究”(deepresearch)的新功能。该功能旨在利用推理综合大量线上信息,帮助用户完成多步骤研究任务。首席产品官KevinWeil表示,这项功能可以在数十分钟内完成人类需花费数小时乃至数天的任务。用户只需给出提示,ChatGPT就能查找、分析并综合数百个在线资源,生成简明报告。
2月3日,百度智能云称其千帆平台已上架DeepSeek-R1和DeepSeek-V3模型,推出超低价格方案并限时免费,该模型由杭州深度求索自研。同样在2月3日,阿里云宣布其PAIModelGallery支持云上一键部署。1月31日,英伟达、亚马逊和微软宣布接入DeepSeek-R1。该模型被公认为是目前最先进的大语言模型之一。
2月2日,腾讯云宣布DeepSeek-R1大模型一键部署至腾讯云HAI上,开发者3分钟就能接入调用。此前,DeepSeek-R1开源后引发全球关注,华为云昇腾云服务也支持部署该模型。DeepSeek成立于2023年7月,其最新开源模型DeepSeek-R1成本低、性能优,破解了“堆算力”路径依赖,影响波及资本市场。
当地时间1月31日,OpenAI正式推出全新推理模型o3-mini,并首次向免费用户开放。这一成本效益最高的模型现已在ChatGPT和API中上线。OpenAI首席执行官SamAltman携高管在Reddit上回应网友问题,承认过去在开源方面存在不足,并表示将考虑新的开源策略。
当地时间1月31日,OpenAI正式推出全新推理模型o3-mini,并首次向免费用户开放。测试显示,在美国数学邀请赛(AIME2024)中,o3-mini的准确率随推理努力提升,最高可达87.3%,速率也显著优于前代o1-mini。在编程竞赛及通用知识评测中,o3-mini表现优异,响应速度比o1-mini快24%。
美东时间1月27日,DeepSeek引发AI概念股大跌,欧美科技股市值蒸发1.2万亿美元。其中,英伟达市值一个交易日蒸发5926.58亿美元。英伟达(中国)表示,DeepSeek是卓越的人工智能进展,展示了如何运用该技术创建新模型。DeepSeek对美国科技股的“暴击”,是否意味着以巨额资本支出为基础的美国AI叙事破灭?多家投行发布研报展开激辩。Jefferies认为,DeepSeek的成功或推动两种行业战略。科技股“大多头”Wedbush分析师则认为,DeepSeek的威胁微乎其微,是买入科技股的黄金机会。
DeepSeek的热度还在持续。《每日经济新闻》记者对DeepSeek-R1与四款主流推理模型进行了对比测试,结果显示其在基础题上意外“翻车”,高难度问题上却表现出色,甚至在速度上打败了OpenAI的o1模型。DeepSeek旗下模型极低的训练成本或许预示着AI大模型对算力投入的需求将大幅下降。AI预训练时代或将终结。多家券商研报也指出算力需求将向推理侧倾斜。
1月27日,DeepSeek应用登顶美区和中国区应用商店免费榜。其爆火原因主要为性能和成本,成本低且性能卓越,吸引大量用户。该模型代码和训练方法完全开源,成为开源社区下载量最高的大模型。DeepSeek成立于2023年5月,背后是幻方量化,创始人梁文锋是一位80后技术理想主义者。
DeepSeek的热度才刚刚开始,海外媒体和评论员都不约而同地把DeepSeek称之为“美国股市最大的威胁”。网络社群里,越来越多的人把DeepSeek与近期英伟达股价的回调联系在一起。有分析称,DeepSeek-V3模型的突破显著降低了AI训练成本,使AMDGPU成为比英伟达更具有成本效益的替代品,增强了AMD的市场地位。
1月20日,中国AI初创公司深度求索开源R1推理模型,其在多项测试中表现出色,引发外媒集体刷屏,为硅谷敲响警钟。此前,DeepSeek-V3已开源。两款模型成本低廉,性能与OpenAI相当,让硅谷震惊。Meta内部因DeepSeek的模型进入恐慌模式,试图复制。AI大佬惊叹,中国AI已追上美国,或彻底改变游戏规则。