1月27日,DeepSeek应用登顶美区和中国区应用商店免费榜。其爆火原因主要为性能和成本,成本低且性能卓越,吸引大量用户。该模型代码和训练方法完全开源,成为开源社区下载量最高的大模型。DeepSeek成立于2023年5月,背后是幻方量化,创始人梁文锋是一位80后技术理想主义者。
DeepSeek的热度才刚刚开始,海外媒体和评论员都不约而同地把DeepSeek称之为“美国股市最大的威胁”。网络社群里,越来越多的人把DeepSeek与近期英伟达股价的回调联系在一起。有分析称,DeepSeek-V3模型的突破显著降低了AI训练成本,使AMDGPU成为比英伟达更具有成本效益的替代品,增强了AMD的市场地位。
1月20日,中国AI初创公司深度求索开源R1推理模型,其在多项测试中表现出色,引发外媒集体刷屏,为硅谷敲响警钟。此前,DeepSeek-V3已开源。两款模型成本低廉,性能与OpenAI相当,让硅谷震惊。Meta内部因DeepSeek的模型进入恐慌模式,试图复制。AI大佬惊叹,中国AI已追上美国,或彻底改变游戏规则。
1月23日,OpenAI通过直播发布了其首款AI代理工具Operator。这款工具能够像人类一样操作网页浏览器,在有限监督下完成用户交代的任务,被视为AI生产力的里程碑。作为OpenAI通往通用人工智能的第三步,Operator基于CUA模型,结合GPT-4的视觉能力和高级推理功能,可执行如预订餐厅、网购等任务。
在世界经济论坛2025年年会期间,Anthropic首席执行官达里奥·阿莫代伊接受外媒采访时警告称,AI在未来2~3年将在几乎所有任务上超越人类,但残酷的是,人类目前还没有完善的应对之策。作为OpenAI的强劲对手,Anthropic也获得了一众投资者的青睐。除谷歌追加的超10亿美元投资外,Anthropic预计还将获得20亿美元的硅谷风投融资。此轮融资完成后,Anthropic的估值或将增至约600亿美元,是之前估值的三倍。
当地时间1月21日,美国总统特朗普宣布,OpenAI、软银、甲骨文将共同创建名为“星际之门”的合资企业,未来四年投资5000亿美元建设人工智能基础设施。该项目已在得克萨斯州开工建设首批10家数据中心,预计创造超10万个本土工作岗位。然而,马斯克质疑该项目资金不足,OpenAI亏损严重。
周二盘后,特朗普在白宫发表讲话。他表示,OpenAI、软银和甲骨文联合成立“星际之门(Stargate)”项目,在人工智能基础设施方面至少投资5000亿美元,创造10万个工作岗位。特朗普称其是“历史上最大的人工智能基础设施项目”。Arm、微软、英伟达、甲骨文、OpenAI将是美国StargateAI项目初始技术合伙人。
1月20日,月之暗面推出多模态思考模型Kimik1.5,DeepSeek开源R1推理模型,双双“硬刚”OpenAI。性能测试显示,这两款模型在多项测试中能与o1“叫板”。R1更是得到英伟达高级研究科学家JimFan等一众业界大佬的称赞。不过,R1与开源模型V3一样,面临着幻觉问题。
当地时间1月17日,OpenAICEO阿尔特曼在X上透露,o3-mini推理模型预计几周内推出,表现“非常出色”。他还表示,希望2025年合并GPT系列和o系列。对于GPT-5,阿尔特曼称仍在确定中。AI专栏作家Romero猜测GPT-5或已开发完成,OpenAI可能参考竞争对手做法,将其用于模型蒸馏提升其他模型性能,也许永远不会公开发布。
美东时间1月15日,微软宣布推出Microsoft365CopilotChat,面向商业客户。该服务基于网页提供GPT-4o支持的AI聊天工具,企业用户可通过Fileuploads功能处理文档等,CopilotPages功能允许实时协作处理内容。智能体服务可自动执行重复性任务,按用量收费。
1月15日,科大讯飞发布发布国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型——讯飞星火深度推理模型X1。深度思考与逻辑推理能解决训练成本高、乱答题等问题,成为模型发展决胜关键。目前,推理模型在数学、医疗等领域表现出色,已产生真实价值,如让AI学习机学习推荐和诊断更精准等。
当地时间1月13日,英伟达传出坏消息,其最新AI芯片Blackwell机架因过热和连接故障,导致微软、亚马逊和谷歌等大客户削减部分订单。此前,该芯片还曾陷入设计缺陷争议并延期交付。分析师郭明錤称,英伟达GB200NVL72机架的出货量或将显著低于预期,汇丰银行则预计英伟达GB200供应链问题将延续到2026财年上半年。
马斯克在最新采访中透露,特斯拉在2025年将生产数千台Optimus人形机器人,并在工厂初步测试。如果一切进展顺利,2026年人形机器人产量将增加10倍,后年再增加10倍,届时产量至少50万台起。德银预计,到2035年,特斯拉来自Optimus的年收入将达到100亿美元,Optimus销量将达到20万台。
1月7日,大模型创业公司零一万物CEO李开复回应媒体称,只有大厂能够烧超大模型,零一万物2024年以来的目标,是做小参数、适中的行业模型。如今,李开复的最新回应也意味着零一万物未来更专注“产业大模型”和应用落地,将“超大模型”预训练交给产业大模型联合实验室。
北京时间1月7日上午,英伟达创始人兼CEO黄仁勋在拉斯维加斯举行的CES2025大会上发表主题演讲,宣布推出一系列新产品和技术。其中,售价高达1999美元的RTX5090显卡成为焦点,这款基于Blackwell架构的顶级GPU性能比上一代高出2倍。其他“王炸”产品还包括Cosmos世界基础模型、下一代汽车处理器Thor,以及将于5月推出的个人AI超级计算机ProjectDigits。
2024年12月26日,AI大模型DeepSeek-V3发布并同步开源,全球刷屏。DeepSeek-V3在聊天机器人竞技场中排名第七,是前十名中唯一的开源国产模型,且被评为性价比最高的模型。技术报告揭示其融合了FP8、MLA、MoE三项创新技术,大幅提升了性能和效率。业内人士认为,这些技术的应用标志着实质性突破。