每日经济新闻-新版APP-大模界

李飞飞团队“50美元”复刻DeepSeek-R1？一文读透“白菜价”背后的真正逻辑

2月6日，据外媒报道，李飞飞等研究人员用不到50美元和16张英伟达H100GPU，耗时26分钟训练出s1-32B人工智能推理模型。据外界分析，该模型基于预训练模型微调，成本未涵盖前期“烧钱”部分，且只在特定测试集上超过o1-preview，未超过“满血版”o1和DeepSeek-R1。在“白菜价”的背后，李飞飞团队重点研究了如何以简单方式实现“测试时拓展”，即模型在推理时多次迭代优化结果，还构建了高质量数据集s1K，降低了训练成本。
终结谷歌搜索！OpenAI放大招：免费开放ChatGPT搜索，无需注册

今日凌晨3点，OpenAI宣布向所有用户开放ChatGPT搜索功能，无需注册。该搜索能更快抓取网络信息，可解读用户搜索想法并提供源地址。同时，OpenAI加大研发布局人形机器人，上周五提交人形机器人商标申请，去年11月重建机器人团队。此外，OpenAI还投资了挪威机器人初创公司1XTechnologies，与FigureAI终止合作。
中国联通官宣，事关DeepSeek！国家超算互联网平台已上线

2月5日，A股三大股指收盘涨跌不一，DeepSeek概念掀涨停潮。多家平台宣布上线DeepSeek大模型，如中国联通、京东云、华为计算、安恒信息、腾讯云、百度智能云、阿里云等。DeepSeek以中国技术团队和本土算力资源引领全球技术创新，有望推动AI应用和终端技术普及，加速AGI时代到来。国海证券认为其突破提振了全球AI工作者信心，激发了创新活力。
人形机器人独角兽“抛弃”OpenAI！CEO宣布30天内要惊艳世界：人形机器人来到“iPhone时刻”

2月5日，FigureAI宣布因已取得“重大突破”，将终止与OpenAI合作，专注内部人工智能研发。这离FigureAI宣布双方的合作关系不到一年时间。FigureAI称，终止合作是因OpenAI的关注重点不在嵌入式人工智能。另外，据外界推断，OpenAI或已自研硬件。受此消息刺激，节后首个交易日，A股机器人执行器板块大幅上涨。预计到2030年，中美人形机器人市场需求将达约203万台，市场空间约3185亿元。
最新！华为昇腾+DeepSeek来了！腾讯云再放大招

2月以来，多个平台宣布与DeepSeek大模型合作。其中，潞晨科技联合华为发布推理API及云镜像服务；安恒信息集成DeepSeek完成安全大模型训练；腾讯云推出“开发者大礼包”；百度智能云上架DeepSeek模型并限时免费；阿里云支持一键部署DeepSeek模型。此外，1月31日，英伟达、亚马逊和微软也宣布接入该模型。
DeepSeek又冲上热搜！券商分析师春节研报不停更！节前20%涨停，这家A股公司最新公告

春节假期期间，DeepSeek概念股节前走强，多家券商发布相关研报并举办路演会议。美国OpenAI首席执行官奥特曼表示，公司没有计划起诉DeepSeek。DeepSeek以低成本、高性能优势引发市场波动，或推动投资者重新评估中国科技企业在AI赛道的技术潜力。节前20%涨停的A股公司每日互动发布异动公告称，未持有DeepSeek股权，也尚未向其提供语料数据。
反击DeepSeek，OpenAI大动作！

当地时间2月2日，OpenAI在其官网上发布了一款名为“深层研究”（deepresearch）的新功能。该功能旨在利用推理综合大量线上信息，帮助用户完成多步骤研究任务。首席产品官KevinWeil表示，这项功能可以在数十分钟内完成人类需花费数小时乃至数天的任务。用户只需给出提示，ChatGPT就能查找、分析并综合数百个在线资源，生成简明报告。
阿里、百度官宣！DeepSeek大消息

2月3日，百度智能云称其千帆平台已上架DeepSeek-R1和DeepSeek-V3模型，推出超低价格方案并限时免费，该模型由杭州深度求索自研。同样在2月3日，阿里云宣布其PAIModelGallery支持云上一键部署。1月31日，英伟达、亚马逊和微软宣布接入DeepSeek-R1。该模型被公认为是目前最先进的大语言模型之一。
腾讯云宣布：DeepSeek-R1登陆！华为也有新动作！

2月2日，腾讯云宣布DeepSeek-R1大模型一键部署至腾讯云HAI上，开发者3分钟就能接入调用。此前，DeepSeek-R1开源后引发全球关注，华为云昇腾云服务也支持部署该模型。DeepSeek成立于2023年7月，其最新开源模型DeepSeek-R1成本低、性能优，破解了“堆算力”路径依赖，影响波及资本市场。
首席执行官奥特曼罕见“认错”，考虑OpenAI开源策略！啥情况？

当地时间1月31日，OpenAI正式推出全新推理模型o3-mini，并首次向免费用户开放。这一成本效益最高的模型现已在ChatGPT和API中上线。OpenAI首席执行官SamAltman携高管在Reddit上回应网友问题，承认过去在开源方面存在不足，并表示将考虑新的开源策略。
最新！OpenAI上架推理模型o3-mini，首次向免费用户开放！AIME测试中，o3-mini最高准确率达87.3%

当地时间1月31日，OpenAI正式推出全新推理模型o3-mini，并首次向免费用户开放。测试显示，在美国数学邀请赛（AIME2024）中，o3-mini的准确率随推理努力提升，最高可达87.3%，速率也显著优于前代o1-mini。在编程竞赛及通用知识评测中，o3-mini表现优异，响应速度比o1-mini快24%。
DeepSeek凭“白菜价”捅破万亿资本泡沫？英伟达承认“卓越”，华尔街投行激辩：科技公司管理层需证明巨额支出合理性

美东时间1月27日，DeepSeek引发AI概念股大跌，欧美科技股市值蒸发1.2万亿美元。其中，英伟达市值一个交易日蒸发5926.58亿美元。英伟达（中国）表示，DeepSeek是卓越的人工智能进展，展示了如何运用该技术创建新模型。DeepSeek对美国科技股的“暴击”，是否意味着以巨额资本支出为基础的美国AI叙事破灭？多家投行发布研报展开激辩。Jefferies认为，DeepSeek的成功或推动两种行业战略。科技股“大多头”Wedbush分析师则认为，DeepSeek的威胁微乎其微，是买入科技股的黄金机会。
记者实测 | DeepSeek-R1对决四款主流推理模型：基础题意外“翻车”，高难度推理碾压ChatGPT o1

DeepSeek的热度还在持续。《每日经济新闻》记者对DeepSeek-R1与四款主流推理模型进行了对比测试，结果显示其在基础题上意外“翻车”，高难度问题上却表现出色，甚至在速度上打败了OpenAI的o1模型。DeepSeek旗下模型极低的训练成本或许预示着AI大模型对算力投入的需求将大幅下降。AI预训练时代或将终结。多家券商研报也指出算力需求将向推理侧倾斜。
DeepSeek刷屏，超越ChatGPT！

1月27日，DeepSeek应用登顶美区和中国区应用商店免费榜。其爆火原因主要为性能和成本，成本低且性能卓越，吸引大量用户。该模型代码和训练方法完全开源，成为开源社区下载量最高的大模型。DeepSeek成立于2023年5月，背后是幻方量化，创始人梁文锋是一位80后技术理想主义者。
AMD火速“站台”DeepSeek，利空英伟达？美国私募：GPU市场格局或被改写！摩根大通也发文

DeepSeek的热度才刚刚开始，海外媒体和评论员都不约而同地把DeepSeek称之为“美国股市最大的威胁”。网络社群里，越来越多的人把DeepSeek与近期英伟达股价的回调联系在一起。有分析称，DeepSeek-V3模型的突破显著降低了AI训练成本，使AMDGPU成为比英伟达更具有成本效益的替代品，增强了AMD的市场地位。
“DeepSeek或彻底改变游戏规则”！中国大模型“搅动”硅谷，巨头进入恐慌模式，外媒刷屏，大佬发声：中国AI已追上美国

1月20日，中国AI初创公司深度求索开源R1推理模型，其在多项测试中表现出色，引发外媒集体刷屏，为硅谷敲响警钟。此前，DeepSeek-V3已开源。两款模型成本低廉，性能与OpenAI相当，让硅谷震惊。Meta内部因DeepSeek的模型进入恐慌模式，试图复制。AI大佬惊叹，中国AI已追上美国，或彻底改变游戏规则。

加载更多内容

热门文章

最新资讯