2月28日,DeepSeek公开了Fire-Flyer文件系统和轻量级数据处理框架Smallpond。3FS面向现代SSD和RDMA网络,能将固态硬盘带宽利用到极致。在该系统开源前数小时,OpenAI推出GPT-4.5。以R1模型在低谷期的每百万Tokens的输出价格计算,GPT-4.5的价格是R1的近270倍。
2月27日,DeepSeek一次性开源了两个工具和一个数据集,分别是DualPipe、EPLB(专家并行负载均衡器)以及训练和推理框架的性能分析数据。同日凌晨,英伟达公布首份财报,其2025财年第四财季营收同比增长78%,CEO黄仁勋点赞DeepSeek并强调推理模型计算需求将更高。
美东时间2月26日盘后,英伟达发布截至1月26日的2025财年第四财季报告。数据显示,虽然业绩好于预期,但英伟达营收同比增速已是连续四个季度滑坡,数据中心业务同比增速也是最近四个季度以来最低。CEO黄仁勋强调Blackwell芯片需求强劲,并指出,由于新的推理方法需要逐步思考“如何最好地回答”问题,下一代AI将需要比旧模型多100倍的计算量。
2月24日,DeepSeek正式开启开源周并率先发布优化版MLA技术——FlashMLA。用户只需满足特定环境要求,即可一键配置使用。DeepSeek表示,该技术已测试完备,可投入生产环境。此前,DeepSeek的技术发布曾引起美股和A股震动。寒武纪(688256.SH)股价上个交易日20cm涨停创新高,今天截至收盘又大涨5.14%。
2月26日,DeepSeek宣布开源DeepGEMM计算库。该库简洁高效,仅300行核心代码,但性能出色,能榨干GPU性能潜力。自2月21日DeepSeek官宣将启动“开源周”以来,英伟达股价在三个交易日中已累跌近10%。美东时间周三美股盘后,英伟达将公布2025财年第四季度财报。黄仁勋能否顶住DeepSeek的冲击呢?
2月25日,DeepSeek宣布开源其DeepEP代码库,这是首个用于混合专家模型训练和推理的开源专家并行通信库。虽然EP技术能以较低的通信成本完成模型训练,但中金认为,这种通信设计技术的进展并不一定会使高速通信的需求减少。值得注意的是,DeepEP代码库开源后半小时,兆龙互连股价一度拉升7.53%。这背后有无关联?
每经杭州2月25日电(记者叶晓丹)阿里云旗下视觉生成基座模型万相2.1(Wan)开源,此次开源采用最宽松的Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者...
TDCowen近日发布报告称,微软已经取消与美国两家以上运营商的数据中心租约,容量达“数百兆瓦”,同时还削减了海外数据中心投资规模。微软2月24日“罕见”回应,但拒绝对报告置评。市场开始质疑,AI领域的资本支出盛宴是否已近尾声?高盛指出,这或表明微软将继续审慎地投资AI算力,但同时关注回报。
今日凌晨2点,Anthropic发布首个双思维模型Claude3.7Sonnet,该模型有标准和扩展两种思考模式,在代码能力等方面表现出色,还发布了专用于代码的AgentClaudeCode。Anthropic称其为唯一“混合”模型,将立即投入使用,此举或为其赢得竞争优势。该公司正洽谈筹集35亿美元融资,估值或增至615亿美元。
2月23日,清华大学与瑞莱智慧联合团队(以下简称“清华瑞莱联合团队”)推出大语言模型RealSafe-R1。据悉,该模型基于DeepSeekR1进行深度优化与后训练,在确保性能稳定的基础上,实现了安全性的显著提升。瑞莱智慧方面表...
近日,马斯克旗下人工智能公司xAI发布了最新一代AI模型Grok3,并宣称其为“地球上最聪明的人工智能”。xAI在发布后48小时内免费开放Grok3供用户试用。然而,一些用户体验后质疑其能力,OpenAI应用研究主管BorisPower也指责xAI存在作弊嫌疑。真相如何?每经记者进行了实测。
马斯克北京时间2月23日宣布Grok语音模式早期测试版上线。此前,马斯克与xAI团队发布Grok3,称其将用于SpaceX火星任务计算,并超越主流模型。xAI称其在超级计算机上运行,使用大量GPU。马斯克将Grok3称为“最聪明的人工智能”,但用户认为与其他模型无明显差别。此外,xAI正接洽潜在投资者,计划筹集约100亿美元,估值或达750亿美元。
在当今全球追求高质量发展的背景下,双轨转型(TwinTransition)——即将可持续发展与数智化转型有机融合,追求经济、社会和环境多元价值的实现——已成为核心议题之一。这不仅仅是寻求两者之间的简单协同效应,而是一场深层次的系统性...
1月11日,DeepSeek发布官方App。每经记者从数据分析平台QuestMobile独家获得的最新数据显示,从上线以来至2月9日,DeepSeekApp的累计下载量已超1.1亿次,周活跃用户规模最高近9700万。更为重要的是,DeepSeek几乎没在营销上投入。在DeepSeek的强劲势头下,曾一度突出重围的Kimi和豆包却似乎正在沦为“配角”。Kimi近一年来预估已累计投流高达9亿元,但用户增长效果不佳。
当地时间周三,微软宣布推出全球首款拓扑架构量子芯片Majorana1。该芯片集成8个量子比特,未来或可容纳100万个。微软花17年解决了量子比特脆弱的问题,新芯片更稳定、快速、小巧且可数字控制。微软还发布了能生成复杂游戏序列的MuseAI,其数据来自Xbox玩家操作记录,能实现“实际理解”。
2月18日,DeepSeek和月之暗面几乎同时发布了最新的论文,主题均直指算法优化,挑战Transformer架构最核心的注意力机制。值得注意的是,两家公司的技术派明星创始人梁文锋和杨植麟都出现在了论文作者之列。谈及DeepSeek的最新NSA机制,风投公司RAIDigital联合创始人萨义德·戈苏斯对每经记者解释称,与马斯克所追求的“大力出奇迹”不同,DeepSeek的新机制采用了三大主要技术,让长文处理更高效。