2月24日,DeepSeek正式开启开源周并率先发布优化版MLA技术——FlashMLA。用户只需满足特定环境要求,即可一键配置使用。DeepSeek表示,该技术已测试完备,可投入生产环境。此前,DeepSeek的技术发布曾引起美股和A股震动。寒武纪(688256.SH)股价上个交易日20cm涨停创新高,今天截至收盘又大涨5.14%。
2月26日,DeepSeek宣布开源DeepGEMM计算库。该库简洁高效,仅300行核心代码,但性能出色,能榨干GPU性能潜力。自2月21日DeepSeek官宣将启动“开源周”以来,英伟达股价在三个交易日中已累跌近10%。美东时间周三美股盘后,英伟达将公布2025财年第四季度财报。黄仁勋能否顶住DeepSeek的冲击呢?
2月25日,DeepSeek宣布开源其DeepEP代码库,这是首个用于混合专家模型训练和推理的开源专家并行通信库。虽然EP技术能以较低的通信成本完成模型训练,但中金认为,这种通信设计技术的进展并不一定会使高速通信的需求减少。值得注意的是,DeepEP代码库开源后半小时,兆龙互连股价一度拉升7.53%。这背后有无关联?
每经杭州2月25日电(记者叶晓丹)阿里云旗下视觉生成基座模型万相2.1(Wan)开源,此次开源采用最宽松的Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者...
TDCowen近日发布报告称,微软已经取消与美国两家以上运营商的数据中心租约,容量达“数百兆瓦”,同时还削减了海外数据中心投资规模。微软2月24日“罕见”回应,但拒绝对报告置评。市场开始质疑,AI领域的资本支出盛宴是否已近尾声?高盛指出,这或表明微软将继续审慎地投资AI算力,但同时关注回报。
今日凌晨2点,Anthropic发布首个双思维模型Claude3.7Sonnet,该模型有标准和扩展两种思考模式,在代码能力等方面表现出色,还发布了专用于代码的AgentClaudeCode。Anthropic称其为唯一“混合”模型,将立即投入使用,此举或为其赢得竞争优势。该公司正洽谈筹集35亿美元融资,估值或增至615亿美元。
2月23日,清华大学与瑞莱智慧联合团队(以下简称“清华瑞莱联合团队”)推出大语言模型RealSafe-R1。据悉,该模型基于DeepSeekR1进行深度优化与后训练,在确保性能稳定的基础上,实现了安全性的显著提升。瑞莱智慧方面表...
近日,马斯克旗下人工智能公司xAI发布了最新一代AI模型Grok3,并宣称其为“地球上最聪明的人工智能”。xAI在发布后48小时内免费开放Grok3供用户试用。然而,一些用户体验后质疑其能力,OpenAI应用研究主管BorisPower也指责xAI存在作弊嫌疑。真相如何?每经记者进行了实测。
马斯克北京时间2月23日宣布Grok语音模式早期测试版上线。此前,马斯克与xAI团队发布Grok3,称其将用于SpaceX火星任务计算,并超越主流模型。xAI称其在超级计算机上运行,使用大量GPU。马斯克将Grok3称为“最聪明的人工智能”,但用户认为与其他模型无明显差别。此外,xAI正接洽潜在投资者,计划筹集约100亿美元,估值或达750亿美元。
在当今全球追求高质量发展的背景下,双轨转型(TwinTransition)——即将可持续发展与数智化转型有机融合,追求经济、社会和环境多元价值的实现——已成为核心议题之一。这不仅仅是寻求两者之间的简单协同效应,而是一场深层次的系统性...
1月11日,DeepSeek发布官方App。每经记者从数据分析平台QuestMobile独家获得的最新数据显示,从上线以来至2月9日,DeepSeekApp的累计下载量已超1.1亿次,周活跃用户规模最高近9700万。更为重要的是,DeepSeek几乎没在营销上投入。在DeepSeek的强劲势头下,曾一度突出重围的Kimi和豆包却似乎正在沦为“配角”。Kimi近一年来预估已累计投流高达9亿元,但用户增长效果不佳。
当地时间周三,微软宣布推出全球首款拓扑架构量子芯片Majorana1。该芯片集成8个量子比特,未来或可容纳100万个。微软花17年解决了量子比特脆弱的问题,新芯片更稳定、快速、小巧且可数字控制。微软还发布了能生成复杂游戏序列的MuseAI,其数据来自Xbox玩家操作记录,能实现“实际理解”。
2月18日,DeepSeek和月之暗面几乎同时发布了最新的论文,主题均直指算法优化,挑战Transformer架构最核心的注意力机制。值得注意的是,两家公司的技术派明星创始人梁文锋和杨植麟都出现在了论文作者之列。谈及DeepSeek的最新NSA机制,风投公司RAIDigital联合创始人萨义德·戈苏斯对每经记者解释称,与马斯克所追求的“大力出奇迹”不同,DeepSeek的新机制采用了三大主要技术,让长文处理更高效。
现阶段,很多企业都以接入DeepSeek-R1为拥抱AI的“先进”标志,腾讯、阿里和字节等大厂的多项业务“牵手”R1,阶跃星辰、MiniMax等“AI六小虎”也做出了同样的选择。而和DeepSeek产品形态最为相似的豆包(字节旗下)和Kimi(月之暗面旗下)目前仍是专注自身的状态。
当地时间2月17日晚,马斯克旗下AI公司xAI发布了Grok3及其精简版Grok3mini。马斯克在发布会上声称,Grok3在包括AIME和GPQA在内的基准测试中击败了所有市面上的模型。然而,有用户指出Grok3在游戏相关结论和编程问题上出现了错误。OpenAI联合创始人AndrejKarpathy在短暂的上手体验后认为,Grok3+Thinking与ChatGPT的o1-pro差不多,略好于DeepSeek-R1和谷歌的Gemini2.0FlashThinking。
2月18日,OpenAI首席执行官萨姆·奥尔特曼发文称GPT-4.5已进入测试阶段。马斯克透露Grok3大模型将于太平洋时间周一晚上8点发布,并强调其是“地球上最聪明的AI”。近期,马斯克多次公开透露Grok3大模型进展,并称其表现超越已发布产品。另据报道,马斯克的xAI公司正在接洽潜在投资者,计划筹集约100亿美元资金,此轮融资可能使该公司估值达到约750亿美元。