现阶段,很多企业都以接入DeepSeek-R1为拥抱AI的“先进”标志,腾讯、阿里和字节等大厂的多项业务“牵手”R1,阶跃星辰、MiniMax等“AI六小虎”也做出了同样的选择。而和DeepSeek产品形态最为相似的豆包(字节旗下)和Kimi(月之暗面旗下)目前仍是专注自身的状态。
当地时间2月17日晚,马斯克旗下AI公司xAI发布了Grok3及其精简版Grok3mini。马斯克在发布会上声称,Grok3在包括AIME和GPQA在内的基准测试中击败了所有市面上的模型。然而,有用户指出Grok3在游戏相关结论和编程问题上出现了错误。OpenAI联合创始人AndrejKarpathy在短暂的上手体验后认为,Grok3+Thinking与ChatGPT的o1-pro差不多,略好于DeepSeek-R1和谷歌的Gemini2.0FlashThinking。
2月18日,OpenAI首席执行官萨姆·奥尔特曼发文称GPT-4.5已进入测试阶段。马斯克透露Grok3大模型将于太平洋时间周一晚上8点发布,并强调其是“地球上最聪明的AI”。近期,马斯克多次公开透露Grok3大模型进展,并称其表现超越已发布产品。另据报道,马斯克的xAI公司正在接洽潜在投资者,计划筹集约100亿美元资金,此轮融资可能使该公司估值达到约750亿美元。
2月18日,华为将在“2025医疗人工智能与精准诊疗发展论坛”上发布基于DCSAI解决方案的瑞金病理大模型,旨在通过数据驱动的智能AI技术提升医疗健康领域的诊断效率。与此同时,马斯克宣布将于北京时间2月18日12点发布Grok3大模型,称其为“地球上最聪明的AI”。马斯克表示,内部测试显示Grok3已超越所有已发布的模型。
2月17日,国家企业信用信息公示系统显示,推出DeepSeek大模型的杭州深度求索人工智能基础技术研究有限公司发生工商变更,经营范围新增互联网信息服务。另外,天眼查App显示,该公司发生主要人员变更,裴湉由执行董事兼总经理改任董事、经理,新增王贤祖为财务负责人。
2月16日,深圳市福田区基于DeepSeek大模型推出了AI数智员工,上线政务大模型2.0版。该版本依托国产算力平台,结合各部门实际业务流程,定制个性化智能体,首批满足240个业务场景需求。DeepSeekR1为核心底座,通过混合专家架构(MoE)与强化学习技术,破解传统政务大模型的痛点,实现了本地化细分领域训练。目前,福田区已上线70名“数智员工”,覆盖政务服务全链条。
马斯克即将迎来“关键一战”。2月16日消息,马斯克在社交平台X上表示,Grok3大模型将于太平洋时间周一晚上8点(北京时间周二12点)发布,届时将进行现场演示。马斯克称其为地球上最聪明的人工智能。马斯克还称,“整个周末都...
太平洋时间2月16日晚8点,特斯拉CEO马斯克宣布xAI公司即将发布Grok3大模型,并将进行现场演示。马斯克对Grok3寄予厚望,称其为“地球上最聪明的人工智能”,具有极强推理能力,表现优于现有所有已发布产品。目前,xAI正洽谈潜在投资者,计划筹集约100亿美元资金,估值或达750亿美元。
2月16日,腾讯回应称微信正灰测接入DeepSeek,在灰度测试范围的用户可在对话框顶部搜索入口免费使用。此外,腾讯多个产品如腾讯云AI代码助手、腾讯元宝等也在探索接入。腾讯称AI搜索基于微信生态及全网内容,能提供更全面回答,且不会使用用户个人信息。知名经济学者盘和林认为,微信此举给了消费者替代方案,对双方都有好处。
2月10日,清华KVCache.AI团队联合趋境科技发布KTransformers开源项目更新,支持24G显存在本地运行DeepSeek-R1、V3的671B“满血版”。更新发布后,不少开发者测试发现,显存消耗比技术文档中提到的还要少,实际内存占用约380G,显存占用约14G。有用户对方案成本进行分项分析后称,只要不到7万元就能实现R1模型的本地运行,与A100/H100服务器动辄200万元的价格相比,便宜了95%以上。不过,该方案也有诸多限制,如推理速度和适用模型等。
DeepSeek横空出世,近期引发券业热议。其超强能力让券商分析师既兴奋又焦虑,有人认为它将取代很多投研工作,也有人认为在专业领域帮助有限。DeepSeek向记者提出五大问题,基金公司人士认为其虽可提升效率,但不能完全替代卖方研究。未来,能提供个性化、差异化研究服务的券商或将更受青睐,中小型券商也有望利用技术平权逆袭。
近日,中国AI初创公司深度求索(DeepSeek)训练出性能可与海外头部企业模型相媲美的模型,吸引全球目光。该模型降低了算力需求,但FutureLabs未来实验室首席专家胡延平在接受每经记者采访时指出,算力与硬件仍在增强。他同时提到,低成本、高效能的技术创新,促使思考和重估算力基础设施投资,AI应用进入快速导入期。未来,AI将走向内生智能和自主智能。
2月13日,《每日经济新闻》记者获悉,腾讯AI助手“腾讯元宝”迎来重大更新,同时支持混元和DeepSeek两大模型,打开腾讯元宝并进入对话界面,即可免费使用DeepSeek-R1满血版模型。图片来源:腾讯元宝网页截图记...
今日凌晨3点,OpenAI首席执行官萨姆·奥尔特曼公布GPT-4.5和GPT-5的消息。未来几个月内将推出GPT-5,几周内先发布GPT-4.5。GPT-5将整合技术应用于ChatGPT等平台,非思维链模型在某些领域不太可靠。免费版ChatGPT能无限制使用GPT-5对话,ChatGPTPlus和Pro订阅用户能以更高智能水平运行。这些模型将融入更多功能。
2月12日,Gartner高级总监分析师方琦接受《每日经济新闻》记者采访时表示,DeepSeek成功的关键因素在于偏研究型的导向,以及大量工程师持之以恒的创新。针对DeepSeek带来的开源闭源之争,方琦认为,这可能要从商业路径来探讨。以Meta的Llma3为例,模型开源完善了其生态圈,增强了与苹果等主要渠道的议价权。另外,方琦提到,在AI时代,会用AI的人淘汰不会用AI的人。
每经北京2月11日电(记者杨昕怡)豆包大模型团队今日宣布,团队提出了全新的稀疏模型架构UltraMem,该架构有效解决了MoE(混合专家模型)推理时高额的访存问题,推理速度较MoE架构提升2~6倍,推理成本最高可降低83%。该研究还揭...