2025年4月15日凌晨,OpenAI发布GPT-4.1系列模型。该系列模型性能优于GPT-4o,上下文窗口达100万个token,尤其在编程任务上表现突出。同时,OpenAI宣布将在三个月后淘汰GPT-4.5预览版,因其成本高昂且性能提升有限。此外,来自开源模型的竞争压力也是一大因素。
每经记者 宋欣悦 每经编辑 兰素英
4月15日凌晨,OpenAI的新系列模型GPT-4.1如约而至。该系列包含了三个模型,分别是GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。其中,GPT-4.1 nano被OpenAI称作其迄今“最快、最便宜”的模型。
据OpenAI介绍,GPT-4.1模型系列上下文窗口均达到100万个token,且整体性能表现要优于GPT-4o和GPT-4o mini,尤其在编码任务上表现突出。
图片来源:OpenAI官网
与此同时,OpenAI宣布将在三个月后在API中淘汰GPT-4.5。究其原因,一方面是成本太高,另一方面,竞争环境,特别是开源模型的进步,也被认为是一大关键因素。
据OpenAI介绍,此次推出的GPT-4.1模型系列包括三个版本,分别为GPT-4.1、GPT-4.1 mini以及GPT-4.1 nano,且每个版本均针对不同的使用场景进行了优化。
GPT-4.1模型系列在各方面都优于GPT-4o和GPT-4o mini,特别是在编程和指令遵循方面,取得了重大进展。此外,GPT-4.1模型系列具有更长的上下文窗口,支持高达100万token的上下文,并且能够更为有效地提取关键信息,知识截止日期更新至2024年6月。
图片来源:OpenAI直播截图
其中,GPT-4.1在编程、指令遵循和长上下文理解方面表现出色。在代码能力基准测试SWE-bench Verified中,GPT-4.1得分为54.6%,而GPT-4o得分约为33%。
OpenAI首席财务官萨拉・弗里亚尔(Sarah Friar)上个月在伦敦的一场科技峰会上表示,OpenAI的目标是打造一个“智能软件工程师”。
图片来源:OpenAI官网
GPT-4.1 mini和GPT-4.1 nano则是两款轻量模型,兼顾低成本与高性能。GPT-4.1 mini的智能水平与GPT-4o相当,甚至优于GPT-4o,但成本降低了83%,延迟也几乎减半。
而GPT-4.1 nano是该系列中速度最快、成本最低的模型,适用于低延迟任务。在维持出色性能的同时,显著提升了运行效率。在Aider多语言编码测试中,GPT-4.1 nano得分为9.8%,甚至高于GPT-4o mini。
模型智能水平与延迟的关系 图片来源:OpenAI官网
值得注意的是,目前,GPT-4.1系列仅通过OpenAI API提供给开发者使用,尚未在ChatGPT中向普通用户开放。
在发布GPT-4.1系列模型的同时,OpenAI还宣布将在三个月后在API中淘汰GPT-4.5,开发者可继续使用至7月14日。
淘汰的其中一大原因是成本太高。
今年2月28日以研究预览版发布的GPT-4.5的API定价高达每百万token输入75美元、每百万token输出150美元。如此高昂的价格,使得很多企业和开发者望而却步。
而新发布的GPT-4.1系列在价格上就要“温柔”很多。
相较GPT-4o,GPT-4.1在处理普通查询时,价格降低了26%,输入、输出分别是每百万token 2美元和8美元。而GPT-4.1 nano是OpenAI迄今为止,价格最便宜且速度最快的模型,输入、输出分别为每百万token 0.1美元和0.4美元。
而且,对于重复使用相同上下文查询的场景,OpenAI将新模型的提示缓存折扣从先前的50%提升至75%。而对于长上下文请求,OpenAI仅按照标准的每token费用计费,不再额外增收费用。
图片来源:OpenAI官网
事实上,GPT-4.5在刚发布不久,就曾因为不高的性价比引发相当大的争议。
在某些特定测试中,GPT-4.5甚至表现得不如更便宜的GPT-4o,尤其是在逻辑推理和指令遵循等方面,但是其输入价格却比GPT-4o高出近30倍。
Vizuara AI联合创始人拉杰·阿比吉特·丹德卡尔(Raj Abhijit Dandekar)在测试完GPT-4.5后直呼“非常失望”。他指出,从性能提升幅度来衡量,GPT-4.5当前的定价明显不合理。
丹德卡尔进一步补充道,当整个行业向高性能、低成本的开源大模型(如DeepSeek)方向发展时,OpenAI似乎却在反其道而行之。
海外科技媒体Wire也对GPT-4.5提出了批评,指出“它(GPT-4.5)非常昂贵,然而其带来的仅仅是资深AI用户或许才会注意到的边际收益,这与OpenAI早期的模型大相径庭。”
Futurism网站也毫不留情地指出,GPT-4.5被过度炒作了,它严重缺乏能让ChatGPT成为“现象级”产品并取得商业成功的要素。
OpenAI方面也承认,运行GPT-4.5的成本极高。早在2月,OpenAI就表示,公司正在评估是否通过API长期提供GPT-4.5服务,也为此次宣布淘汰GPT-4.5埋下了伏笔。
竞争环境,特别是开源模型的进步,也被认为是促成GPT-4.5淘汰的关键因素之一。
Meta首席人工智能科学家杨立昆(Yann LeCun)此前直言,“开源模型正在超越闭源模型”。
上个月,Meta就表示其Llama开源模型的下载量已经超过10亿次。
当下,开源社区所释放出的强大竞争压力,很可能促使OpenAI不断评估其闭源模型的成本效益和性能。事实上,OpenAI首席执行官山姆·奥尔特曼在几天前接受TED采访时坦言,“开源(在人工智能领域)有着重要地位,而OpenAI在这方面行动得有点晚了。”
GPT-4.5价格高昂,外界批评声不断。相对于成本更低且性能日益强大的开源模型,GPT-4.5在竞争中处于明显劣势。开发者往往会倾向于选择开源方案,而不愿为GPT-4.5这类闭源模型支付高额溢价。
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。