每经记者 赵雯琪 每经编辑 程鹏 刘雪梅
李开复露面的频率越来越高,都是因为大模型。
没有上周发布会上精致讲究的穿搭和标志性的领带,这次李开复只是一件西服配上衬衫就出现在摄像头前,显得有些仓促。
“昨晚技术团队看到这个突破很激动,我们就迫不及待想在今天和大家分享了。”5月21日上午,李开复在这场临时小规模线上发布会上作如是开场发言。
让他和团队激动的消息是,零一万物提交的“Yi-Large”千亿参数闭源大模型在LMSYS Org(Large Model Systems Organization大模型系统组织)发布的Chatbot Arena总榜单上排名第七,以机构排序,零一万物01.AI排名仅次于OpenAI,Google和Anthropic。
李开复分析称,从这个榜单可以看出,中国大模型与OpenAI旗舰模型的差距已经从去年的7-10年缩短到了如今的6个月。“6个月的差别我觉得不是很大,我觉得是一个不可思议的超级速度的赶追,这方面我还是非常自豪的。”李开复在接受包括《每日经济新闻》记者在内的媒体采访时表示。
一周前(5月13日),李开复公开发布千亿参数Yi-Large闭源模型。他当时表示,Yi-Large的多项评测结果超越Chat GPT4。在一周前,OpenAI又推出了其最新模型GPT-4o,不仅性能有大幅提升,价格也下调了50%。国内市场,字节跳动、阿里等大厂纷纷大幅度降低大模型价格,百度5月21日更直接宣布文心大模型两大主力模型免费,掀起国内大模型一轮价格战。
当被问及如何看如今市场上的大模型价格战时,李开复表示,在一定程度上,整个大模型行业每年推理成本降低到1/10是可以期待的,而且是必然也应该发生的,通过降低价格让更多的人体验到大模型产品对行业是一件好事。
不过他也提到,相信大部分大模型创业者不会不理智地“卷价格”,但是如果中国市场未来真的到了只卷价格、“赔光通输也不让你赢”的程度,零一万物就会转向国外市场。
中国大模型与美国顶尖差距
从7年缩短至6个月?
自ChatGPT横空出世引发国内外的大模型创业浪潮以来,有不少创业者通过各种大模型榜单来证明自己大模型产品的能力,但是各类榜单鱼龙混杂,也缺少统一的对比标准。
为什么零一万物和其他几家中国大模型公司出现在LMSYS发布的盲测榜单上更值得中国大模型创业者关注?
李开复表示,LMSYS发布的盲测榜单获全球大模型巨头引用率最高、最具有真实参考价值,是大模型领域“绝对的金标准”。就在上周,OpenAI CEO奥尔特曼也通过LMSYS盲测榜单低调测评Chat-GPT4o,并转发至社交平台表示对盲测结果的认可。
《每日经济新闻》记者发现,在最新的盲测榜单中,国内大模型厂商中,智谱GLM4、阿里Qwen Max、Qwen 1.5、零一万物Yi-Large、Yi-34B-chat都有参与,在总榜上,GPT系列占了前10的4个,以机构排序,零一万物01.AI次于OpenAI,Google,Anthropic,智谱GLM4排名15、阿里Qwen Max排名12。
LMSYS榜单上的中国大模型产品
在总榜之外,LMSYS的语言类别上新增了英语、中文、法文三种语言评测,零一万物的Yi-Large大模型在中文语言分榜上与GPT-4o并列第一,阿里的Qwen-Max和智谱的GLM-4在中文榜上排名则分别为第7名和第10名。
在李开复看来,中国大模型公司出现在这个榜单中,且排名靠前,对于行业来说最大的意义在于,中国大模型和世界顶尖大模型的差距缩短到只有6个月。
“我们的GPU算力只有Google、OpenAI的1/10,我们的模型尺寸也不到他们的1/10,能够把一个7~10年的落后缩短到6个月,这绝对是一件令人自豪的事。”李开复表示。同时他也鼓励更多国内大模型公司参与到更权威的评测中,证明自己的产品竞争力。
6个月的时间差距是如何计算的?李开复表示,可以回到LMSYS 6个月以前的榜单,如今零一万物发布的最新大模型已经可以打败去年11月之前的任何模型,“所以我觉得这也可以科学地推理出我们比国外的顶尖大模型落后6个月。”李开复表示。
“我们能把7-10年的差距快速降低到只有6个月,就验证了做好一个模型绝对不只是看你多能写论文,多能发明新的东西,先做或后做。做得最好才是最强的。”李开复表示。
他认为,中国的大模型团队有后发优势,中国创业者尊敬美国的创造性和学术能力,但是比执行力,比做出很好的体验,比产品,比商业模式,中国的大模型公司强于美国公司。
如果中国市场“赔光通输也不让你赢” 就走国外市场一面是和国外的顶尖大模型“卷”能力,另一面,国内大模型也正在进入“卷”价格的新阶段。
5月21日上午,阿里云宣布通义千问主力大模型Qwen-Long的API价格直降97%。具体来看,API输入价格从0.02元/千Tokens降至0.0005元/千Tokens。该价格也低于字节跳动旗下上周刚刚推出的比行业价格便宜99.3%的豆包主力模型。
在阿里云宣布大幅度降价之后,百度当日在其公众号发文称,文心大模型两大主力模型ERNIE Speed和ERNIE Lite全面免费,即刻生效。在此之前,智谱AI也把glm3-turbo价格调整到每百万tokens 1元。
虽然李开复在上周刚刚呼吁行业应当共同避免陷入不理性的ofo式流血烧钱打法,让大模型能够健康良性发展。结果国内大模型价格战比想象中来得更早,也更刺激。
互联网大厂的大模型产品不断“击穿底价”,零一万物和其他大模型初创公司如何在竞争中跑赢互联网大厂?李开复坦言他这几天也关注到这个现象,“我觉得整个行业每年推理成本降低到1/10是可以期待的,而且必然也应该发生的。今天的API模型调用还是一个非常非常低的比例,如果一年降低到1/10让更多的人可以用上,这是一个非常利好的消息。”李开复表示。
当被问及零一万物未来是否有降价的计划时,李开复表示,目前没有价格调整的消息,“我认为模型要看它的表现,可能有些领域,比如说一些很难收回钱的领域要看价格,我们刚上线,有很多忠诚的爱好者选择了我们,我先服务好他们,价钱再说吧。”他同时提到,零一万物今年海外产品预期会有大概1个亿的收入,这也不是烧钱模式烧出来的。
“在过去十多年的互联网市场竞争中,国内经常看到共享单车式的疯狂降价,双输的打法,我觉得大模型公司不会这么不理智,在追求推理成本下降的过程中,技术还是最重要的,如果是技术不行,就纯粹靠贴钱赔钱去做生意,零一万物绝对不会跟这样的定价做对标。”李开复表示。
“特斯拉不会因为其他车卖得更便宜而降价,我们就是大模型公司中的特斯拉。”李开复说。
记者|赵雯琪
编辑|程鹏 刘雪梅 杜恒峰
校对|王月龙
|每日经济新闻 nbdnews 原创文章|
未经许可禁止转载、摘编、复制及镜像等使用
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。