每日经济新闻

    0.35美元VS 5美元,谷歌、OpenAI的Token价格战;英伟达市值超2.6万亿美元,揭秘黄仁勋的“疯狂”管理;微软全新AI PC“叫阵”苹果;礼来53亿美元加码“减肥药” | 一周国际财经

    每日经济新闻 2024-05-25 14:53

    每经记者 文巧  蔡鼎  高涵    每经编辑 兰素英 孙宇婷    

     

    ●国内大模型打响“价格战”的同时,硅谷API价格战首先在OpenAI和谷歌之间展开。到底是什么在左右API“价格战”?一味“卷”价格有未来吗?

    ●本周,英伟达连创历史新高,收盘1064.69美元,市值猛增3447亿美元,达26231亿美元,超亚马逊与特斯拉之和。为何英伟达能屡创新高?黄仁勋在管理方面有何过人之处?

    ●本周,以太坊现货ETF刚刚获批,虚拟货币市场就迎来抛售潮,比特币上演“大跳水”;伊朗发布首份直升机事故调查报告:未发现弹痕或类似情况。更多内容,尽在《一周国际财经》。

    0.35美元vs 5美元,硅谷巨头的Token价格战!

    不仅“卷”价格,还在拼推理速度

    图片来源:视觉中国

    5月以来,国内大模型打响了“价格战”。从每百万个Token只要1块钱,到只要8毛钱、5毛钱……国内大厂如字节跳动、阿里、百度、智谱AI、科大讯飞等不断接力,有厂商甚至直接打出了“免费”的口号,震惊整个科技圈子。

    实际上,硅谷也在上演着类似的情形。《每日经济新闻》记者注意到,硅谷大模型的价格也出现了下降趋势。

    API价格战首先在OpenAI和谷歌这对“老对手”之间展开,不过幅度相对较小。其中,OpenAI的GPT-4o调用API的价格比GPT-4-turbo降低了一半,为5美元/百万Tokens,谷歌Gemini 1.5 Flash的价格降到了0.35美元/百万Tokens。

    到底是什么在左右API“价格战”?在降价之外,有媒体指出,加快模型推理速度(即每秒生成Token的数量)也是硅谷大模型市场的主要竞争点。但“卷”价格、“卷”速度真的会赢得未来吗?

    硅谷在“拼”什么?

    5月中旬,字节跳动豆包以0.0008元/千Tokens的价格直接将国内大模型的市场价格带入“厘时代”。随即,大模型厂商便开始了价格上的角力。百度甚至直接祭出“文心大模型两大主力模型全面免费”的大招,直接将“价格战”推向新的高度。科大讯飞、腾讯等也“坐不住”了,要么降价,要么免费。

    短短数天,国内大模型企业的混战便从“低价”走向了“免费”。而在硅谷,类似的情形其实也在上演。

    《每日经济新闻》记者注意到,实际上,降低API价格和推升AI推理速度也已逐渐成为硅谷各大模型提供商的竞争焦点。

    API价格战首先是在OpenAI和谷歌这对“老对手”之间展开的。当地时间5月13日,OpenAI发布全新模型GPT-4o,该模型支持免费试用,据传未来将供用户免费试用。此外,调用GPT-4o API的价格比GPT-4-turbo降低了一半,为5美元/百万Tokens。

    在第二天的谷歌全球开发者大会上,谷歌宣布当家王牌Gemini大模型系列之一Gemini 1.5 Flash 的API价格为0.35美元/百万Tokens,远低于GPT-4o的价格。

    比GPT-4o更具性价比的还有硅谷当红AI初创公司Anthropic和Mistral AI模型的API价格。 

    图片来源:每经制图

    除了“拼”模型调用价格,有媒体指出,硅谷AI芯片公司正以加快模型推理速度——即每秒生成Token的数量——以吸引客户。例如,美国芯片厂商Groq公司专注于提高每秒生成Token的数量,以此作为其主要的市场竞争点。

    据科技外媒Medium今年4月的报道,Groq最新的AI芯片在Meta的开源模型LLaMA 3上达到了惊人的每秒生成800个token,并称这“标志着AI推理效率和能力的巨大转变”。截至目前,英伟达一直主导着AI芯片市场。该报道分析认为,Groq的最新成就可能将对英伟达的统治地位构成严峻挑战。

    根据Groq的数据,许多开源模型据称在Groq芯片上的运行速度都得到提升,例如,Mixtral8×7B版本每秒输出500个Token;Llama 2 70B版本每秒输出300个Token。

    《每日经济新闻》记者查询数据发现,当前配备英伟达芯片处理的硅谷热门大模型推理速度远低于此。例如,GPT-4 Turbo每秒生成约48个token,GPT-4为每秒约10个token;谷歌的Gemini 1.5 Pro约为每秒54.2个token。 

    图片来源:每经制图

    API“价格战”背后:模型性能差距正在减小

    硅谷为何也会面临大模型的API“价格战”问题?这主要是跟模型的性能有关。

    上个月,纽约大学知名教授Gary Marcus发表了一篇名为《证据表明LLM正达到收益递减点》的文章,驳斥了宾夕法尼亚大学沃顿商学院教授Ethan Mollick的一个观点,后者声称目前对大型语言模型改进率的最佳估计显示,能力每5~14个月翻一番。

    Gary Marcus认为,从某些指标来看,在2020~2023年间,大模型的能力的确遵照上述定律翻了一番,但在过去13个月里这种情况并未发生。“相反,我看到许多迹象表明我们已经进入了收益递减期。”他这样写道。

    若以MMLU(一种常见的大模型基准指标)为基准,可以看到,从GPT-2到GPT3再到GPT-4呈现了飞跃式的递增,但GPT-4到今年4月发布的GPT-4 Turbo的能力改进并不明显。

    图片来源:《证据表明LLM正达到收益递减点》

    其次,自GPT-4发布以来,硅谷各大模型的能力正在趋同。LiquidAI的机器学习科学家Maxime Labonne在X平台上表示,表现最好的闭源模型(GPT-4级别)和开源模型在性能上的差距正在越来越小。

    图片来源:X平台

    与此同时,随着企业对定制化大模型的需求越来越高,硅谷科技公司正在推出一系列小模型,例如微软在4月推出了名为Phi-3 Mini的轻量级模型。The Information分析称,像Phi这类小型模型的激增可能会削弱OpenAI的主导地位。

    据The Information,微软产品团队已经将内置的GPT-4换成开源模型,以在Bing等产品中执行更基本的任务。而最初为 OpenAI大模型支付高价的一些公司,近期开始转向包括开源模型在内的更便宜的竞争对手。

    随着GPT-4之后模型能力的趋同,以及更多开源模型和小模型的出现,竞争加剧之下,高价大模型的降价似乎是一种必然。

    “卷”价格、“卷”速度并非终点

    然而,一味“卷”价格会有未来吗?

    众所周知,算力成本是开发大模型无法绕过的难点之一。根据斯坦福大学HAI研究所今年发布的AI报告,训练巨型模型的成本呈指数级增长,谷歌Gemini Ultra的训练成本估计为1.91亿美元,GPT-4的训练成本估计为7800万美元。

    据报道,Anthropic的CEO此前曾表示,目前正在训练的模型成本已接近10亿美元,到2025年和2026年,将飙升至50亿或100亿美元。

    科技巨头已经在硅谷大模型领域建立牢固的立足点,前沿基础模型市场呈现出强烈的市场集中化趋势。分析认为,价格战持续下去,公司利润势必被挤压,财力雄厚的科技巨头尚有基础,但初创公司则可能面临风险。

    对于大模型公司来说,提升模型性能才是赢得竞争的最终手段。正如Gary Marcus所讲,如果收益递减的趋势持续,低级错误无法修正,大模型可能永远无法到达黄金时段。

    另一方面,对于芯片厂商来说,“卷”每秒生成Token的数量仍然更多只是一种噱头,缩短第一个Token生成的时间或将成为下一个新的竞争点。

    尽管Medium分析认为,每秒生成Token数量的提高等同于推理能力的上升,但硅谷AI公司SambaNova在5月初发表的一篇博客文章中表示,当涉及到一些较为复杂和繁重的长文本任务时,每秒生成Token数量并非最重要的指标,也不能全面反映大模型的推理性能。而相对地,第一个Token生成的时间才更加重要。

    这篇文章直白地指出,对每秒高Token数量的追求可能是一种“炒作”。尽管其确实可以实现令人印象深刻的解码速度,但存在芯片利用率低,第一个Token生成速度较慢,难以处理较长的文本输入等重大缺点。

    市值突破2.6万亿美元

    英伟达“狂飙”背后是黄仁勋的“疯狂”管理:无1V1会议、无汇报、无层级

    美东时间524日(周四),英伟达发布2025财年第一财季(截至2024428日),公司业绩和前景展望大超预期。受消息提振,股价连创历史新高,周五收于1064.69美元,市值达26231亿美元,超亚马逊与特斯拉之和,周内市值猛增3774亿美元。

    英伟达股价走势 图片来源:谷歌财经

    报告期内,英伟达营收同比增长262%至260亿美元,远超市场普遍预期的245亿美元,创历史新高;净利润同比增长620%至148.8亿美元;调整后每股收益为6.12美元,同比增长461%。同时,该公司预期其第二财季的营收将达到280亿美元,市场预期为268亿美元。

    在股价的带动下,英伟达CEO黄仁勋的资产净值升至936亿美元,在福布斯全球富豪榜排名第17位。

    值得一提的是,这是英伟达连续第三个季度收入同比增速超过200%。黄仁勋在随后的财报电话会议上表示:“下一场工业革命已经开始……除了云服务提供商,生成式AI还扩展到了消费互联网公司、企业、主权AI、汽车和医疗保健等领域的客户,创造了多个价值数十亿美元的垂直市场。我们正处于下一波增长的起点。”

    为何英伟达能够连续打破分析师预期,创下收入新高?年过六旬的黄仁勋在管理方面有什么过人之处?

    在英伟达内部,黄仁勋直接管理的下属有60人。《纽约时报》资深记者Andrew Sorkin在2023年DealBook高峰会议上曾就此对黄仁勋发出疑问,这样做的安排有何深意?Sorkin称,多数人认为一间会议室有6~10名智囊成员已达极限,特斯拉CEO马斯克的直接下属有28人,苹果CEO库克也只有17人。

    黄仁勋 图片来源:视觉中国

    在黄仁勋看来,扁平化的组织结构能赋予员工更多的自主性,认为高管受的管理越少越好,这种管理方式的特点就是没有计划、没有汇报,甚至没有明确的层级。

    据美国商业杂志Inc.,对于许多首席执行官(CEO)所认为的“CEO的信息应该是有价值的、机密的,只能与另外两三个人分享,这些信息是如此无价,如此机密,以至于只能与几个人分享”,黄仁勋表示非常不赞同,他说: “我不相信这样一种文化、一种环境,即你所拥有的信息就是你拥有权力的原因。”

    相反,他认为管理层的角色应该是授权员工尽力而为。 “你应该创造条件,让他们能够从事毕生的工作,这是我的使命。”他如此说道。

    虽然如今他直接管理60名高管团队,但仍避免进行1对1会议,取而代之的是小组讨论,这样的好处是确保从高层开始,每个人(对信息的掌握)都处于同一条线上。

    而且,英伟达的会议也不受职位或级别限制,上到副总裁下到初级员工,每个人都能访问到公司的所有信息并有权参加任何一场会议。  “如果我们制定了一个战略方向,为什么只限于少数人知道?告诉所有员工,我们就能集思广益。我们就是一有想法就将其发给所有人,然后等大家给我们反馈,我们根据这些反馈再去完善。”他说道。

    在他看来,与公司所有员工分享战略方向,就是在利用整个公司的智慧和专业知识,制定更加完善和更为深思熟虑的战略。

    此外,黄仁勋也不喜欢制定计划,不喜欢让员工撰写报告。他认为,这样的报告到他手里之时往往已经脱离基本事实。为了了解公司的最新情况,黄仁勋鼓励所有员工给他写邮件,主题就是当前他们脑海中“最重要的五件事”。 每天早上,黄仁勋大概会阅读100封这样的邮件。

    在黄仁勋领导下的英伟达组织架构有三个核心目标,即吸引业内最优秀的人才,组建最精干高效的团队进行运营,在这个过程中,确保信息在整个公司快速有效流动。

    虽然这种管理有些独特乃至疯狂,但保留了初创企业才有的灵活性,规避了大型企业普遍存在的官僚主义和僵化。而正是这样的管理模式才将英伟达市值推高至2.6万亿美元,成为全球市值第三大公司,仅次于苹果和微软。

    SEC为以太坊现货ETF上市扫清“关键障碍”

    比特币却上演“大跳水”

    图片来源:视觉中国

    当地时间5月23日(周四),美国证券交易委员会(SEC)批准了一项规则变更,这将为批准以太坊现货ETF铺平道路,以太坊是世界上最大的加密货币之一。

    然而,太坊现货ETF获批之际,虚拟货币市场就迎来抛售潮。北京时间5月24日午后,比特币突然在盘中上演“大跳水”,以太坊、币安币、狗狗币等币种也跟随下挫。北京时间5月24日15时起,比特币盘中接连跌破70000美元、69000美元、68000美元三道重要关口。据中国证券报,这意味着在24日凌晨以太坊现货ETF获批之后买入比特币的投资者损失惨重,买入一个比特币的亏损高达21731元人民币。

    业内人士表示,24日比特币大跌,主要因为以太坊现货ETF获得批准的利好消息落地后,多数投资者乐观情绪消退,倾向于获利了结。

    伊朗发布首份直升机事故调查报告:未发现弹痕或类似情况

    5月20日拍摄的伊朗国家电视台播放的坠毁直升机残骸画面。
    图片来源:新华社记者 沙达提 摄

    当地时间5月23日,伊朗武装部队总参谋部发布首份已故总统莱希及其随行人员乘坐的直升机事故调查报告。

    据悉,从德黑兰派遣的专业技术小组于当地时间20日上午9时抵达直升机坠毁现场,采集信息。

    报告显示:直升机按计划航线飞行,并未离开指定航线。直升机事故发生前约一分半,事故直升机的飞行员与该飞行组的另外两架直升机进行了沟通。坠毁直升机的其余部件中没有发现弹痕或类似情况。

    每秒执行超40万亿次运算!

    微软推出内置GPT-4o的全新AI PC“叫阵”苹果

    图片来源:微软

    当地时间5月21日,微软推出了“有史以来更快、更智能”的Windows 11 AI PC,内置了OpenAI的GPT-4o模型,其硬件AI算力据称可每秒执行超过40万亿次运算。

    微软副总裁兼消费品类首席营销官Yusuf Mehdi将Windows 11 AI PC与苹果的高端Mac电脑对比,称它“比配备M3处理器的MacBook Air快58%,并且所有(PC)都配备了可以续航一整天的电池。”

    面对微软的“挑衅”,苹果已承诺将在6月的全球开发者大会公布新的AI产品。Wedbush董事总经理、资深股票分析师Daniel Ives在发给《每日经济新闻》记者的置评邮件中称,苹果的重心是在iOS 18中加入ChatGPT支持的AI功能,并最终嵌入即将于今年9月发布的iPhone 16中。

    游戏驿站宣布完成增发

    盘后一度大涨22%

    图片来源:谷歌财经

    当地时间5月24日(周五)美股盘后,美国“散户疯炒股”代表游戏驿站宣布,上周公司披露的新股增发计划已经完成,在扣除佣金和发行费用前的毛收入近9.334亿美元。股价盘后一度大涨22%,此后涨幅有所收窄。

    此前由于“咆哮小猫”账号复苏引发的爆炒,游戏驿站股价在五月中旬的短短两天内从17美元涨至最高64美元。面对股价异动,公司随即宣布以“按市价发行”的方式增发至多4500万股。

    礼来150年历史上最大投资

    53亿美元加码“减肥药”

    图片来源:每日经济新闻 资料图

    当地时间5月24日(周五),礼来公司宣布,将斥资53亿美元扩建其位于印第安纳州的工厂,以提升减肥和糖尿病治疗药物关键活性成分“替尔泊肽(Tirzepatide)”的产量,这是该公司近150年历史上最大的一笔投资。

    市场分析师预测,到2030年,减肥药市场的规模可能高达800亿美元。在这一高速增长的行业里,诺和诺德和礼来公司都在积极争夺市场份额,力图成为行业的领导者。尽管两家公司已经投入巨资以扩大生产规模,但市场的需求增长速度仍然超过了他们的生产能力,两家公司都面临供应短缺问题。



    免责声明:本文内容与数据仅供参考,不构成投资建议,使用前核实。据此操作,风险自担。

    记者:文巧 蔡鼎 高涵

    编辑:兰素英 孙宇婷

    视觉:刘青彦

    排版:高涵

    封面图片来源:视觉中国

    版权声明

    1本文为《每日经济新闻》原创作品。

    2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。

    上一篇

    微软全新AI PC“叫阵”苹果;礼来53亿美元加码“减肥药”;比特币上演“大跳水”;伊朗发布首份直升机事故调查报告 | 一周事件

    下一篇

    加共体呼吁将古巴从美所谓“支恐国家”名单中移除



    分享成功
    每日经济新闻客户端
    一款点开就不想离开的财经APP 免费下载体验