◎ OpenAI线上直播即将于当地时间5月13日上午10点(北京时间5月14日凌晨1点)开始。据外媒报道,活动预计有两大亮点:一是能更好理解图片和音频的语音助手,二是ChatGPT或内置语音通话能力。
每经记者 文巧 每经编辑 兰素英
从今夜开始,OpenAI线上直播、谷歌2024年I/O开发者大会、微软Build年度开发者大会、英伟达一季报以及苹果年度开发者大会将在未来的一个月悉数上演。
当地时间5月13日上午10点(北京时间5月14日凌晨1点),OpenAI线上直播将率先登场,展示ChatGPT新功能和升级版GPT-4,该公司已经在官网发布预约页面,但相关细节尚未公布。
图片来源:OpenAI
The Information援引消息人士称,OpenAI准备在活动中展示能够使用声音和文本与人交谈以及识别物体和图像的技术,这一技术将被整合到万众期待的语言助手产品中。
此外,《每日经济新闻》记者在X平台上注意到,有网友扒出ChatGPT的代码,显示其或将具备语音通话能力。有人戏称,电影《她》中的场景即将走入现实。
外媒此前预计本次直播会将发布有关搜索引擎或GPT-5的消息,但随后OpenAI首席执行官Sam Altman驳斥了这些谣言。随着谷歌、Meta等竞争对手相继发布新的多模态大模型,外媒报道称,OpenAI可能会在今年年底前公布GPT-5以期保持领先地位。
尽管OpenAI官网未提供有关此次直播演示的相关细节,但记者经过梳理发现,此次活动上有两大亮点值得期待。
亮点一:语音助手
据The Information独家报道,OpenAI准备在这场即将开始的活动中展示能够使用声音和文本与人交谈以及识别物体和图像的技术,并将该技术整合至一个语音助手产品中。这意味着,这款AI助手所基于新的多模态模型能够更好地理解图像和音频。
报道援引知情人士称,该公司开发人员已经向一些客户展示了这款AI助手的其中一些功能,其逻辑推理能力比当前的产品更优秀。
报道称,OpenAI首席执行官Sam Altman的目标是,最终开发出类似于斯派克•琼斯电影《她》的虚拟助手,使苹果Siri等现有语音助手变得更加智能。Altman认为,具有视觉和音频功能的AI助手与智能手机一样,都有变革性的潜力。理论上,AI助手可以充当学生导师、解决汽车故障等许多角色。
不过,报道称,该产品目前无法在个人设备上运行,客户在短期内可以使用基于云的版本来部署或改进功能,例如自动化客户服务代理。目前尚不清楚OpenAI何时向其付费客户提供这些新功能,但它最终计划将这些新功能纳入其聊天机器人ChatGPT免费版本的一部分。
亮点二:ChatGPT将具备通话功能
记者注意到,在X平台上,一位名叫Ananay Arora的开发人员发布了疑是ChatGPT通话相关代码的屏幕截图。他表示,OpenAI可能正在准备在ChatGPT中内置通话功能。
图片来源:X平台
此外,Arora还发现了OpenAI已配置用于实时音频和视频通信的服务器的证据。
图片来源:X平台
基于此,有网友评论猜测,“这是不是意味着ChatGPT能够主动给我打电话,而不需要我先发起呼叫?”而这一幕,在电影《她》中就曾出现——AI助手萨曼莎会主动给男主人公打电话。
图片来源:X平台
除此之外,Hallid.ai的联合创始人indigo在X平台上预测称,GPT-4 的新版应该会按照参数规模不同分化成多个版本,他同时说道:“GPT-3.5 的历史使命结束了,GPT-4的轻量版可以在ChatGPT中免费使用,而且API的价格会大幅下降。”
图片来源:X平台
indigo的猜测与OpenAI的目标是一致的。据The Information报道,OpenAI的目标正是让支持前述新功能的AI模型比目前销售的最先进模型GPT-4 Turbo的运行成本更低。
据悉,OpenAI今年还计划发布一种新的定价模型,如果客户预付费,该模型将为客户提供高达50%的折扣。目前,OpenAI主要提供按需定价,大模型每生成100万token,向开发者收取几美分到120美元不等的费用。
据悉,提前付款折扣在云计算中很常见——Microsoft Azure、Google Cloud 和 Amazon Web Services的客户就可以通过提前预留服务器容量来降低成本。凭借更灵活的定价,OpenAI可以更好地与竞争对手角逐。
随着谷歌、Meta等竞争对手相继发布新的多模态大模型,例如Meta在4月份发布开源模型Llama 3,谷歌在去年12月发布Gemini,外界猜测,OpenAI即将公布GPT-5以期保持领先地位。此外,近期一系列报道称,OpenAI也在致力于推出一款网络搜索引擎,旨在与谷歌搜索抢夺市场份额。
不过,在此前接受外媒采访时,Altman表示,OpenAI并不会在本次直播活动中发布GPT-5,也不会发布AI搜索引擎。
尽管如此,该公司并未否认正在开发在线搜索产品的传言。科技媒体Inquirer Tech报道了一个名为“search.chatgpt.com”的域名和SSL认证,称这是与OpenAI在线搜索项目相关的有力线索。此外,据报道,该公司可能会在今年年底前公布GPT-5。
尽管OpenAI在AI模型上倾注大量精力,但The Information也表达了对该公司接下来如何创造实际利益的担忧。例如,OpenAI曾向开发人员承诺,到今年第一季度,将能够通过GPTs构建定制聊天机器人来赚钱,但迄今该公司尚未推出一种有效的方式达到目的。
另一方面,外媒报道称,苹果接近与OpenAI就下一代iPhone操作系统如何集成ChatGPT达成协议。然而,OpenAI依然面临着激烈的竞争:苹果同时也正在与谷歌进行类似的谈判,以期将Gemini应用于智能手机中。
此外,Altman还正与苹果前设计师Jony Ive合作开发一款单独的AI消费设备。然而,最先进的AI模型规模十分庞大,意味着目前需要在云端运行,并且需要互联网连接才能工作,具有视觉和音频功能的AI模型可能需要数月甚至数年的时间才能变得足够小以在设备上运行。
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。