每经编辑 张锦河
开栏语:《AIGC行业周报》梳理AIGC行业一周内发生的重要动态,产品发布和业内大咖的最新观点。
图片来源:每经制图
(一)苹果再获OpenAI董事会观察员席位
苹果获得OpenAI董事会观察员席位,菲尔·席勒将担任此职位,这使苹果能够参与会议但无投票权。
作为合作协议的一部分,苹果将探索与OpenAI的合作模式,可能通过分成佣金实现共赢,而无需初期支付费用。
苹果的加入可能使OpenAI与苹果和微软的合作关系变得复杂,尤其是考虑到微软作为OpenAI的主要投资者。
(二)马斯克宣布,大模型Grok 2将于8月发布,预计带来显著变化
马斯克认同从互联网训练数据中清除大模型的难度,暗示Grok 2将解决这一问题。
透露Grok 3将使用10万块H100进行训练,并可能在年末发布,预示着其性能将非常特别。
(一)OpenAI发布CriticGPT模型,帮助人类找出ChatGPT错误
OpenAI发布了CriticGPT,这是基于GPT-4的新模型,旨在帮助开发人员审核和改进ChatGPT生成的代码。
CriticGPT能显著提升人类反馈强化学习(RLHF)的效率,通过识别和解释错误,提高ChatGPT输出的准确性和安全性。
CriticGPT通过动态数据生成和奖励模型训练,优化策略以生成全面且准确的评论,实验显示其在检测代码错误方面比人类和专业外包更出色。
(二)谷歌开源Gemma 2模型
谷歌发布了Gemma 2系列的两个新成员——9B和27B版本,专为研究和开发人员设计,提供高效、轻量级的开源模型。
在架构上创新,实现了超越同等规模模型的性能,同时在单张A100 GPU上以全精度运行,节约成本并提高推理效率。
注重实用性,与多个AI框架兼容,易于集成和使用,同时谷歌提供了工具包以确保模型的安全性和负责任的AI实践。
(三)知乎发布全新AI产品「知乎直答」
旨在通过大模型技术提供更优质的提问和搜索体验。
基于知乎创作者的真实问答数据,提供简略和深入两种答案生成,并支持内容和人物搜索,缩短用户与优质回答的距离。
产品将推进App开发和多模态能力引入,深度融合知乎社区,并探索对外合作,以技术驱动和产品驱动模式发展,增强易用性。
(四)阶跃星辰大模型“全家桶”首次亮相
AI公司阶跃星辰在WAIC 2024上发布了万亿级参数MoE大语言模型Step-2正式版,以及多模态和图像生成大模型,展示其在AI领域的技术实力。
还通过AI互动体验等应用展示了AI大模型的落地效果,推动AI技术在多个行业的实际应用。
公司持续扩大商业化,通过开放平台“繁星计划”与合作伙伴共同加速AI技术在行业场景的应用,形成丰富的产业应用生态圈,
(五)商汤公布首个“可控”人物视频生成大模型Vimi
该模型能够通过单张照片生成与目标动作一致的视频。
Vimi支持多种驱动方式,包括视频、动画、声音和文字,能实现精准表情控制和自然肢体动作生成,具备生成长达1分钟稳定视频的能力。
Vimi面向消费者开放,尤其满足女性用户娱乐创作需求,提供简单好用的视频创作工具,目前已在商汤科技官网开放预约体验。
(一)扎克伯格最新洞察
分享了对未来十年技术发展的见解,特别关注智能眼镜、神经腕带和AI技术的发展。
认为AI技术将多样化,允许创作者和小企业创建定制化的AI,丰富用户互动体验,智能眼镜可能成为主要的个人硬件设备。
看好短视频和个人化消息互动的增长,以及AI在辅助创作者管理社区和提高内容创作效率方面的潜力。他还提到了神经腕带作为未来人机交互的新方式。
(二)对话腾讯混元刘煜宏:做大模型可以有「深圳速度」,但不能跳步
腾讯混元大模型团队采取"外松内紧"策略,专注于自研技术,已在内部700个产品中应用,如微信读书、腾讯会议等,提升效率和体验。
腾讯基于混元大模型推出元宝App,界面简洁,聚焦生产力场景,通过AI优化信息组织和交付,目前与微信等腾讯生态产品探讨深入互动。
刘煜宏认为AGI(通用人工智能)目前更像是一种信仰,腾讯混元大模型将专注于提升模型的思考和推理能力,未来目标是实现AI技术全面渗透到腾讯所有产品中。
来源:每经科技提供
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。