AIGC行业周报 | 苹果再获OpenAI董事会观察员席位；谷歌开源Gemma 2模型；扎克伯格最新洞察：智能眼镜或成为主要的个人硬件设备

开栏语：《AIGC行业周报》梳理AIGC行业一周内发生的重要动态，产品发布和业内大咖的最新观点。

图片来源：每经制图

一、市场企业动态

（一）苹果再获OpenAI董事会观察员席位

苹果获得OpenAI董事会观察员席位，菲尔·席勒将担任此职位，这使苹果能够参与会议但无投票权。

作为合作协议的一部分，苹果将探索与OpenAI的合作模式，可能通过分成佣金实现共赢，而无需初期支付费用。

苹果的加入可能使OpenAI与苹果和微软的合作关系变得复杂，尤其是考虑到微软作为OpenAI的主要投资者。

（二）马斯克宣布，大模型Grok 2将于8月发布，预计带来显著变化

马斯克认同从互联网训练数据中清除大模型的难度，暗示Grok 2将解决这一问题。

透露Grok 3将使用10万块H100进行训练，并可能在年末发布，预示着其性能将非常特别。

（一）OpenAI发布CriticGPT模型，帮助人类找出ChatGPT错误

OpenAI发布了CriticGPT，这是基于GPT-4的新模型，旨在帮助开发人员审核和改进ChatGPT生成的代码。

CriticGPT能显著提升人类反馈强化学习（RLHF）的效率，通过识别和解释错误，提高ChatGPT输出的准确性和安全性。

CriticGPT通过动态数据生成和奖励模型训练，优化策略以生成全面且准确的评论，实验显示其在检测代码错误方面比人类和专业外包更出色。

（二）谷歌开源Gemma 2模型

谷歌发布了Gemma 2系列的两个新成员——9B和27B版本，专为研究和开发人员设计，提供高效、轻量级的开源模型。

在架构上创新，实现了超越同等规模模型的性能，同时在单张A100 GPU上以全精度运行，节约成本并提高推理效率。

注重实用性，与多个AI框架兼容，易于集成和使用，同时谷歌提供了工具包以确保模型的安全性和负责任的AI实践。

（三）知乎发布全新AI产品「知乎直答」

旨在通过大模型技术提供更优质的提问和搜索体验。

基于知乎创作者的真实问答数据，提供简略和深入两种答案生成，并支持内容和人物搜索，缩短用户与优质回答的距离。

产品将推进App开发和多模态能力引入，深度融合知乎社区，并探索对外合作，以技术驱动和产品驱动模式发展，增强易用性。

（四）阶跃星辰大模型“全家桶”首次亮相

AI公司阶跃星辰在WAIC 2024上发布了万亿级参数MoE大语言模型Step-2正式版，以及多模态和图像生成大模型，展示其在AI领域的技术实力。

还通过AI互动体验等应用展示了AI大模型的落地效果，推动AI技术在多个行业的实际应用。

公司持续扩大商业化，通过开放平台“繁星计划”与合作伙伴共同加速AI技术在行业场景的应用，形成丰富的产业应用生态圈，

（五）商汤公布首个“可控”人物视频生成大模型Vimi

该模型能够通过单张照片生成与目标动作一致的视频。

Vimi支持多种驱动方式，包括视频、动画、声音和文字，能实现精准表情控制和自然肢体动作生成，具备生成长达1分钟稳定视频的能力。

Vimi面向消费者开放，尤其满足女性用户娱乐创作需求，提供简单好用的视频创作工具，目前已在商汤科技官网开放预约体验。

（一）扎克伯格最新洞察

分享了对未来十年技术发展的见解，特别关注智能眼镜、神经腕带和AI技术的发展。

认为AI技术将多样化，允许创作者和小企业创建定制化的AI，丰富用户互动体验，智能眼镜可能成为主要的个人硬件设备。

看好短视频和个人化消息互动的增长，以及AI在辅助创作者管理社区和提高内容创作效率方面的潜力。他还提到了神经腕带作为未来人机交互的新方式。

（二）对话腾讯混元刘煜宏：做大模型可以有「深圳速度」，但不能跳步

腾讯混元大模型团队采取"外松内紧"策略，专注于自研技术，已在内部700个产品中应用，如微信读书、腾讯会议等，提升效率和体验。

腾讯基于混元大模型推出元宝App，界面简洁，聚焦生产力场景，通过AI优化信息组织和交付，目前与微信等腾讯生态产品探讨深入互动。

刘煜宏认为AGI（通用人工智能）目前更像是一种信仰，腾讯混元大模型将专注于提升模型的思考和推理能力，未来目标是实现AI技术全面渗透到腾讯所有产品中。

来源：每经科技提供