每日经济新闻

    谷歌重磅发布新一代开源AI大模型,称其性能在同等规模中最为先进!

    每日经济新闻 2024-02-22 09:45

    每经编辑 杜宇

    开源领域大模型,迎来了重磅新玩家。

    当地时间周三(2月21日),科技巨头谷歌发布了新一代开源模型“Gemma”,公司称其是轻量级中“最先进的”开放模型系列,超越了原本最强的Mistral 7B。

    谷歌官网写道,Gemma在拉丁语中意为“宝石”,以此命名的开放模型系列Gemma由Google DeepMind等团队开发,采用了与创建Gemini模型相同的研究和技术。

    目前,Gemma系列有两种权重规模的模型,分别为“Gemma 2B”和“Gemma 7B”,即20亿参数和70亿参数,以满足开发人员的不同需求。

    在性能方面,官方页面显示,Gemma 7B在MMLU(大规模多任务语言理解)的得分率达到64.3%。在同等规模中,原本最强Mistral 7B的得分率为62.5%,Meta的Llama-2 7B和13B也都与其有一定的差距。

    Gemma也第一时间上线了 HuggingFace 和 HuggingChat,每个人都能试一下它的生成能力:

    在Hugging Face的LLM leaderboard集中式排行榜上,Gemma的2B和7B模型的平均得分也位于各自参数规模的榜单前列。

    谷歌在新闻稿中写道,Gemma 2B和7B与其他开放模型相比,展现出在同等参数规模中最先进的性能,甚至超过了一些更大的模型,这得益于与公司最强的AI模型Gemini共享技术和基础架构。

    软件工程师Jeff dean称,尽管体量较小,但Gemma模型已经在关键基准测试中明显超越了更大的模型,对比的包括Llama-2 7B和13B,以及风头正劲的Mistral 7B。

    而且Gemma能够直接在开发人员的笔记本电脑或台式电脑上运行。除了轻量级模型之外,谷歌还推出了鼓励协作的工具以及负责任地使用这些模型的指南。


    Keras作者François Chollet对此直接表示:最强开源大模型的位置现在易主了。

    谷歌和Alphabet公司CEO 桑达尔·皮查伊(Sundar Pichai)表示,Gemma展示了强大的性能,从今天开始,该模型将在全球范围内提供,并可在笔记本电脑、工作站或谷歌云上运行。

    Google DeepMind CEO Demis Hassabis表示,轻量开源的Gemma是同类尺寸中性能最佳的模型。

    如今,谷歌不仅将对手瞄向OpenAI,而且打算占据一切,新模型将比扎克伯格的Llama-2“遥遥领先”。

    谷歌计划未来推出更多的Gemma变体,以适应更广泛的应用场景。目前,想要开始使用这些模型的开发者可以通过数据科学平台Kaggle、谷歌的Colab笔记本或通过谷歌云进行访问。

    每日经济新闻综合谷歌官网、公开资料

    封面图片来源:每经记者 郑雨航 摄

    版权声明

    1本文为《每日经济新闻》原创作品。

    2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。

    上一篇

    AI概念开盘活跃,智能车ETF(159888)拉升

    下一篇

    算力租赁概念拉升 高新发展5天4板



    分享成功
    每日经济新闻客户端
    一款点开就不想离开的财经APP 免费下载体验