◎大模型可以在toB、toC都有很大变化,怎么找到这个方向,哪些优化是有价值的,(最终)还是要回到数据驱动上,这也是现阶段数据产品很重要的原因,通过模型本身让数据产品使用门槛更低,能创造更多价值。
每经记者 王紫薇 每经编辑 刘雪梅
火山引擎的AI助手也来了。
9月19日,火山引擎宣布在其数智平台VeDI(Volcengine Data Intelligence,一款企业级数据产品)上正式推出“AI助手”。
《每日经济新闻》了解到,火山引擎AI助手中的工具通过接入人工智能大模型,即字节本身的云雀大模型,以及火山方舟MaaS(Model as a Service,模型即服务)平台上合作伙伴的大模型得以实现。
值得关注的一点是,此次会上发布的产品覆盖数据生产与消费的全链路场景。火山引擎方面对此表示,AI助手旨在帮助企业提升数据处理和查询分析的效率。
数据飞轮将是大模型在企业市场应用落地的一个重要方向 图片来源:企业供图
火山引擎总裁谭待表示,数据飞轮将是大模型在企业市场应用落地的一个重要方向。
“大模型可以在toB、toC都有很大变化,怎么找到这个方向,哪些优化是有价值的,(最终)还是要回到数据驱动上,这也是现阶段数据产品很重要的原因,通过模型本身让数据产品使用门槛更低,能创造更多价值。”他说。
《每日经济新闻》记者同时了解到,这些工具目前处于邀请客户深度共创阶段,前期还不会大规模放开。
自ChatGPT横空出世以来,国内互联网大厂陆续跑步进入大模型热潮之中,但字节拥抱大模型前思虑良久,思考的结果是火山引擎将全链路拥抱AI。此次会上,谭待表示,“其他产品,我们在未来其他火山会议上也会逐步对外披露。”
可以确定的是火山引擎发布的产品,仍以服务B端为主。
据了解,此次发布的两款数据产品——大数据研发治理套件DataLeap、智能数据洞察DataWind主要解决了互联网大厂在运转中常出现的一个痛点:业务团队与数据团队时常需要花大量时间与极高沟通成本在数据上“拉通对齐”。此外,对于中小企业来说,AI助手能解决企业内部运营等岗位对专业研发人员的依赖。
这两款产品可以覆盖数据生产与消费的全链路场景,包括数据资产查询、开发运维和分析洞察。
数据资产的查询和开发是数据消费的基础。以往,数据资产的检索和开发非常依赖专业人员,但大模型检索解放了人力,缩短了时间,对于企业来说,降低了挖掘数据价值的门槛。
除了降低门槛之外,这两款产品还解决了企业在高速发展后,专业人才在跨领域工作上的技能打通问题。
记者了解到,非研发人员利用DataLeap-找数助手,通过对话式的查询方式,能高效准确找数,实现员工自助数据消费第一步;基于DataLeap-开发助手,使用自然语言,就可以自动生成、优化SQL(Structured Query Language,数据库语言)代码,以及对话式咨询SQL使用问题等。
也就是说,即使是不会写代码的运营人员,和大模型对话也能做好业务运营数据的取数、看数和归因分析。
这些工具已经在字节内部实践。字节跳动数据平台负责人罗旋在会上展示了电商业的使用场景——
运营人员问:“最近7天好物直播间的经营状况,要用哪些表?”DetaLeap会根据业务的知识库,推荐与经营状况相关的表,并解释每张表对应的数据维度。
更重要的是,运营人员沉淀数据资产不再需要研发人员配合,DataLeap可以生成对应经营状况的数据需求代码、一键解析生成的代码,调用SQL工具做表的检查,点击确认AI自动修复,进一步优化数据资产。
在数据分析环节,AI助手主要解决了“专业数据洞察人员”的需求。DataWind则根据数据资产,完成数据可视化查询与分析等一系列业务探索,解决过去分析洞察上需要大量专业知识的痛点,缩短数据分析周期。
“目前,字节跳动内部80%的员工可以直接使用数据产品,可管理、运营的数据资产覆盖80%的日常分析场景。”罗旋表示。
不过,火山引擎发布的AI助手在前期不会大规模放开。
原因在于,“AI本身也在快速发展过程中,产品仍不能算是成熟的状态,火山引擎希望一点点逐渐打磨产品。希望有一些客户能够深度跟我们共创,更成熟以后,再大规模对外公开。”谭待说。
对于企业大数据分析的需求,不少大模型玩家也在给出解决方案。
互联网服务和基础设施公司Snowflake(NYSE:SNOW,158.63美元/股,总市值523.00亿美元)专注于“数据即服务”,近日也将生成式人工智能引入其数据云平台;9月8日,亚马逊云科技宣布提升Amazon Elastic File System(Amazon EFS)读取和写入性能,以及Amazon Elastic Block Store(Amazon EBS)的可扩展性和性能,为人工智能、大数据分析等需求服务。而在4月,亚马逊云科技已推出实时AI编程助手Amazon CodeWhisperer,并同时推出了所有开发人员免费使用的版本。
有行业人士指出,火山引擎此次推出的大模型更像是有着AI内核的PaaS和SaaS的工具结合。谭待对此直言不讳,表示这些产品里面大部分确实是SaaS的形态,也有一些会是PaaS的形态。
而对于与SnowFlake的区别,字节跳动数据平台负责人罗旋回应记者提问时表示,火山引擎此次推出的数据飞轮产品更接近业务,而SnowFlake本质上更多是数仓的引擎。
“我们切入的角度不一样,我们更强调业务,比如AB测试在SnowFlake是完全没有对标的。”罗旋说。
可以看到,作为字节内部较早承载大模型试验的业务板块,火山引擎在大模型上的发力点,紧紧围绕着自身业务,也就是服务B端客户,帮助B端客户和潜在客户解决他们可能遇见的问题。
比如,谭待会后谈及大模型表示:“目前的算力还是在训练上,但是长期来看,更大的瓶颈是在推理上。推理就是有波峰波谷,怎么把推理的成本降低,怎么把利用率提升,是一个很重要的事情。”
今年4月,火山引擎自研DPU等系列云产品,并推出新版机器学习平台,目的之一就在于提升算力的资源效率。
事实上,字节在大模型上的进展颇为低调,其旗下的云雀大模型首次被报道,是今年8月31日,这个名字首次出现在了首批通过《生成式人工智能服务管理暂行办法》备案的企业名单中。
在此之前,字节低调地于8月17日公测了基于云雀大模型开发的AI对话产品“豆包”,该应用有网页端、iOS和安卓客户端,预置了英语学习助手和写作助手两个功能。其他再无消息。
而另一边,则是行业内玩家蜂拥而入大模型热潮。
9月7日,腾讯自主研发的通用大语言模型“混元”亮相,并宣布将迈入“全面拥抱大模型”时代;9月5日,科大讯飞的认知大模型讯飞星火面向全民开放;7月13日,京东推出言犀大模型,率先布局产业应用。并同时发布了言犀AI开发计算平台。在此之前,百度、阿里、科大讯飞、华为等企业纷纷发布了自己的大模型。
谭待说,大模型的重要性业界都有共识。“大模型本身就可以在很多场景里面发挥作用……C端的产品陆续可以看到一些变化,但这跟火山关系不会特别大。”他说。
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。