接入大模型构建数据飞轮：火山引擎要做B端服务“提供商”

火山引擎的AI助手也来了。

9月19日，火山引擎宣布在其数智平台VeDI(Volcengine Data Intelligence,一款企业级数据产品)上正式推出“AI助手”。

《每日经济新闻》了解到，火山引擎AI助手中的工具通过接入人工智能大模型，即字节本身的云雀大模型，以及火山方舟MaaS（Model as a Service,模型即服务）平台上合作伙伴的大模型得以实现。

值得关注的一点是，此次会上发布的产品覆盖数据生产与消费的全链路场景。火山引擎方面对此表示，AI助手旨在帮助企业提升数据处理和查询分析的效率。

数据飞轮将是大模型在企业市场应用落地的一个重要方向图片来源：企业供图

火山引擎总裁谭待表示，数据飞轮将是大模型在企业市场应用落地的一个重要方向。

“大模型可以在toB、toC都有很大变化，怎么找到这个方向，哪些优化是有价值的，（最终）还是要回到数据驱动上，这也是现阶段数据产品很重要的原因，通过模型本身让数据产品使用门槛更低，能创造更多价值。”他说。

《每日经济新闻》记者同时了解到，这些工具目前处于邀请客户深度共创阶段，前期还不会大规模放开。

自ChatGPT横空出世以来，国内互联网大厂陆续跑步进入大模型热潮之中，但字节拥抱大模型前思虑良久，思考的结果是火山引擎将全链路拥抱AI。此次会上，谭待表示，“其他产品，我们在未来其他火山会议上也会逐步对外披露。”

可以确定的是火山引擎发布的产品，仍以服务B端为主。

业务与数据团队的AI“对齐”时代

据了解，此次发布的两款数据产品——大数据研发治理套件DataLeap、智能数据洞察DataWind主要解决了互联网大厂在运转中常出现的一个痛点：业务团队与数据团队时常需要花大量时间与极高沟通成本在数据上“拉通对齐”。此外，对于中小企业来说，AI助手能解决企业内部运营等岗位对专业研发人员的依赖。

这两款产品可以覆盖数据生产与消费的全链路场景，包括数据资产查询、开发运维和分析洞察。

数据资产的查询和开发是数据消费的基础。以往，数据资产的检索和开发非常依赖专业人员，但大模型检索解放了人力，缩短了时间，对于企业来说，降低了挖掘数据价值的门槛。

除了降低门槛之外，这两款产品还解决了企业在高速发展后，专业人才在跨领域工作上的技能打通问题。

记者了解到，非研发人员利用DataLeap-找数助手，通过对话式的查询方式，能高效准确找数，实现员工自助数据消费第一步；基于DataLeap-开发助手，使用自然语言，就可以自动生成、优化SQL（Structured Query Language，数据库语言）代码，以及对话式咨询SQL使用问题等。

也就是说，即使是不会写代码的运营人员，和大模型对话也能做好业务运营数据的取数、看数和归因分析。

这些工具已经在字节内部实践。字节跳动数据平台负责人罗旋在会上展示了电商业的使用场景——

运营人员问：“最近7天好物直播间的经营状况，要用哪些表？”DetaLeap会根据业务的知识库，推荐与经营状况相关的表，并解释每张表对应的数据维度。

更重要的是，运营人员沉淀数据资产不再需要研发人员配合，DataLeap可以生成对应经营状况的数据需求代码、一键解析生成的代码，调用SQL工具做表的检查，点击确认AI自动修复，进一步优化数据资产。

在数据分析环节，AI助手主要解决了“专业数据洞察人员”的需求。DataWind则根据数据资产，完成数据可视化查询与分析等一系列业务探索，解决过去分析洞察上需要大量专业知识的痛点，缩短数据分析周期。

“目前，字节跳动内部80%的员工可以直接使用数据产品，可管理、运营的数据资产覆盖80%的日常分析场景。”罗旋表示。

不过，火山引擎发布的AI助手在前期不会大规模放开。

原因在于，“AI本身也在快速发展过程中，产品仍不能算是成熟的状态，火山引擎希望一点点逐渐打磨产品。希望有一些客户能够深度跟我们共创，更成熟以后，再大规模对外公开。”谭待说。

不all in大模型，做靠近业务的解决方案

对于企业大数据分析的需求，不少大模型玩家也在给出解决方案。

互联网服务和基础设施公司Snowflake（NYSE:SNOW,158.63美元/股，总市值523.00亿美元）专注于“数据即服务”，近日也将生成式人工智能引入其数据云平台；9月8日，亚马逊云科技宣布提升Amazon Elastic File System（Amazon EFS）读取和写入性能，以及Amazon Elastic Block Store（Amazon EBS）的可扩展性和性能，为人工智能、大数据分析等需求服务。而在4月，亚马逊云科技已推出实时AI编程助手Amazon CodeWhisperer，并同时推出了所有开发人员免费使用的版本。

有行业人士指出，火山引擎此次推出的大模型更像是有着AI内核的PaaS和SaaS的工具结合。谭待对此直言不讳，表示这些产品里面大部分确实是SaaS的形态，也有一些会是PaaS的形态。

而对于与SnowFlake的区别，字节跳动数据平台负责人罗旋回应记者提问时表示，火山引擎此次推出的数据飞轮产品更接近业务，而SnowFlake本质上更多是数仓的引擎。

“我们切入的角度不一样，我们更强调业务，比如AB测试在SnowFlake是完全没有对标的。”罗旋说。

可以看到，作为字节内部较早承载大模型试验的业务板块，火山引擎在大模型上的发力点，紧紧围绕着自身业务，也就是服务B端客户，帮助B端客户和潜在客户解决他们可能遇见的问题。

比如，谭待会后谈及大模型表示：“目前的算力还是在训练上，但是长期来看，更大的瓶颈是在推理上。推理就是有波峰波谷，怎么把推理的成本降低，怎么把利用率提升，是一个很重要的事情。”

今年4月，火山引擎自研DPU等系列云产品，并推出新版机器学习平台，目的之一就在于提升算力的资源效率。

事实上，字节在大模型上的进展颇为低调，其旗下的云雀大模型首次被报道，是今年8月31日，这个名字首次出现在了首批通过《生成式人工智能服务管理暂行办法》备案的企业名单中。

在此之前，字节低调地于8月17日公测了基于云雀大模型开发的AI对话产品“豆包”，该应用有网页端、iOS和安卓客户端，预置了英语学习助手和写作助手两个功能。其他再无消息。

而另一边，则是行业内玩家蜂拥而入大模型热潮。

9月7日，腾讯自主研发的通用大语言模型“混元”亮相，并宣布将迈入“全面拥抱大模型”时代；9月5日，科大讯飞的认知大模型讯飞星火面向全民开放；7月13日，京东推出言犀大模型，率先布局产业应用。并同时发布了言犀AI开发计算平台。在此之前，百度、阿里、科大讯飞、华为等企业纷纷发布了自己的大模型。

谭待说，大模型的重要性业界都有共识。“大模型本身就可以在很多场景里面发挥作用……C端的产品陆续可以看到一些变化，但这跟火山关系不会特别大。”他说。

接入大模型构建数据飞轮：火山引擎要做B端服务“提供商”

业务与数据团队的AI“对齐”时代

不all in大模型，做靠近业务的解决方案

关联专题

版权声明