◎在刘益东看来,今年是大模型场景落地元年,且非常关键。“今年能够抢住几个适合的场景,并且能够把它规模化,我觉得基本上就能够在大模型的研发应用包括商业运作循环里面占据先发优势。如果今年不能达到场景落地,那规模化的目标会越来越难。”
每经记者 黄海 每经编辑 董兴生
7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)在上海正式开幕。WAIC行至第七年,被外界比喻为“百模大战”的大模型之争也走到了新阶段,100多场专业论坛、500余家企业、超1500个展品⋯⋯人工智能加速落地进行时,潮水最终将流向何处?今年的世界人工智能大会,给出了更为细致的描绘。
医疗、教育、出行、生产⋯⋯AI赋能的边界不断外延,未来已来,大模型已无处不在。但乐观背后,问题仍在。数不胜数的大模型究竟该如何从竞争中突围?多模态大模型是不是整个行业的未来?在这之后,新的机会又在哪里?
带着一系列问题,7月4日下午,《每日经济新闻》记者(以下简称“NBD”)与蜜度首席技术官刘益东聊了聊。蜜度是一家以人工智能技术为核心的语言智能和垂直大模型企业,这次大会期间,蜜度发布了蜜巢政务大模型3.0,并推出了20多个政务大模型场景化应用。
图片来源:企业供图
对于多模态问题,刘益东表示,眼下多模态大模型能够解决实际场景中的多模态内容问题,是行业应用需求的必然。
在刘益东看来,今年是大模型场景落地元年,且非常关键。“今年能够抢住几个适合的场景,并且能够把它规模化,我觉得基本上就能够在大模型的研发应用包括商业运作循环里面占据先发优势。如果今年不能达到场景落地,那规模化的目标会越来越难。”
以下为部分采访实录。
NBD:“百模大战”进入落地阶段,竞争更加激烈,你怎么看待当前的行业竞争?
刘益东:我觉得,“百模大战”从一个侧面反映了,这一轮的大模型背景下,市场的需求肯定非常广阔,而且有很好的市场预期,所以大家才会投身到里面做创新型的应用。另一个方面来看,必然会导致竞争很激烈,大家都要有自己的特色。
NBD:以蜜度为例,现阶段头部垂类大模型公司的优势体现在哪几个维度?
刘益东:第一点是数据。数据、算力、算法是大模型研发的关键三要素。持续不断地有新的高质量数据流入,就意味着模型可以阶段性地有新知识推动迭代。我们从2012年到现在不断从互联网上积累语料数据,会成为我们的模型持续迭代的动力。
第二点,任何大模型的研发,不管是通用的还是垂类的,未来必然要在商业化场景落地,带来商业价值。最好是能让产出慢慢超过投入,进入到盈利的螺旋上升的过程。蜜度在过往的12年时间,我们服务的B端、G端客户有3万多家,商业化道路起点比别人要高一点。
第三点,政务场景对数据的安全性、保密性要求很高,内部信息化资源的软硬件国产化比例比较高,在本地部署是强需求。我们在过去的半年多时间已经接触了40多个场景客户,有几个场景已经落地完成。与一些初创团队相比,蜜度的经验可能带来先发优势。
图片来源:每经记者 黄海 摄
NBD:你提到盈利,目前,蜜度预估的盈利时点是什么时候?客户情况如何?
刘益东:今年是行业场景落地元年,且非常关键。今年,你能够抢住几个适合的场景,并且能够把它规模化,我觉得基本上就能够在大模型的研发应用包括商业运作循环里面占据先发优势。如果说今年不能达到场景落地,那规模化的目标会越来越难。
我们期待的是,到今年年底能够达到收支平衡。我们整个(研发)团队其实还是维持一个比较精干的20人团队。母公司有成熟的产品营销和工程化体系,有分散在全国的营销触角。
我们现在政务类服务过的客户有3万多个,大模型在跟进的项目有40多个。这两天也一直在畅想未来,说得长远一点,是一个5年计划,5年以后我们服务的这种政务大模型的落地场景项目加在一起可能有1万个。
NBD:但做政务模型对准确性以及价值观的要求很高,这部分如何实现?
刘益东:输出的准确性,我觉得至少从两个层面可以去支撑,我们也是这么做的。
第一个层面是从模型本身的能力上,我为什么一直在强调数据对大模型的重要性,行业里面专业的数据让模型来学,那么模型在服务这个行业的时候,它输出的内容和质量可以跟这个行业的话语体系趋同。
第二个是在工程阶段,我们现在为客户提供的服务并不是直接来源于模型输出的内容,我们用的是一套检索增强的模式。检索客户场景的专业知识,经过排序之后找到最相关的片段,然后再丢到模型里,数据质量相对来说是收敛的。
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。