10月12日,以“科技无界——智能、绿色、融合”为主题的【2023未来大会】系列活动将在成都举行。我们特别发起『智库看未来』线上思想交流活动,邀请知名高校及智库专家学者关注本届大会主题,为广大科技企业更好实现高质量发展、融入中国式现代化建设指点迷津。
本期观点,来自成都市复旦西部国际金融研究院研究员、全球宏观交易员熊鹏。他认为,现在正是投入大语言模型行业落地的最佳时刻,是最需要企业家精神的时候,是需要有行业的领先者率先尝试。
熊鹏 图片来源:川商总会微信公众号
解读嘉宾:熊鹏,成都市复旦西部国际金融研究院研究员、全球宏观交易员
ChatGPT从推出到现在刚刚10个月的时间,但是全球的商业精英都已经在思考带来的行业变革。
需求是客观存在的,但是目前的技术能力是否足以满足需求呢?这是目前最令人兴奋的创业方向,但是也充满了巨大的技术路线、商业模式风险。
与国内热衷于讨论基座大模型不同,除了几家布局很久的大公司,国外的创业热潮完全集中在运用领域,因为距离大模型落地,从技术上还有相当长的路线要走。基座模型目前分成开源和封闭两个方向,典型的如Meta的LIama2模型就是开源模型,而OpenAI公司的GPT4则是闭源模型。这实际上是对商业模式的不同选择。开源模型可以从多个角度收取费用,常见的包括商业授权、订阅、物理捆绑、技术支持与服务、专有插件和扩展等。而闭源系统则致力于打造生态,即由一家主要的供应商来整合生态资源,从而为各类客户提供服务,赚取利润。
对于大语言模型领域,是否会出现一家类似苹果在移动互联网时代的闭源生态企业,现在并不能下结论。原因在于基座模型的竞争非常激烈,一些开源模型在多项测评中已经超过了GPT3.5的水平,这使得OpenAI公司的护城河看起来并没有那么高。
当然,就目前而言,GPT4依然是远远领先于对手的基座模型。OpenAI如何能将基座模型的优势与运用开发结合起来,是一个巨大的挑战。目前它推出的插件商业模型并不成功,但是最近推出的数据分析功能,的确让人看到其模型的巨大优势。
除了一些具备特殊政府资源优势的企业,国内围绕大语言模型的创业,基本都会侧重运用。国内目前提供的中文基座模型已经很多,基于国外开源的Llama,Falcon等模型的中文微调模型,表现也相当优异。所以,中文的基座模型至少有两个选项:选择国内厂商提供的中文基座模型,选择开源的中文微调后的基座模型。至于国内的基座模型竞争,我们认为很大程度上不完全是商业的竞争,政府关系在里面扮演了重要角色。
国内企业如何突破?我们认为,国内企业无论是TO B还是TO C,都有巨大的发展空间。这里主要谈TO B。
第一,目前所有技术路线都是围绕着大语言模型的固有弊端展开的,尤其是解决信息的真实、及时、稳固等。这里面有相当多的可能选择,从提词工程学、检索增强生成、微调、自动代理等。这方面的技术前沿都在Arxiv预印本论文网站和github代码仓库。各种路线都有优劣,而国内创业者在这个领域有相当的技术优势,很多领域的领先论文都有中国人参与。
第二,行业运用必须有切实的运用场景,比如零售商的客服和物流调度,比如律师事务所的阅卷,这些个性化的要求需要特有的行业知识、行业数据、满足监管需求。这个领域是一个完全待开发的蓝海,只要选择合适的技术路线,综合考虑成本与收益,国内企业具有相当的优势,可以在中文世界率先将大语言模型落地。在这点上,国内的科技初创企业与国际同行,其实是完全在一个起跑线的。
我们认为,需要供给和需求方的共同努力。现在是需求方对运用大语言模型充满期望,但是也有非常多怀疑。供给方虽然测试了很多技术方向,但是往往缺乏实际落地的运用场景。这就是最需要企业家精神的时候,需要有行业的领先者,率先尝试。目前技术总体,已经没有太大的风险,剩下的技术问题,虽然有不及预期的风险,但是相比投入产出比,现在正是投入大语言模型行业落地的最佳时刻。
封面图片来源:每日经济新闻 刘国梅 摄