10月17日下午,百度世界·度小满金融大模型前沿发展论坛在北京召开,中国工程院院士邬贺铨在大会上表示“金融大模型改变了金融科技的范式,重塑金融行业的工作方式,改变了金融服务生态。”
中国工程院院士邬贺铨发表主题演讲
目前金融大模型已经应用在金融资讯、产品介绍内容的文本自动生成,构建虚拟客服在线交互等方面,给用户提供更人性的服务,提升金融机构内容运营的效率。
邬贺铨指出,金融大模型的发展需要全行业共同参与,合作开发,“基础大模型多数从通用语料训练生成,通识能力强,可作聊天对话,但缺少行业专业知识,需要大模型提供方与垂直行业合作开发行业大模型”。
以度小满的开源金融大模型“轩辕”为例,它是将预训练数据(一般预训练、金融预训练)和指令数据(一般指令、金融指令)随机混洗到一个训练数据中进行混合微调,通过多阶段逐渐训练缓解预训练和微调间数据不匹配问题,提高模型的表达、理解、迁移和泛化能力。
度小满CEO朱光表示,“未来五年,生成式AI在金融领域的应用,将成为度小满最重要的战略方向。度小满将不断加大金融垂类大模型及应用的布局和投入,和业界一起把握机遇,推动新一轮金融科技发展浪潮。”
邬贺铨认为,金融大模型的发展目前仍面临着三方面挑战。首先是金融行业对数据安全性、隐私合规性都有着严格的要求。尤其是在风控方面,对时效性与精准性要求严格,而一般的基础大模型透明性、可信性、专业性不足,很难直接迁移为金融大模型。
第二点是金融大数据在成本与质量上的平衡问题。由于金融行业内的数据难以共享,因此金融大模型的数据规模远远不及通用语料,导致金融大模型难以产生“智能涌现”的效果。
第三则是本地私有部署需要自建算力设施,对软硬件产品有严格的信创要求,而且参数规模大则算力成本高。
对于金融大模型的落地应用途径,邬贺铨院士建议:一是从可控入手开发应用,例如智能客服、智能运营、写文章、写邮件等安全的领域出发。二是从人机混合智能切入,例如在初期阶段先让金融大模型与传统模型共存,经应用考验后再将金融大模型逐步替代传统模型。同时还可以通过变换场景,丰富大模型的场景迁移学习能力,或加入反事实的数据来测试,改进AI的学习本质,提高模型的泛化能力。也可以在金融大模型训练或微调时通过有监督学习思维链的模式,通过专家介入引导它一步一步地进行思维推理。
中国工程院院士邬贺铨(左)与度小满CEO朱光(右)交流
“此外,还需要建立专门的监控系统,例如微软专门构建内容管理系统,它与语言模型协同工作,并使用特定算法检测和监控可能发生的服务滥用或有害内容生成情况。”邬贺铨院士指出。