大模型结果“真假难辨”如何解决？对话天壤创始人、CEO薛贵荣：用这个技术丨WAIC 2023

7月7日下午，天壤创始人、CEO薛贵荣接受了《每日经济新闻》记者的专访。在2023世界人工智能大会上，该公司发布了一种大模型产品生态——“天壤小白”。其中包含最高1860亿参数的通用大语言模型、语义搜索引擎和开发平台。

目前，国内已是“百模混战”，天壤推出的大模型生态有何别致之处呢？薛贵荣首先向记者介绍了大模型存在的四大挑战，即大模型产生真假难辨的“幻觉”，所谓“一本正经的胡说八道”；政企私有数据的保密性要求，不能对外公开；缺少可靠的企业级中文大模型；大模型存在封闭性，无法自动更新信息。

关于天壤如何解决大模型“一本正经的胡说八道”，薛贵荣表示：“用‘提示词’去控制大模型，大模型还是会胡说八道。后来，有人尝试输入一些简单的上下文，以及对大模型进行fine-tune，但这个也不够。我们为了解决‘幻觉’问题，做了一个语义搜索引擎。先把需要的所有文档，放到语义引擎里面，比如法律书、知识库或者企业内部各种数据。该引擎使用了一个核心技术，即embedding。”

薛贵荣进一步解释：“生成式模型，最大的特点就是结果的不确定性。”那么，如何提高生成式模型的准确性呢？

薛贵荣认为：“现在给你100个字，你的答案就在这100个字里面总结。”那么是否为了提高准确性，限定生成（内容）的范围？薛贵荣回答称：“你只能用这里面的内容，做一次理解上的修饰。”

据其介绍，上述限制是放在推理端。简而言之，就是训练好大模型，为了得出一个精确值，在推理端限定一个范围。

薛贵荣介绍称，目前公司主要有三个团队，一个专门训练大模型；第二个是Fine-tune，做行业专用模型；第三个是做应用提示。

对于天壤小白大模型通过什么算力训练的？薛贵荣表示：“我们（基础）大模型的算力是租的，比如租用苏州超算（的算力），上海像商汤（的算力）我们也租。它们（商汤）有1万多张A100。另外，我们家里也有大概300张卡，以3090为主。”

封面图片来源：视觉中国

大模型结果“真假难辨”如何解决？对话天壤创始人、CEO薛贵荣：用这个技术丨WAIC 2023

关联专题

版权声明