AI原生应用要能解决过去解决不了或解决不好的问题,而不是对移动互联网APP和PC软件的简单重复,应该满足三个基础条件:能够用自然语言交互;充分利用大模型的理解、生成、推理、记忆等能力;每个应用的交互不超过两级菜单,交互会更简单。
随着科技的不断发展,越来越多的科幻场景变成现实。近年来,人工智能是新一轮科技革命和产业变革的战略性技术,正在深刻地影响着社会经济和文化。当下,以大语言模型(Large Language Model,LLM,下称“大模型”)为代表的人工智能技术重塑着千行百业,产业应用的创新机会也不断涌现。
OpenAI发布ChatGPT后,引发了国外大模型浪潮,国内科技公司也纷纷上线大模型产品。
3月16日,百度率先邀请内测“文心一言”,作为全球大厂中首个发布的生成式AI产品,更在8月31日率先面向全社会开放。阿里巴巴在4月紧随其后发布大模型“通义千问”,之后腾讯推出“混元”,华为推出“盘古”……“百模大战”不断升级。赛迪顾问发布的《2023大模型现状调查报告》显示,截至2023年7月,中国累计有130个大模型问世。就在近日,又有消息称百度的文心大模型4.0正在加紧训练,已接近可发布状态,是国内目前首次使用万卡集群训练的大模型,参数规模预计突破万亿级别。
大模型是什么?将如何影响我们的生活?
2023成都世界科幻大会开幕前夕,红星新闻、每日经济新闻联合启动“幻响未来,全球追光”大型融媒体采访报道。红星新闻记者就这一话题专访了百度科技与社会研究中心主任余欢。
图据文心一言APP
余欢表示,大模型极大压缩了全球的知识,并在参数达到一定规模后出现了“智能涌现”的现象,大语言模型具备了理解、生成、逻辑、记忆等人工智能的核心基础能力,为通用人工智能带来曙光。未来,大模型会成为一个通用的赋能平台,金融、能源、媒体、政务等各行业各领域都可以基于大模型实现智能化变革,推动中国人工智能产业加速发展,促进科技进步、产业升级和生产力整体跃迁。
余欢介绍,文心大模型的创新技术在于知识增强、检索增强和对话增强。“知识增强”方面,百度花了10余年时间构建了全球最大的、超过5500亿知识的知识图谱,通过训练过程的知识内化和推理过程的知识外化使大模型表现出更好的理解能力;“检索增强”可以帮助大模型提升时效性和准确性;“对话增强”则通过记忆机制、上下文理解和对话规划,使大模型在对话的连贯性、合理性和逻辑性方面都有着优异的表现。
大模型研发是一场“马拉松”,竞跑的关键在于应用场景的落地。余欢表示,大模型正成为第四次工业革命重要的驱动力量,人工智能已经在千行百业迅速落地,具备了标准化、自动化和模块化的工业大生产特征,使得很多原来无法被满足的中长尾需求可以得到满足。
“大模型最大的机会在其催生的各类AI原生应用。”余欢告诉红星新闻,今年百度创始人、董事长兼首席执行官李彦宏提出,大模型本身不直接产生价值,应用才是大模型存在的意义。AI原生应用要能解决过去解决不了或解决不好的问题,而不是对移动互联网APP和PC软件的简单重复,应该满足三个基础条件:能够用自然语言交互;充分利用大模型的理解、生成、推理、记忆等能力;每个应用的交互不超过两级菜单,交互会更简单。
不可否认,大模型的可控、安全至关重要。余欢指出,大模型的安全应该是全方位的,既包括数据准备阶段,也包含模型的训练和推理阶段。除了数据和内容本身外,还包括模型、系统等多个方面。
大模型能让哪些前几年看来还是科幻小说的场景变成现实?余欢认为,大模型使得原来我们每个人都希望能配备一个懂你的“专属助理”的幻想逐渐成为现实。由于大模型超强的理解能力和记忆能力,它可以更好理解你的意图,并且通过记住你原来的习惯和偏好,更好地定制化服务于你。
“大模型还使得我们每个人都可能具备原来没有的能力。比如,一个不会写小说的程序员,通过适当的prompt(提示、引导),可以写出一篇优秀的长篇小说;不会维修设备的某个新人,通过大模型的识图、理解、知识提取和生成,可以维修好复杂的设备。”余欢表示,大模型还可能使每个人都拥有自己的数字分身,在同一时间代表自己做原来不擅长或没有时间处理的事务。
据悉,以“生成未来”为主题的百度世界将于10月17日在北京首钢园举行,会上百度将发布多款“AI原生应用”。
红星新闻记者 蒋紫雯 俞瑶