12月26日,在“大模型技术发展与治理创新”研讨会上,多位专家、业内人士共同探讨了当前国内大模型市场面临的挑战。如今,大模型面临三大挑战:一是重生能力不足,二是原生程度不足,三是内生安全不足。业内人士指出,具身智能和端侧模型或成为未来发展趋势,行业正期待新应用破土而出。
每经记者 王郁彪 每经编辑 魏官红
无论是对应用和商业化进程的考量,还是对技术路径本身的争论与思考,相比于热潮刚刚袭来之时,近期,人工智能领域的从业者似乎感受到了一丝寒意。
“相比一年前,还能够坚持独立自研、做基础模型迭代的科技企业已经减少很多了。”12月26日,在“大模型技术发展与治理创新”研讨会上,阿里巴巴集团安全部总裁钱磊如此表示。
不过,国内大模型之间的竞争依然还在白热化阶段。北京市网信办副主任潘锋在研讨会上表示,当前大模型市场“百模大战”,但真正有竞争力的模型并不是很多,不少企业还没有找到可盈利的商业模式,面临比较大的生存压力。这些体现为“重生能力”的不足。
在潘锋看来,在对话搜索场景面临竞争红海的同时,自动驾驶、办公、教育、医疗等垂直领域加速释放潜能,还没被充分挖掘。
大模型的应用和商业化,目前仍是一道难解的大题,不过好在机会尚多。从生成式AI到智能搜索,再到AI Agent(智能体)、AI硬件,甚至具身智能,大模型应用领域层出不穷,单拎出来都是潜力无限的“大市场”。不过,资本和市场给出的排期越来越紧凑了⋯⋯
从技术热潮中逐步回归有关技术产品的应用和商业化考量,更理性看待大模型发展的进程,或许是当下各方需要做到的。虽然人工智能的研发和应用在持续推进,但大模型的发展从量变形成质变,依然挑战重重。
潘锋认为,除了上述提到的“重生能力不足”,还有两点挑战。一是原生程度不足。大量国产模型采用国外的开源架构进行训练,网上有一个说法,“国外一开源,国内就创新”,自主创新基础不牢,由于国外原生创新是用国外大量的语料进行培训,再加上国内高质量的语料和高性能的算力供给不足,导致距离国际顶尖水平还有一定差距。
二是内生安全不足。潘锋认为,传统大模型安全保障主要采用安全围栏方式,依靠过滤、打补丁等方法来限制模型的输入输出,没有从训练语料和模型架构方面真正解决内生的安全问题。因此,需要进一步研究大模型的相关机制,完善治理体系等。
针对大模型内生安全问题,钱磊以阿里的大模型举例表示,在数据采集、处理阶段强调源头管控,进行严格的数据筛选和数据安全标注,在模型训练和设计阶段通过添加安全语料,设置安全任务等方式,提升模型的内生安全能力。此外,在模型上线前也会进行全面安全评估,确保各类风险项目在生成内容上的合格率。
“在模型部署应用后,通过‘外围护栏’进一步提升大模型在应用场景中的安全性。我们会通过日常巡检验证结果是不是能够达到我们的预期,是不是可靠、可信、可用。”钱磊补充说。
“大模型研发有着比较高的技术门槛和资源门槛,相比一年前,还能够坚持独立自研、做基础模型迭代的科技企业已经减少很多了。”谈及市场现状,钱磊如此表示。
针对阿里的大模型技术路径,《每日经济新闻》记者了解到,阿里主张云和AI的协同发展,强调云从IT(信息化)和DT(数字化)的基础设施,向人工智能基础设施方向演进。
对于后续投入,钱磊表示,一是会提高自研基础模型通义系列的能力,二是会通过完善AI基础设施和相关支撑系统,降低模型应用开发的成本。
数据显示,过去一年,通义千问的API调用价格下降了97%。开源方面,全球开发者基于通义开源模型的二次开发衍生模型达到了7.8万个。
对于大模型应用趋势,中国电子技术标准化研究院大模型安全标准负责人张妍婷表示,一个是端侧模型,例如无人驾驶汽车里,端侧的类脑模型可以处理大量的实时多模态传感数据,辅助做一些比较快速的驾驶决策,从而不需要依赖云端的算力,同时解决了实时性和隐私性问题。
另一个是具身智能。其特色就是用机器去跨越从感知到行动的边界,进而促进通用人工智能的发展。“因为它可以通过身体和环境动态交互获取信息,同时结合大模型的强大能力,实现感知、推理和行动的一个闭环,为通用人工智能提供了一种行动和感知的结合能力。”张妍婷解释道。
今年上半年,行业就“通用大模型还是垂直大模型”展开争论,临近年末,有关AI、大模型产品应用层面的消息不断。而面对市场环境的变化,加之技术产品本身进程的推移,初创公司“出圈”的窗口期越来越近,更具战略运营能力、生态建设完善的大厂也在不断“武装”。
12月17日智谱官宣30亿元新融资后,同为大模型“六小虎”的阶跃星辰也宣布完成数亿美元B轮融资。现阶段,大家都处在筹备阶段,市场也在等着一个破土而生的新应用、新产品到来。
封面图片来源:每经记者 张涵 摄
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。