“坚持做基础模型迭代的企业减少很多了” 大模型应用迫在眉睫，但“从量变到质变”仍面临三重挑战

无论是对应用和商业化进程的考量，还是对技术路径本身的争论与思考，相比于热潮刚刚袭来之时，近期，人工智能领域的从业者似乎感受到了一丝寒意。

“相比一年前，还能够坚持独立自研、做基础模型迭代的科技企业已经减少很多了。”12月26日，在“大模型技术发展与治理创新”研讨会上，阿里巴巴集团安全部总裁钱磊如此表示。

不过，国内大模型之间的竞争依然还在白热化阶段。北京市网信办副主任潘锋在研讨会上表示，当前大模型市场“百模大战”，但真正有竞争力的模型并不是很多，不少企业还没有找到可盈利的商业模式，面临比较大的生存压力。这些体现为“重生能力”的不足。

在潘锋看来，在对话搜索场景面临竞争红海的同时，自动驾驶、办公、教育、医疗等垂直领域加速释放潜能，还没被充分挖掘。

大模型的应用和商业化，目前仍是一道难解的大题，不过好在机会尚多。从生成式AI到智能搜索，再到AI Agent（智能体）、AI硬件，甚至具身智能，大模型应用领域层出不穷，单拎出来都是潜力无限的“大市场”。不过，资本和市场给出的排期越来越紧凑了⋯⋯

“从量变到质变”仍面临三重挑战

从技术热潮中逐步回归有关技术产品的应用和商业化考量，更理性看待大模型发展的进程，或许是当下各方需要做到的。虽然人工智能的研发和应用在持续推进，但大模型的发展从量变形成质变，依然挑战重重。

潘锋认为，除了上述提到的“重生能力不足”，还有两点挑战。一是原生程度不足。大量国产模型采用国外的开源架构进行训练，网上有一个说法，“国外一开源，国内就创新”，自主创新基础不牢，由于国外原生创新是用国外大量的语料进行培训，再加上国内高质量的语料和高性能的算力供给不足，导致距离国际顶尖水平还有一定差距。

二是内生安全不足。潘锋认为，传统大模型安全保障主要采用安全围栏方式，依靠过滤、打补丁等方法来限制模型的输入输出，没有从训练语料和模型架构方面真正解决内生的安全问题。因此，需要进一步研究大模型的相关机制，完善治理体系等。

针对大模型内生安全问题，钱磊以阿里的大模型举例表示，在数据采集、处理阶段强调源头管控，进行严格的数据筛选和数据安全标注，在模型训练和设计阶段通过添加安全语料，设置安全任务等方式，提升模型的内生安全能力。此外，在模型上线前也会进行全面安全评估，确保各类风险项目在生成内容上的合格率。

“在模型部署应用后，通过‘外围护栏’进一步提升大模型在应用场景中的安全性。我们会通过日常巡检验证结果是不是能够达到我们的预期，是不是可靠、可信、可用。”钱磊补充说。

大模型应用迫在眉睫

“大模型研发有着比较高的技术门槛和资源门槛，相比一年前，还能够坚持独立自研、做基础模型迭代的科技企业已经减少很多了。”谈及市场现状，钱磊如此表示。

针对阿里的大模型技术路径，《每日经济新闻》记者了解到，阿里主张云和AI的协同发展，强调云从IT（信息化）和DT（数字化）的基础设施，向人工智能基础设施方向演进。

对于后续投入，钱磊表示，一是会提高自研基础模型通义系列的能力，二是会通过完善AI基础设施和相关支撑系统，降低模型应用开发的成本。

数据显示，过去一年，通义千问的API调用价格下降了97%。开源方面，全球开发者基于通义开源模型的二次开发衍生模型达到了7.8万个。

对于大模型应用趋势，中国电子技术标准化研究院大模型安全标准负责人张妍婷表示，一个是端侧模型，例如无人驾驶汽车里，端侧的类脑模型可以处理大量的实时多模态传感数据，辅助做一些比较快速的驾驶决策，从而不需要依赖云端的算力，同时解决了实时性和隐私性问题。

另一个是具身智能。其特色就是用机器去跨越从感知到行动的边界，进而促进通用人工智能的发展。“因为它可以通过身体和环境动态交互获取信息，同时结合大模型的强大能力，实现感知、推理和行动的一个闭环，为通用人工智能提供了一种行动和感知的结合能力。”张妍婷解释道。

今年上半年，行业就“通用大模型还是垂直大模型”展开争论，临近年末，有关AI、大模型产品应用层面的消息不断。而面对市场环境的变化，加之技术产品本身进程的推移，初创公司“出圈”的窗口期越来越近，更具战略运营能力、生态建设完善的大厂也在不断“武装”。

12月17日智谱官宣30亿元新融资后，同为大模型“六小虎”的阶跃星辰也宣布完成数亿美元B轮融资。现阶段，大家都处在筹备阶段，市场也在等着一个破土而生的新应用、新产品到来。

封面图片来源：每经记者张涵摄

“坚持做基础模型迭代的企业减少很多了” 大模型应用迫在眉睫，但“从量变到质变”仍面临三重挑战

“从量变到质变”仍面临三重挑战

大模型应用迫在眉睫

关联专题

版权声明