4月10日下午,商汤在上海举办“2025技术交流日”活动,推出“日日新SenseNova V6”大模型体系。商汤董事长兼CEO徐立认为,大模型发展这么多年,其实已经用完互联网上大部分文本数据。也有观点预测,到2028年互联网上所有文本数据将被消耗完。不过,在徐立看来,这并不意味着整个知识(体系)都被消耗完了。
每经记者 朱成祥 每经编辑 陈俊杰
4月10日下午,商汤在上海举办“2025技术交流日”活动,推出“日日新SenseNova V6”(以下简称“日日新V6”)大模型体系。
商汤董事长兼CEO徐立认为,大模型发展这么多年,其实已经用完互联网上大部分文本数据。也有观点预测,到2028年互联网上所有文本数据将被消耗完。
不过,在徐立看来,这并不意味着整个知识(体系)都被消耗完了。徐立认为,很多知识都蕴藏在图像、视频或者3D模态中。但到目前为止,还没有完全把这些知识真正用来提升原来的文本,甚至是智力的能力,因为模态的融合没有做到那么好。
徐立认为,从人类学习的路径来讲,即使是知识的含量一样,多模态的学习方式可能效率会更高。从小到大学习数学、几何、物理、化学实验,甚至学习交通规则、玩游戏的说明书等都是多模态的,从数据量来讲,多模态是补充人类智能的核心要素,而从学习方法上也是更有效的。
关于商汤“日日新V6”,徐立表示,一些核心的指标,在纯文本和多模态的单任务和复杂任务的推理之上,商汤都居于行业前列。
徐立称,最早大家在做大模型的时候,领先的有OpenAI。但到今年,中国在很多情况下,能够同步发布出对标甚至超越美国同期发布的模型,这也是行业认知逐步刷新的一个必然结果。
值得注意的是,此次技术开放日,商汤也推出用于人形机器人领域的世界模型,并与傅利叶机器人达成合作。
对于机器人自主决策,傅利叶创始人顾捷表示,机器人现在类似于会走路的大模型。当机器人能够预测下一步动作,它就能产生大模型。但是,目前还不确定什么时候能够真正完成VLA(视觉语言动作模型),即语言、视觉和动作的打通。目前的卡点在于大模型的思考能力是慢性的,而机器人是快速走动的。快系统与慢系统的连接,是未来研究的方向。
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。