每经AI快讯,北京时间3月7日,谷歌和柏林工业大学的团队重磅推出了史上最大的视觉语言模型——PaLM-E,参数量高达5620亿(GPT-3的参数量为1750亿)。作为一种多模态具身视觉语言模型(VLM),PaLM-E不仅可以理解图像,还能理解、生成语言,可以执行各种复杂的机器人指令而无需重新训练。谷歌研究人员计划探索PaLM-E在现实世界场景中的更多应用,例如家庭自动化或工业机器人。他们希望PaLM-E能够激发更多关于多模态推理和具身AI的研究。(澎湃)
上一篇
冯仑因2857.38万被列为被执行人,回应称“系合同诈骗”
下一篇
顺威股份:目前公司经营范围暂无变化
每日经济新闻客户端
National Business Daily Mobile Version
特朗普称美伊有望“一两天内”达成协议;国际油价跌超7%,美三大股指涨超1%;7家电商平台被罚没近36亿元;张雪机车又拿下第二名丨每经早参
浪潮软件2025年业绩由盈转亏 营收下跌38.2%,超11亿元应收账款高悬
美以伊冲突50天迎重大转折!原油大跌,美股狂欢,霍尔木兹海峡全开却陷“罗生门”