每经编辑 毕陆名
积弱已久的商汤(HK00020)今日硬气了一把,股价开盘即大涨,一路拉升,一度涨超36%。截至发稿,该股涨约31%,成交12.61亿港元。最新市值267亿港元。
市场目前将商汤今日股价大涨,归因于此前一日发布日日新5.0大模型,官网称其能力可以达到或者超过GPT-4 Turbo。
4月23日,商汤科技在上海举行的SenseTime技术交流日活动现场发布行业首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求,同时升级“日日新SenseNova 5.0”大模型体系,且称综合能力全面对标GPT-4 Turbo。
4月24日上午11点15分左右,商汤集团在香港暂停交易。
据第一财经,今日商汤方面对记者回应:昨日日日新大模型5.0发布会广受好评,受到市场极大关注;依照上市规则及港交所建议,公司将进一步刊发相关公告,敬请关注。
昨天商汤在上海发布“日日新SenseNova”5.0多模态大模型系列,采用混合专家(MoE)架构,支持多达10TB tokens中英文与训练数据,推理合成数据高达数千亿Token,推理时上下文窗口可以有效到200K左右,拥有端侧扩散和语言模型,知识、推理、数学、代码等综合能力全面对标GPT-4 Turbo。
在文科能力方面,“日日新5.0”的创意写作能力、推理能力以及总结能力均大幅提升,相同的中文知识注入后,可以获得更好的理解总结及问答,为教育、内容产业等垂直应用场景提供有力辅助。
据证券时报,商汤科技董事长兼CEO徐立在现场演示中,问了“日日新5.0”和GPT-4同一个趣味推理问题:“妈妈给圆圆冲了一杯咖啡,圆圆喝了半杯后,将它加满水,然后她又喝了半杯后,再加满水,最后全部喝完。问圆圆喝的咖啡多,还是水多?”结果显示,“日日新5.0”回答正确。
在理科能力方面,“日日新5.0”数理能力、代码能力及推理能力也达到业内领先水平,为金融、数据分析等场景落地提供坚实基础.
在应用产品层面,“日日新SenseNova5.0”也实现了多模态能力,支持高清长图的解析和理解以及文生图交互式生成,还可以实现复杂的跨文档知识抽取及总结问答展示,还具备丰富的多模态交互能力。
“一个生日蛋糕,上面写上‘happy birthday’的字样,有草莓点缀,紫色奶油”,在交流日体验现场,证券时报记者看到,工作人员在商汤日日新·秒画文生图大模型中输入这句话,片刻即可生成四幅逼真的生日蛋糕照片。徐立表示:“商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”
商汤科技表示,这是行业内首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求。公司技术领跑加速生成式AI向产业落地的全面跃迁,实现大模型按需所取。
商汤科技董事长兼CEO徐立认为,商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界,“2024年是端侧大模型爆发的一年”。
3月26日,商汤集团股份有限公司(以下简称“商汤集团”或“商汤”)公布截至2023年12月31日的经审核全年业绩。财报显示,2023年生成式AI业务增长超预期,收入达12亿元,同比增长200%。
“2023年,商汤生成式AI业务实现了同比200%的飞速增长,占总收入比例超过35%。生成式AI对商汤来说已不仅仅是技术领域的变革性创新,更成为公司的核心业务。”商汤集团董事会执行主席兼首席执行官徐立表示,商汤生成式AI业务的增长,得益于各行各业对大模型的训练和推理的广泛需求,这预示着中国硬科技投资的新周期正式开启。商汤通过在各业务层面深入融合生成式AI能力,正在赢得新客户,并推动效率和生产力的全面提升。
财报显示,2023年,商汤集团整体收入表现稳健,营业收入34亿元,同比下降11%,主要原因是集团主动收缩了智慧城市业务,智慧城市在2022年收入占比约30%,2023年已经降低到10%以内;毛利润为15亿元,毛利率44%。回款金额39亿元,同比增长49%。
对此,国投证券研报称,商汤推出日日新大模型5.0版本,采用混合专家架构,推理时上下文窗口达到200K左右,在数学、推理及代码能力上全面对标GPT-4 Turbo。此外,公司发布面向终端设备的“商汤端侧大模型”,以及面向金融、代码、医疗、政务等多个领域的边缘产品“商汤企业级大模型一体机”。至此,公司已经完成了大模型在“云端边”全栈布局,形成了全面的产品体系。
每日经济新闻综合第一财经、证券时报、公开信息
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。
封面图片来源:每日经济新闻 靳水平 摄
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。