◎快手视频生成大模型可灵在一个月内迎来第三次重要升级——网页端上线。《每日经济新闻》记者从快手方面了解到,可灵推出了更加清晰的高画质版,以及首尾帧控制、镜头控制等新功能,单次生成的文生视频时长也增加至10秒。此外,快手图像生成大模型可图也宣布开源。
每经记者 王郁彪 每经编辑 杨夏
继“上新”图生视频、视频续写功能后,快手视频生成大模型可灵在一个月内迎来第三次重要升级——网页端上线。
《每日经济新闻》记者从快手方面了解到,可灵推出了更加清晰的高画质版,以及首尾帧控制、镜头控制等新功能,单次生成的文生视频时长也增加至10秒。此外,快手图像生成大模型可图也宣布开源。
在刚刚落幕的2024世界人工智能大会(WAIC)上,快手大模型家族也首次亮相,包括视觉生成大模型(可灵、可图)、快意语言大模型、推荐大模型为核心的大模型矩阵,覆盖内容理解、分发、生成等。
快手所搭建的大模型矩阵覆盖了从内容生成到商业化运营等方方面面。作为短视频平台的快手一方面通过AI技术,降低内容生产门槛,提高内容生产效率;另一方面,也积极地将AI技术运用于其电商业务中,帮助商家实现智能化经营,实现其商业化目标。
但在有限的注意力资源下,内容和商业之间不可避免地存在“互搏”,快手想用AI让它们“化敌为友”。
全面对标Sora,快手视频生成模型可灵面世以来热度不减。
快手方面数据显示,截至目前,已有超过50万用户申请可灵内测资格,视频生成数量有700万条。
可灵于6月初上线,当时只开放了文生视频功能。快手表示,可灵能够生成大幅度的合理运动,模拟物理世界特性,生成的视频分辨率达1080p,时长最长可达2分钟。随后,可灵又相继更新了图生视频、视频续写、多尺寸选择等功能。
本次随着上线网页端,可灵推出了更加清晰的高画质版,以及首尾帧控制、镜头控制等新功能。此外,单次生成的文生视频时长增加至10秒。
当时有多位互联网资深人士向记者表示,快手是最先推出比肩Sora的大模型产品的公司,是超出预期的。但其实,早在2023年初,快手就启动了新AI战略,在最近几次财报电话会议上,快手联合创始人兼CEO程一笑也多次谈及快手自研大模型的研究及应用进展。不过,当时在很多人看来,快手更侧重于短视频和社交内容,而非专业的视频剪辑工具。此前的大模型竞争中,快手也并不是引人关注的第一梯队成员。
与此同时,快手推出的大语言模型快意以及文生图大模型可图,市场关注度有限。但可灵的走红,让国内视频生成大模型赛道看到了对标Sora“弯道超车”的可能。
在刚刚落幕的WAIC大会上,快手带着以语言大模型快意、推荐大模型、视觉生成大模型(可图、可灵)为核心的大模型矩阵亮相。
语言、推荐、视觉,对应内容生产、理解、推荐等多层面,目前AI产品已实际运用于快手的业务运营中。据快手高级副总裁、主站业务与社区科学负责人盖坤介绍,快手推荐模型SIM参数规模已达到十万亿的参数规模,下一代推荐大模型架构ACT预估每天可为快手App带来4亿分钟的用户观看时长。
4亿分钟的时长增长,平台用户粘性、活跃度和吸引力,对整个快手生态的补足至关重要。但这也不只关乎内容生态,还有商业生态。
快手年报显示,其2023年全年总收入达1134.7亿元,同比增长20.5%,首次突破千亿规模;其中,线上营销服务板块年收入同比增长23%,达603亿元创新高。此外,快手电商全年GMV首次突破万亿规模达1.18万亿元,迈入国内电商年GMV万亿元俱乐部。
生意场,快手的“盘子”上升到了一个新的量级。需要考虑的问题自然也就越来越多。
比如,把内容转化为成交,一直以来都不是一个轻松的话题。特别是以快手、抖音为首的短视频平台,用户的停留判断,往往只有几秒。吸引注意力的驻足容易,但将这种注意力做延续、深入甚至转化却很难。
内容的质量、话题对感官的刺激是吸引注意力的关键,一旦平台开始过多追求商业化目标,内容的吸引力又会下降。特别是如今,互联网流量红利褪尽,内容与商业的“互搏”自然也会被进一步放大。
如何减少“互搏”?快手的答案是上AI工具。
比如,基于快意大模型构建视频脚本生成,直播实时脚本生成、广告线索客服,叠加数字人技术,进而生成低成本、高品质的视频和直播内容,做线索转化效率的提升。
更直观的数据是,相比今年1月,今年6月快手AIGC月活跃客户数增长了8倍,月GMV规模提升了64倍,平台AIGC广告收入规模提升了12倍。AI工具在应用层面,有一些阶段性的收效。
不过,对AI工具的使用上,“快手们”也设置了一些“红线”,比如数字人直播。
今年618前,刘强东数字人在京东采销直播间开播,618期间,也有数十位总裁数字人在京东开启直播。不过,对快手、抖音这样的还是以内容为主的平台,对数字人直播等AI工具的应用,会显得比较谨慎。
今年618期间,腾讯视频号修订《视频号橱窗达人发布低质量内容实施细则》征求意见,拟将“使用插件、AI等工具生成虚拟形象进行直播”分类为“非真实直播”下的“违规示例”。快手电商也针对使用外部AIGC数字人能力生成的录制直播内容严格按照“播放录制内容”规则管控。
上海财经大学数字经济系教授、数字商务研究中心主任崔丽丽此前曾通过微信告诉《每日经济新闻》记者,数字人形态以及带货形式,天然就是适合电商基因的平台,内容基因的平台对数字人非常审慎。
京东淘宝和抖音快手两方根本的逻辑区分,是前者为商品引流,后者则是内容引流。“数字人天然不是内容的好载体,但它是电商商品讲解的好工具。”她进一步补充说。
现阶段来看,大模型、AIGC工具,在内容理解、生成以及分发、推荐等方面,的确有奇效,但想做一个完美的经营工具,一定还有很长的路要走。AI产品早期的技术受限之外,转化涉及的是经营用户的注意力、情绪变化,这些都需要在更漫长的经营过程和流量周期下,寻找到真正的平衡。
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。