每日经济新闻

    一首歌仅需0.1元,Suno等音乐大模型引发业内新焦虑|大模界

    每日经济新闻 2024-04-11 11:56

    “大模界”是每日经济新闻推出一档专注生成式AI与大模型技术的前沿科技报道栏目。

    在这里,我们将聚焦生成式AI技术浪潮,展现从文字、图像、音频、视频的大模型如何编织数字化世界。

    在这里,我们将解码、评测国内外各类大模型,探究它们如何成为变革各行各业的重要力量。

    在这里,我们将关注AIGC行业发展,联手行业领军人物和顶尖专家,共同揭示最新产品创新和技术突破,前瞻未来发展趋势。

    欢迎关注“大模界”,您将见证AIGC如何重塑内容生态,如何以前沿之力推动社会进步。让我们共同开启一场关于AI新纪元的无限旅程!

    每经记者 毕媛媛  宋美璐    每经编辑 梁枭    

    “改变是潜移默化的,可能就在某个平凡的日子,一首触动心灵的歌曲闯入你的生活,当你深入了解其源头时,发现那是AI写的,那时候浪潮就悄悄来临了。”伯雅文娱创始人、唱作人范志昊说道。这位音乐制作行业的资深人士正致力于探索AI在音乐创作中的辅助作用。“总有人会做这些事,你永远无法阻挡历史车轮的脚步。”

    Suno上生成的关于猫的音乐 很热门 图片来源:Suno截图

    近来,SunoV3等音乐AI技术的诞生,如同一股强劲的暗流,冲击着传统音乐行业的壁垒,引发了众多音乐从业者对未来职业前景的忧虑,他们同时也在思考如何在AI时代中找到自己的位置。

    六间房视频集团创始人、Bit Computing Pte.Ltd.创始人/CEO刘岩如今正在开发一款音乐大模型,他在接受《每日经济新闻》记者电话采访时表示:“当前市面上部分被冠以‘音乐大模型’之名的产品,其实并未达到严格意义上大模型的标准。音乐大模型因其更高的技术门槛、更窄的应用场景,或不会出现大规模爆发的情况,但有可能超越国外成为全球领先。”

    一首歌仅需0.1元,大模型时代音乐创作门槛大幅降低

    自今年3月以来,国内外涌现出大量AI生成式音乐工具,行业格局在一夜之间发生了翻天覆地的变化。

    此前,OpenAI的MuseNet、谷歌的MusicLM以及Meta的MusicGen等AI音乐项目已经引起了业界广泛关注。而如今,一款名为Suno的“音乐版ChatGPT”音乐大模型点燃了全球音乐界的热情。因为这款模型能够一次性完成歌词、演唱、编曲、配乐等音乐创作的全过程,因此被誉为“消灭”了音乐创作门槛。

    音乐制作人闫东炜在第一时间试用了Suno,他兴奋地表示:“输入几个关键词,不到一分钟就能生成了。”然而,他也指出了Suno的局限性:虽然借助AI可以找音乐灵感,但听多了感觉出来的基本都是流行歌。未来抖音上的歌可能会越来越相似,像流水线一样生产。如果要不断地坐在电脑前输入关键词来生成歌曲,这个过程可能会显得有些无聊。

    尽管如此,Suno仍然获得了不少业内人士的高度评价。范志昊评价:Suno生成的音乐是有下限的,它的创作至少听着顺耳。

    Suno上生成的另一首关于猫的音乐 收听量超过1万+ 图片来源:Suno截图

    范志昊表示,可以借助AI预测音乐内容,并帮助公司找到合适的歌手。此外,AI还降低了音乐创作的门槛,让更多人能够享受到创作的乐趣。“本来听到好的作品会有共鸣,但如果变成自己去写,快乐是不一样的。这个市场的潜在需求非常大。”范志昊坦言。

    AI音乐引发热潮的另一个重要原因在于使用门槛和价格的降低。以闫东炜使用过的一款AI音乐工具为例,基础版免费,PRO版价格大约是10美元一个月,能生成500首歌;更高级的版本只需30美元一个月,就能生成约2000首歌。这意味着,一首AI歌曲的成本仅需0.1元左右。

    范志昊表示:“原先找专业作曲人创作歌曲的成本很高,即使是友情价也得是千元以上。但现在有了AI,几十块钱就能生成上百条音乐作品,价格差距非常大。”他还提到,如果机器不排队的话,几乎可以即刻生成一个词曲的demo(样片)。

    AI音乐并非完美无缺。闫东炜认为,AI可以创作,但不善于修改。每次修改完都完全不一样,因此较为复杂的歌曲客户还是会找人工来做。尽管如此,他认为AI音乐在技术上已经高过很多网络上的口水歌。

    范志昊也坦言,国内的AI工具和Suno相比仍有一定差距。虽然音乐AI能够生成各种风格的歌曲,但水平却参差不齐。其中,pop和爵士风格相对较为出色。pop风格之所以让人惊喜,是因为其训练数据丰富,结构相对可复制;而爵士风格则因为能写出好风格的人本身就比较少,所以显得尤为亮眼。

    246名知名音乐人联署公开信,AI会取代音乐人?

    据媒体报道,当地时间4月2日,200多名国际乐坛知名音乐人联署公开信,呼吁AI开发者、科技公司、平台和数字音乐服务商停止使用AI侵犯及贬低人类艺术家的权利,要求他们承诺不开发与之相关的AI音乐生成技术等,也不能拒绝向艺术家提供合理报酬。参与联署的艺人共有246名,大多来自欧美乐坛,其中包括比莉·艾利什(Billie Eilish)、凯蒂·佩里(Katy Perry)、妮琪·米娜(Nick Minaj)等。

    妮琪·米娜 图片来源:环球音乐官网

    近年来,AI音乐生成技术迅速发展,一系列以“AI歌手”为名的翻唱作品在网络上走红。例如,“AI孙燕姿”翻唱的《发如雪》、“AI王心凌”翻唱的《套马杆》等视频,播放量均超过百万。随后,“AI周杰伦”“AI林俊杰”“AI许嵩”等“歌手”也如雨后春笋般涌现。

    相关技术的普及也引发了社会各界的担忧。许多行业人士担心,AI的广泛应用可能会危及他们的生计和职业发展。对此,闫东炜表示,虽然AI对音乐创作者的影响有限,但确实降低了普通人进入音乐创作的门槛,这可能会对整个音乐行业产生一定的冲击。“流行歌手不会失业,粉丝喜欢的是这个人,他唱得好,有作品更好。”

    闫东炜进一步解释说,现在客户只需将需求发送给AI,便能快速生成音乐作品,这在一定程度上减少了对传统音乐制作公司的需求。然而,他也强调,AI生成的音乐往往结构单一,对于专业领域的需求帮助有限。音乐制作人仍需要根据客户需求进行后期的修改和调整,以确保作品的质量和独特性。

    “AI最先替代的就是艺术家,人工智能可以体验无数次恋爱、失恋、死亡,因此他会比人更有情感,AI在其他领域最大的问题是‘幻觉’,可能会造成误判,但这种‘幻觉’在艺术上就可能是突破和创新。”刘岩说。

    范志昊表示,AI对音乐行业的影响是双面的。它既可以降低创作门槛,让更多人能够尝试音乐创作;也可能导致一部分人的工作被AI替代,尤其依赖简单创作和翻唱的艺人可能失去工作机会,例如有些唱demo的歌手已经被替代了。

    “AI对音乐人的冲击并不是直接的竞争,而是潜移默化的竞争。AI音乐的普及可能会改变音乐人的职业发展方向。”在范志昊看来,未来,音乐人可能更需要注重个人IP的经营和发展,而非仅仅依赖于网络歌曲的翻唱和创作。

    此外,范志昊还提到了未来音乐产业的发展趋势。他表示,随着音乐产量的不断增加,每年人们能够听到的歌曲数量已经远远超过了他们的消化能力。AI的出现进一步加剧了音乐市场的竞争,抢占了原有的音乐空间。这导致一些认真做曲库、做内容的音乐人可能会受到影响,他们的作品可能会因为AI的普及而被淹没在海量的音乐中。

    对于AI音乐对传统市场的冲击问题,刘岩也表达了自己的看法。他认为,AI音乐生成技术能够在短时间内产生大量歌曲,以目前能力和需求看,一年后,市场上90%的歌曲可能都是AI生成的了,传统意义上的“新歌”可能连1%的比例都占不到了,仅从数据上看,行业的格局一定会被打破。

    “黑盒”是小公司跟大厂竞争的壁垒

    音乐大模型的发展正处于一个关键时期。继Suno之后,国内的科技公司也不甘落后,昆仑万维推出了“天工SkyMusic”,发布的9首由“天工SkyMusic”生成的音乐作品,展示了从说唱到古风等多种风格的音乐创作能力,这些作品的时长从10秒到51秒不等。

    一年前,刘岩和他的团队就敲下音乐大模型开发的第一行代码,决心布局该行业。在他看来,音乐大模型相较于文字和视频大模型,面临着更高的技术门槛。“音乐和视频一样是一种长时序的技术形式,如果说视频可以分成每一秒钟24帧图像的话,音乐则每一秒钟包含上万个采样点,且每个采样点之间的相关性强,这使得音乐成为最复杂的模态之一。”

    刘岩进一步阐述道,当前市面上部分被冠以“音乐大模型”之名的产品,其实并未达到严格意义上大模型的标准。一些作品的生成依赖于音乐结构和规则的技术,或是通过将音乐转化为MIDI等符号语言再进入模型来实现,这种方式虽然能够产生近人类水平的音乐,但不能触及音乐的本质——对音乐情感、内涵及整体结构的理解与创造性表达,永远不会超越现有音乐的水平。

    “真正意义上的音乐大模型应当具备端到端的学习能力,训练数据直接来源于日常聆听的完整音乐作品而非翻译后的MIDI,并能够从构思歌词、设计旋律、编排伴奏直至模拟人声演绎等全过程进行一体化的创作。遗憾的是,当前大多数模型仅在音乐创作的旋律和伴奏等某一个环节上取得进展,尚未实现全方位的音乐生成。”刘岩说。

    目前用户无法透视模型的内部逻辑,只能看到其外在表现。刘岩认为,AI这一天然的“黑盒”效应,让音乐大模型出现了不少鱼目混珠的情况。然而,“黑盒”效应也为中小企业和创业团队带来了独特的发展机遇。

    Suno生成了大量各类音乐 图片来源:Suno截图

    范志昊早在半年前就开始集结团队,专注于研究音乐AIGC辅助生态。他认为,“黑盒”是小公司跟大厂竞争的唯一的壁垒,因为互联网产品的运作逻辑可以轻易被剖析和模仿,而AI则不然,这就要求开发者投入更多的心血与专注。在他看来,这不是大厂有钱就可以做好的。“除非他一下子砸很多钱进去,但这又不是一个潜力特别大的市场。”

    与语言大模型广泛应用于多元场景不同,音乐大模型从诞生之初便瞄准了特定的应用场景——降低音乐创作门槛,使以往专业音乐人才方能完成的工作,如今普通人借助大模型只需通过自然语言描述就能得到高质量的歌曲作品。

    这一点使音乐大模型在特定领域具有一定的市场潜力。刘岩认为:“语言大模型我们很难超越,但音乐大模型我们可以把它做成全世界最好的模型。”

    版权声明

    1本文为《每日经济新闻》原创作品。

    2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。

    上一篇

    注意!中汽股份将于4月26日召开股东大会

    下一篇

    菲律宾棉兰老岛发生5.2级地震



    分享成功
    每日经济新闻客户端
    一款点开就不想离开的财经APP 免费下载体验