用大模型写歌，豆包上线音乐生成功能字节再补一块AI拼图

AI时代，写一首歌的时间也许只需按秒计算。

8月8日，《每日经济新闻》记者了解到，字节跳动旗下智能AI助手豆包已上线音乐生成功能。用户在豆包的“音乐生成”中输入主题或自己写的歌词，设定音乐风格、情绪及音色，便能快速生成一首约1分钟的词曲。

《每日经济新闻》记者使用该功能发现，目前豆包音乐生成功能提供民谣、嘻哈、R&B等11种音乐风格，其中还涵盖了爵士、雷鬼、电音等相对小众的曲风，用户可选择男声或女声演唱。

为让AI音乐更好地贴合普通用户的情感表达，豆包还预设了快乐、伤感等多种情绪状态。同时，生成歌曲支持一键分享至抖音等社交平台。

事实上，AI生成式音乐大模型已有先例。今年3月，科技公司Suno推出了AI音乐工具SunoV3，一度被外界视为“音乐界的ChatGPT”，该款大模型能够一次性完成歌词、演唱、编曲、配乐等音乐创作的全流程。5月末发布的最新3.5版本已支持所有用户制作4分钟的歌曲，创建最长2分钟的歌曲扩展。

《每日经济新闻》记者了解到，现阶段，豆包生成的音乐时长不超过1分钟，歌词字数不超过200。豆包相关负责人表示，音乐生成能力刚刚推出，还有各种待完善之处。豆包希望，这个功能可以激发更多人的创造力，让他们以音乐的形式表达自己的心情，分享自己的故事。

在新增音乐功能的同时，豆包的主力模型和多个垂类模型均在今年5月首次亮相后进行了升级迭代。

在7月25日的火山引擎2024“AI创新巡展”首站成都站上，豆包模型家族正式发布了“新成员”豆包·图生图模型。该模型能力已经在抖音、剪映、豆包、星绘等字节系App中落地，并通过火山引擎服务了三星、努比亚等企业客户，目前日均图生图数量达到数千万张。

此外，字节也没有忽略在AI视频生成工具上的投入。8月6日，字节跳动旗下剪映团队研发的一站式AI创作平台“即梦AI”移动版正式上架至苹果App Store应用商店，该应用目前拥有文生图和文/图生视频等功能。

官方数据显示，截至7月，豆包大模型日均Tokens使用量已突破5000亿，平均每家企业客户日均Tokens使用量较5月15日模型发布时期增长22倍。

关联专题