Группа The Velvet Sundown за месяц набрала более миллиона слушателей на Spotify. После этого ее создатели неожиданно признались, что все творчество коллектива — продукция нейросети. Разбираемся, как создавать популярные песни с нуля с помощью искусственного интеллекта.
Как это работает
Музыкальные нейросети относятся к генеративным моделям ИИ. Это означает, что они способны не только находить и анализировать уже имеющуюся информацию, но и творить, создавать что-то уникальное на основе того, чему их научили разработчики.
Процесс обучения ИИ в данном случае может быть примерно таким: нейросети дают «послушать» огромное количество песен определенных жанров и «почитать» статьи об их характерных особенностях, и вот она «играет джаз».
Какие нейросети самые популярные
Самыми популярными на сегодня ИИ-инструментами для создания музыки можно назвать Suno, Udio и Riffusion. На самом деле их больше, но у тройки лидеров больше всего пользователей.
При этом поводов для обращения к помощи музыкальной нейросети может быть множество: корпоративный гимн, колыбельная для ребенка, софт-рок баллада в духе 60-х, как в случае с The Velvet Sundown – со всем этим может помочь ИИ. Главное – правильно поставить задачу.
Что такое промт
После того, как творческая задача сформулирована в голове, ее нужно объяснить нейросети. Для этого в специальном окошке сервиса нужно написать соответствующий промт – своего рода техническое задание для ИИ. Чем точнее и подробнее оно будет, тем более соответствующий ожиданиям результат получит пользователь.

«Там мы пишем через запятую нужные теги: общее настроение, примерные музыкальные жанры и темп, какую-то историю, которую должна рассказать песня — все, что в голову придет», — рассказал порталу Sibnet.ru музыкант, педагог студии музыкального продюсирования «Я=музыка» кемеровской Школы креативных индустрий Алексей Баранов.
«Песня о тайной встрече Android-телефона и iPhone, рок-опера», – такой необычный промт среди прочих указан в качестве примера на сайте Udio.Если у пользователя есть конкретная идея – написать песню в определенном жанре с четкой структурой и длительностью, то придется прописать теги более точно. Подсмотреть их, по словам эксперта, можно в треках других юзеров.
Не стоит указывать в промте имена конкретных исполнителей и названия групп в качестве ориентира – в таком случае музыкальная нейросеть откажется работать и выдаст ошибку.
На одном языке
Популярные нейросети понимают промты на русском языке. Тем не менее, эксперт советует формулировать задачу на английском. Для этого можно воспользоваться стандартным гугл-переводчиком или другой нейросетью, например, бесплатной версией ChatGPT.

Текст песни, если он нужен, в Suno будет по умолчанию сгенерирован на том же языке, на котором сформулирован запрос. Udio в ответ на промт на русском предложит две версии: русскоязычную и англоязычную. В Riffusion то, что песня должна быть на русском языке, придется отдельно прописать в промте. Также можно вставить собственный текст.
Как быть с текстом
Если слова будущего хита уже есть, их нужно вставить в отдельное поле, разбив тегами на куплеты и припевы, и указать, какой вокал нужен: мужской или женский.
В ситуации, когда есть только наброски текста, можно задействовать ChatGPT, попросив его написать стихотворный текст на основе нескольких готовых строчек. После этого стихи электронного поэта можно предложить цифровому композитору и певцу в одном «лице».
По мнению Баранова, уровень владения русским языком у музыкальных нейросетей пока оставляет желать лучшего, из-за чего ударения в некоторых спетых словах могут быть поставлены неверно. Избежать этого можно, используя заглавные буквы.
Пример песни, созданной с помощью нейросети
Платные функции
Все популярные музыкальные нейросети имеют бесплатные и платные версии. В первом случае пользователю предоставляют лишь базовый набор функций и ограниченное количество генераций, которые возобновляются через сутки.

Предоставляемый за деньги инструментарий значительно шире. Помимо неограниченного количество генераций, пользователь получает возможность менять части песни местами или разбивать сгенерированный трек на стемы: изолированные партии вокала, гитар и барабанов.
Кроме этого, только с подпиской пользователю передаются все авторские права на песни, созданные нейросетью. Это может иметь значение, если автор собирается каким-либо образом монетизировать свое нейротворчество, например, загрузив его на стриминги.
