Небольшой туториал по нейросети Jukebox...

2 years ago

Небольшой туториал по нейросети Jukebox ai которая может продолжать ваши музыкальные композиции

Первое переходим по этой ссылке на гуггл колаб One Click Jukebox with Autosave v2.ipynb - Colab (google.com) : теперь не обязательный пункт но если его сделать в последующие разы не надо ждать установки модели которые весят примерно 13 гб если это самые большие или 4 гб если выбрать маленькие модельки :

теперь заходим на ваш гугл диск и нажимаем на новый создавшиеся файл :

теперь переходим к основным пунктам :

из за того что Jukebox ai это слишком мощная нейросеть то она делается на серверах гугла.Каждый день даётся по 6 часов пользованию серверов но так вот подключаемся к графическому ускорителю Tesla T4:

теперь если вы не копировали сам блокнот на гугл диск то вылезет это окошко то нажимаем выполнит

теперь если ваш музыкальный отрывок или песня со словами то удаляем все слова из your_lyrics и заменяем на свои если нету слов то просто удаляем все слова после этого нажимаем на кнопку которая показана на фотографии :

Теперь переходим к самому сладкому ,к настройки :

model - обозначает какую модель выберем маленькая модель по 1 гб это 1b_lyrics ,а большие 5b_lyrics, 5b.Приписка lyrics обозначает ли поддерживает ли модель lyrics (текст песни) и от этого зависит будет ли тарабарщина или нет .

hps. name - папка в которой будет хранится наши продолженные песни .Если у вас сломалась генерации то она сохраняется в ту папку которую вы показали то можно указать туже папку и те же настройки то можно продолжить генерацию продолжения.

audio_file - это путь вашего аудио файла .Пока мне известно что поддерживает .wav и .mp3.

prompt_length_in_seconds - это сколько секунд будет воспроизводится оригинальное аудио в начале и это будет ещё использоваться как подсказка для нейросети что бы она понимала более точно как продолжать.

sample_length_in_seconds - это размер продолжения музыки .Я бы порекомендовал максимум делать продолжение 200 секунд и то с продолжением генерации.А если хотите что бы без продолжения генерации то 100 секунд и менее

select_artist - в каком стиле артиста будет генерироваться продолжение аудио

select_genre - это стиль генерированного продолжения

И ещё немного насчёт моделей думаю для просто рофельного продолжения или не особо важного пойдёт модель 1b_lyrics ,а если к более серьёзному то 5b_lyrics или 5b и также на видео показано как загружать свои аудио файлы в гугл колаб и как копировать путь

Ладно настройки мы прошли теперь к генерации.Нажимаем на старт скрипта :

теперь скрипт просит разрешение к подключению для вашего гугл диска

теперь выбираем наш аккаунт потом далее далее и генерация запустилась .Сначала качаются модели потом начинается генерация .Она ОООООЧЕНЬ долгая 100 секунд по 2 часа при большой модели но генерация зато прикольная и так же.НЕ ВОЛНУЙТЕСЬ ЧТО В ПАПКАХ ТАМ level_2 И level_1 БОЛЕЕ ШАКАЛЬНОЕ АУДИО.ПОТОМУ ЧТО НЕЙРОСЕТЬ ПОД КОНЕЦ БУДЕТ УЛУЧШАТЬ КАЧЕСТВО МУЗЫКИ И БУДУТ КИДАТЬСЯ В ПАПКУ level_0 .НО НА ВСЯКИЙ СЛУЧАЙ ПРОВЕРЯЙТЕ ОСТАЛЬНЫЕ ПАПКИ ТАМ ТОЖЕ ИНОГДА БУДУТ ПОЯВЛЯТЬСЯ ПОЧТИ ХОРОШИЕ АУДИО ПО КАЧКЕСТВУ