Loading...
65
7 months ago

Небольшой туториал по нейросети Jukebox ai которая может продолжать ваши музыкальные композиции


Первое переходим по этой ссылке на гуггл колаб One Click Jukebox with Autosave v2.ipynb - Colab (google.com) : теперь не обязательный пункт но если его сделать в последующие разы не надо ждать установки модели которые весят примерно 13 гб если это самые большие или 4 гб если выбрать маленькие модельки :

msedge_ybdj8ydz4q.png

теперь заходим на ваш гугл диск и нажимаем на новый создавшиеся файл :

msedge_zcoen33sqv.png

теперь переходим к основным пунктам :

из за того что Jukebox ai это слишком мощная нейросеть то она делается на серверах гугла.Каждый день даётся по 6 часов пользованию серверов но так вот подключаемся к графическому ускорителю Tesla T4:

msedge_1io2yfgjhi.png

теперь если вы не копировали сам блокнот на гугл диск то вылезет это окошко то нажимаем выполнит

msedge_7rykpwva8p.png

теперь если ваш музыкальный отрывок или песня со словами то удаляем все слова из your_lyrics и заменяем на свои если нету слов то просто удаляем все слова после этого нажимаем на кнопку которая показана на фотографии :

msedge_bfrbzynq8q.png

Теперь переходим к самому сладкому ,к настройки :

model - обозначает какую модель выберем маленькая модель по 1 гб это 1b_lyrics ,а большие 5b_lyrics, 5b.Приписка lyrics обозначает ли поддерживает ли модель lyrics (текст песни) и от этого зависит будет ли тарабарщина или нет .

hps. name - папка в которой будет хранится наши продолженные песни .Если у вас сломалась генерации то она сохраняется в ту папку которую вы показали то можно указать туже папку и те же настройки то можно продолжить генерацию продолжения.

audio_file - это путь вашего аудио файла .Пока мне известно что поддерживает .wav и .mp3.

prompt_length_in_seconds - это сколько секунд будет воспроизводится оригинальное аудио в начале и это будет ещё использоваться как подсказка для нейросети что бы она понимала более точно как продолжать.

sample_length_in_seconds - это размер продолжения музыки .Я бы порекомендовал максимум делать продолжение 200 секунд и то с продолжением генерации.А если хотите что бы без продолжения генерации то 100 секунд и менее

select_artist - в каком стиле артиста будет генерироваться продолжение аудио

select_genre - это стиль генерированного продолжения

И ещё немного насчёт моделей думаю для просто рофельного продолжения или не особо важного пойдёт модель 1b_lyrics ,а если к более серьёзному то 5b_lyrics или 5b и также на видео показано как загружать свои аудио файлы в гугл колаб и как копировать путь

Ладно настройки мы прошли теперь к генерации.Нажимаем на старт скрипта :

msedge_dmd9gwo0z1.png

теперь скрипт просит разрешение к подключению для вашего гугл диска

msedge_mjp6yfzfc8.png

теперь выбираем наш аккаунт потом далее далее и генерация запустилась .Сначала качаются модели потом начинается генерация .Она ОООООЧЕНЬ долгая 100 секунд по 2 часа при большой модели но генерация зато прикольная и так же.НЕ ВОЛНУЙТЕСЬ ЧТО В ПАПКАХ ТАМ level_2 И level_1 БОЛЕЕ ШАКАЛЬНОЕ АУДИО.ПОТОМУ ЧТО НЕЙРОСЕТЬ ПОД КОНЕЦ БУДЕТ УЛУЧШАТЬ КАЧЕСТВО МУЗЫКИ И БУДУТ КИДАТЬСЯ В ПАПКУ level_0 .НО НА ВСЯКИЙ СЛУЧАЙ ПРОВЕРЯЙТЕ ОСТАЛЬНЫЕ ПАПКИ ТАМ ТОЖЕ ИНОГДА БУДУТ ПОЯВЛЯТЬСЯ ПОЧТИ ХОРОШИЕ АУДИО ПО КАЧКЕСТВУ



0 comments

Loading...

Next up

Если кому-то интересно сколько сейчас весит необработанный датасет то вот.Примерно после удаления ненужных изображений он будет весить где-то 300-500 мб

Небольшие новости по поводу мультилоры.Артикль

Завтра должна начаться тренировка модели ,но наверное она начнётся в субботу потому что я не могу доделать датасет из за того что я сегодня не был весь день дома ну и завтра пол дня

Всем привет! В связи с тем, что по игре целых !7 МЕСЯЦЕВ! не выходило никаких новостей, решил показать вам анимацию Лунтыша! :)

Как вам?

На пути к мультилоре по "Лунтик и его друзья" .В данном посте будет вся информация о модели ,её характеристики и т д

RIDDLE.

Тестовая лора по Корнею.Прикольная

Датасет осталось немного улучшить и он готов

no pain no gain

Описание датасета стартовало .Подписи будут довольно подробными .Качество их будет максимально хорошее