Loading...
75
2 years ago

Небольшой туториал по нейросети Jukebox ai которая может продолжать ваши музыкальные композиции


Первое переходим по этой ссылке на гуггл колаб One Click Jukebox with Autosave v2.ipynb - Colab (google.com) : теперь не обязательный пункт но если его сделать в последующие разы не надо ждать установки модели которые весят примерно 13 гб если это самые большие или 4 гб если выбрать маленькие модельки :

msedge_ybdj8ydz4q.png

теперь заходим на ваш гугл диск и нажимаем на новый создавшиеся файл :

msedge_zcoen33sqv.png

теперь переходим к основным пунктам :

из за того что Jukebox ai это слишком мощная нейросеть то она делается на серверах гугла.Каждый день даётся по 6 часов пользованию серверов но так вот подключаемся к графическому ускорителю Tesla T4:

msedge_1io2yfgjhi.png

теперь если вы не копировали сам блокнот на гугл диск то вылезет это окошко то нажимаем выполнит

msedge_7rykpwva8p.png

теперь если ваш музыкальный отрывок или песня со словами то удаляем все слова из your_lyrics и заменяем на свои если нету слов то просто удаляем все слова после этого нажимаем на кнопку которая показана на фотографии :

msedge_bfrbzynq8q.png

Теперь переходим к самому сладкому ,к настройки :

model - обозначает какую модель выберем маленькая модель по 1 гб это 1b_lyrics ,а большие 5b_lyrics, 5b.Приписка lyrics обозначает ли поддерживает ли модель lyrics (текст песни) и от этого зависит будет ли тарабарщина или нет .

hps. name - папка в которой будет хранится наши продолженные песни .Если у вас сломалась генерации то она сохраняется в ту папку которую вы показали то можно указать туже папку и те же настройки то можно продолжить генерацию продолжения.

audio_file - это путь вашего аудио файла .Пока мне известно что поддерживает .wav и .mp3.

prompt_length_in_seconds - это сколько секунд будет воспроизводится оригинальное аудио в начале и это будет ещё использоваться как подсказка для нейросети что бы она понимала более точно как продолжать.

sample_length_in_seconds - это размер продолжения музыки .Я бы порекомендовал максимум делать продолжение 200 секунд и то с продолжением генерации.А если хотите что бы без продолжения генерации то 100 секунд и менее

select_artist - в каком стиле артиста будет генерироваться продолжение аудио

select_genre - это стиль генерированного продолжения

И ещё немного насчёт моделей думаю для просто рофельного продолжения или не особо важного пойдёт модель 1b_lyrics ,а если к более серьёзному то 5b_lyrics или 5b и также на видео показано как загружать свои аудио файлы в гугл колаб и как копировать путь

Ладно настройки мы прошли теперь к генерации.Нажимаем на старт скрипта :

msedge_dmd9gwo0z1.png

теперь скрипт просит разрешение к подключению для вашего гугл диска

msedge_mjp6yfzfc8.png

теперь выбираем наш аккаунт потом далее далее и генерация запустилась .Сначала качаются модели потом начинается генерация .Она ОООООЧЕНЬ долгая 100 секунд по 2 часа при большой модели но генерация зато прикольная и так же.НЕ ВОЛНУЙТЕСЬ ЧТО В ПАПКАХ ТАМ level_2 И level_1 БОЛЕЕ ШАКАЛЬНОЕ АУДИО.ПОТОМУ ЧТО НЕЙРОСЕТЬ ПОД КОНЕЦ БУДЕТ УЛУЧШАТЬ КАЧЕСТВО МУЗЫКИ И БУДУТ КИДАТЬСЯ В ПАПКУ level_0 .НО НА ВСЯКИЙ СЛУЧАЙ ПРОВЕРЯЙТЕ ОСТАЛЬНЫЕ ПАПКИ ТАМ ТОЖЕ ИНОГДА БУДУТ ПОЯВЛЯТЬСЯ ПОЧТИ ХОРОШИЕ АУДИО ПО КАЧКЕСТВУ



0 comments

Loading...

Next up

Забыл выложить арт к своему спавндею

Было принято одно важное решение об Luntik Flux.

Датасет будет увеличен с 500 изображений до 1130 изображений для улучшения качества и добавления новых персонажей

С 8 марта!

RUS: Всем привет! В связи с тем, что по игре целых !7 МЕСЯЦЕВ! не выходило никаких новостей, решил показать вам анимацию Лунтыша! :)

Как вам?

Чуть более глобальные новости про Luntik Flux.

ДЕСЯТЬ ЛЕТ.

Небольшие новости про Luntik Flux .Артикль

Большая история моих нейросетей по Лунтику

ИТАК, ребятки, мы презентуем вам НАШ проект ЕРЕСЬ КУЗИ ДВА... Ну, а вернее ДЕМО этой игры. ИГРА: https://gamejolt.com/games/YourPersonalHell/958149

Пиздец,страшнааа(Неудачная генерация)