Loading...
79
2 years ago

Длиньше я пока искал другие нейросети по генерации музыки нашёл одну очень необычную под название Ruffusion


И вот смотрите прикол она умеет генерировать голос но это одно из фич а другая заключается в том что она устроена на основе Stable diffusion а она генерирует картинки но как происходит из текста картинка.Они обучили модель Stable diffusion на спектрограммах или по понятному языку картинках которые визаулизирует аудио она просто генерирует новую спектограмму дальше она конвертируется в вав или мп3 и вот у вас получилась нормальная и одекватная песня сгенерированная нейросетью



0 comments

Loading...

Next up

Встретимся ближе к концу лета, наверное

Небольшие новости про Luntik Flux .Артикль

Сегодня у меня день рождения!

Тест эффекта шагов

Пиздец,страшнааа(Неудачная генерация)

Inverted Castle

Castlevania Symphony Of The Night fanart

Большая история моих нейросетей по Лунтику

Было принято одно важное решение об Luntik Flux.

Датасет будет увеличен с 500 изображений до 1130 изображений для улучшения качества и добавления новых персонажей

Концептуальные эскизы для моих будущих серьёзных злодейских проектов.

Пишу для будущих заметок: я разработал теоретическую новую гибридную архитектуру для генерации длинных аудиотреков с пониженным использованием VRAM. Эта архитектура также легко модифицируется, позволяя повысить контроль над процессом генерации.