И вот смотрите прикол она умеет генерировать голос но это одно из фич а другая заключается в том что она устроена на основе Stable diffusion а она генерирует картинки но как происходит из текста картинка.Они обучили модель Stable diffusion на спектрограммах или по понятному языку картинках которые визаулизирует аудио она просто генерирует новую спектограмму дальше она конвертируется в вав или мп3 и вот у вас получилась нормальная и одекватная песня сгенерированная нейросетью

79
1 year ago
Длиньше я пока искал другие нейросети по генерации музыки нашёл одну очень необычную под название Ruffusion
Next up
Пиздец,страшнааа(Неудачная генерация)
С 8 марта!
Большая история моих нейросетей по Лунтику
Забыл выложить арт к своему спавндею
no pain no gain
Ну что ж,тестовая моделька для Luntik Flux готова.Особенности данной модели в артилке
Чуть более глобальные новости про Luntik Flux.
RUS: т о л ь к о б о л ь .
ENG: o n l y p a i n .
Было принято одно важное решение об Luntik Flux.
Датасет будет увеличен с 500 изображений до 1130 изображений для улучшения качества и добавления новых персонажей
0 comments