2 years ago

Эмм перед прочтение этого поста посмотрите этот пост :https://gamejolt.com/p/eman-ya-tupoy-ya-seychas-sizhu-i-dumayu-a-p-cfxurwzb


Ну в крации я подсчитал сколько аудио файлов "примерно" в датасет 20000 музыки и 7000 песен .И итого 27000 аудио файлов 🥳 и это очень много и очень хорошо и возможно при обучении модели будет даже какая никакая белеберда связанная с вокалом



0 comments

Loading...

Next up

Первая новость:Мне не удалось обучить музыкальную модель из-за ошибок в консоли и из-за того, что не удалось найти нужную версию Clap (фигня, которая описывает музыку).Вторая новость это моя теория насчёт stable audio tools

Если вы хотите создать свою собственную муз.нейросеть но туториалов по transformer нету?То как за основу берите stable audio tools https://github.com/Stability-AI/stable-audio-tools?tab=MIT-1-ov-… это уже готовая нейросеть с открытым исходным кодом и вы можете модифицировать для своих задач

Относительно недавно у меня появилась странная вещь, связанная с нейросетями

Тест эффекта шагов

В крации там я уже без понятия то ли я ошибся в размерах датасета то ли автор что то наколдовал .Но примерно вышло файлов музыки на 5000-6000

Inverted Castle

Castlevania Symphony Of The Night fanart

Ну вкрации я такой поизучал нейронки stable audio (открытая) и sonauto ai (закрытая)и вот мои вердикты

@Magic_4df5 глазами нейросетями

Концептуальные эскизы для моих будущих серьёзных злодейских проектов.

Как вы знаете я главный на гж нейросетевой dungeon master пытаюсь сделать свою говно нейронку из этой https://github.com/Stability-AI/stable-audio-tools и вот просто знайте настолько мало легальных датасетов с музыкой и подписями к ней что мне придётся использовать.Дальше в артикле