Ну в крации я подсчитал сколько аудио файлов "примерно" в датасет 20000 музыки и 7000 песен .И итого 27000 аудио файлов 🥳 и это очень много и очень хорошо и возможно при обучении модели будет даже какая никакая белеберда связанная с вокалом

Эмм перед прочтение этого поста посмотрите этот пост :https://gamejolt.com/p/eman-ya-tupoy-ya-seychas-sizhu-i-dumayu-a-p-cfxurwzb
Next up
Первая новость:Мне не удалось обучить музыкальную модель из-за ошибок в консоли и из-за того, что не удалось найти нужную версию Clap (фигня, которая описывает музыку).Вторая новость это моя теория насчёт stable audio tools
Если вы хотите создать свою собственную муз.нейросеть но туториалов по transformer нету?То как за основу берите stable audio tools https://github.com/Stability-AI/stable-audio-tools?tab=MIT-1-ov-… это уже готовая нейросеть с открытым исходным кодом и вы можете модифицировать для своих задач
Относительно недавно у меня появилась странная вещь, связанная с нейросетями
Тест эффекта шагов
В крации там я уже без понятия то ли я ошибся в размерах датасета то ли автор что то наколдовал .Но примерно вышло файлов музыки на 5000-6000
Inverted Castle
ㅤ
Castlevania Symphony Of The Night fanart
Ну вкрации я такой поизучал нейронки stable audio (открытая) и sonauto ai (закрытая)и вот мои вердикты
@Magic_4df5
глазами нейросетями
Концептуальные эскизы для моих будущих серьёзных злодейских проектов.
Как вы знаете я главный на гж нейросетевой dungeon master пытаюсь сделать свою говно нейронку из этой https://github.com/Stability-AI/stable-audio-tools и вот просто знайте настолько мало легальных датасетов с музыкой и подписями к ней что мне придётся использовать.Дальше в артикле











0 comments