Хоть она освоенна на архитектуре DIT(diffusion transformer)а не на transformer.Но она более быстрая чем чистый transformer архитектура

Если вы хотите создать свою собственную муз.нейросеть но туториалов по transformer нету?То как за основу берите stable audio tools https://github.com/Stability-AI/stable-audio-tools?tab=MIT-1-ov-file это уже готовая нейросеть с открытым исходным кодом и вы можете модифицировать для своих задач
Next up
В крации там я уже без понятия то ли я ошибся в размерах датасета то ли автор что то наколдовал .Но примерно вышло файлов музыки на 5000-6000
Мои предсказания по поводу "Какие открытые нейросети выйдут или уже будут доступны в начале 2025 году?"
Ну вкрации я такой поизучал нейронки stable audio (открытая) и sonauto ai (закрытая)и вот мои вердикты
Относительно недавно у меня появилась странная вещь, связанная с нейросетями
ДЕСЯТЬ ЛЕТ.
Как вы знаете я главный на гж нейросетевой dungeon master пытаюсь сделать свою говно нейронку из этой https://github.com/Stability-AI/stable-audio-tools и вот просто знайте настолько мало легальных датасетов с музыкой и подписями к ней что мне придётся использовать.Дальше в артикле
Первая новость:Мне не удалось обучить музыкальную модель из-за ошибок в консоли и из-за того, что не удалось найти нужную версию Clap (фигня, которая описывает музыку).Вторая новость это моя теория насчёт stable audio tools
Тест эффекта шагов
@Magic_4df5
глазами нейросетями











0 comments