Loading...
38
2 years ago

Первая новость:Мне не удалось обучить музыкальную модель из-за ошибок в консоли и из-за того, что не удалось найти нужную версию Clap (фигня, которая описывает музыку).Вторая новость это моя теория насчёт stable audio tools


Первое моя старая теория что нейросеть Sonauto это просто модифицированная нейросеть stable audio оказалось не правдой .Автор ответил мне что это не так что он сам сделал эту нейросеть и т д.Вторая теория новая:Перед вами видео с музыкальной композиции от нейросети stable audio 1.0 .Так вот там есть хоть и искаженный но голос.И даже он сочетается с музыкой .Так вот моя теория заключается в том что если модифицировать stable audio tools что добавить доп условие это текст песни, то возможно нейросеть будет воспроизводить возможно кривоватый но голос с осмысленным текстом.Текст песни можно получить с помощью модели whisper-large . Поместить можно эту модель в конфиг файле ,и там же немного настроить там.А более сложное это найти скрипт то ли тренировки то ли другой и модифицировать что бы была доп условие это текст песни.



0 comments

Loading...

Next up

В крации там я уже без понятия то ли я ошибся в размерах датасета то ли автор что то наколдовал .Но примерно вышло файлов музыки на 5000-6000

Мои предсказания по поводу "Какие открытые нейросети выйдут или уже будут доступны в начале 2025 году?"

Хотите рофл? Я нашёл датасет музыки с 7000 композиций с статусом общественным достоянием .И так же я потихоньку разбераюсь с stable audio tools .и надеюсь я сегодня буду обучать свою первую музыкальную модельку

RUS: Всем привет! В связи с тем, что по игре целых !7 МЕСЯЦЕВ! не выходило никаких новостей, решил показать вам анимацию Лунтыша! :)

Как вам?

Ну вкрации я такой поизучал нейронки stable audio (открытая) и sonauto ai (закрытая)и вот мои вердикты

ДЕСЯТЬ ЛЕТ.

Как вы знаете я главный на гж нейросетевой dungeon master пытаюсь сделать свою говно нейронку из этой https://github.com/Stability-AI/stable-audio-tools и вот просто знайте настолько мало легальных датасетов с музыкой и подписями к ней что мне придётся использовать.Дальше в артикле

Короче я почти разобрался с нейросетью по генерации музыки.Осталось понять что делать с подписями для музыки и что такое кондиционеры(это связано с нейросетями ,а не с бытовой техникой)

Тест эффекта шагов

@Magic_4df5 глазами нейросетями