11 months ago

Тут я над одной масштабной нейросетью работаю.Если получится то это значительно облегчит жизнь разработчикам Лунтиков x .Артикль


Если помните то я где-то в августе делал модель luntik diffusion (https://gamejolt.com/p/ya-obyavlyayu-novuyu-model-luntik-diffusion-pony-v-g8hjfnhi)

Я почти с того момента забил один такой огромный болт на большие модели.

Где-то на этой пятнице я хочу запустить тренировку огромной мультилору для flux которая заменет luntik diffusion полностью из-за качества .

На данный момент я работаю над новым датасетом с почти нуля для лучшего качества.В него входят:оригинальные кадры из серий и спрайты высокого качества.

Главная боль при составлении датасета это подписи .Хороших и самое главное БЫСТРЫХ моделей нету.Моя основная модель для описания PromptGen-v1.5 часто ошибается в положении персонажа перед камерой,его взгляд, иногда эмоции . Лучше из чего я тестировал просто нет .Другая очень медленная что она тратит на одну картинку 6 минут времени.Третья жрёт 20 Гб видеопамяти.Четвёртая кривая и не подходит под flux.Ну вы поняли .

Сегодня я буду делать дальше датасет и к нему черновые описания .

А Завтра я буду тестировать супер-мега-ульра-дупер-пупер программу для составления датасетов,там как раз есть авто описание датасета на основе этих моделей :InternVL2, MiniCPM, Molmo, Ovis, Qwen2-VL .Я хз как они пойдут на моём ПК но если относительно быстро то это небольшая победа.Ведь мне больше не надо (почти)редактировать кривые описания от PromptGen-v1.5 вручную с Chatgpt-4o-mini .

Насчёт какого качества будет сама мультилора я точно пока не знаю . Потому что там конский датасет с множеством персонажами объектами и т д.Это может просто к чертям всё смещается и получится говно.

Ещё хотел сказать что в мультилору будет много новых дополнений,но пока я не буду их раскрывать



6 comments

Loading...

Next up

Чуть более глобальные новости про Luntik Flux.

Пишу для будущих заметок: я разработал теоретическую новую гибридную архитектуру для генерации длинных аудиотреков с пониженным использованием VRAM. Эта архитектура также легко модифицируется, позволяя повысить контроль над процессом генерации.

Большая история моих нейросетей по Лунтику

"Снова вместе!"

Пиздец,страшнааа(Неудачная генерация)

Вот такое сделал

Было принято одно важное решение об Luntik Flux.

Датасет будет увеличен с 500 изображений до 1130 изображений для улучшения качества и добавления новых персонажей

Встретимся ближе к концу лета, наверное

Я сливаю свои модельки из коллаба, я хз как будете с ними работать но думаю те кто шарят за блендер разберутся...

/

I'm sending my models from the collab, Idk how u're going to work with them, I think those who have skills in Blender will figure it out...

С 8 марта!