Если помните то я где-то в августе делал модель luntik diffusion (https://gamejolt.com/p/ya-obyavlyayu-novuyu-model-luntik-diffusion-pony-v-g8hjfnhi)
Я почти с того момента забил один такой огромный болт на большие модели.
Где-то на этой пятнице я хочу запустить тренировку огромной мультилору для flux которая заменет luntik diffusion полностью из-за качества .
На данный момент я работаю над новым датасетом с почти нуля для лучшего качества.В него входят:оригинальные кадры из серий и спрайты высокого качества.
Главная боль при составлении датасета это подписи .Хороших и самое главное БЫСТРЫХ моделей нету.Моя основная модель для описания PromptGen-v1.5 часто ошибается в положении персонажа перед камерой,его взгляд, иногда эмоции . Лучше из чего я тестировал просто нет .Другая очень медленная что она тратит на одну картинку 6 минут времени.Третья жрёт 20 Гб видеопамяти.Четвёртая кривая и не подходит под flux.Ну вы поняли .
Сегодня я буду делать дальше датасет и к нему черновые описания .
А Завтра я буду тестировать супер-мега-ульра-дупер-пупер программу для составления датасетов,там как раз есть авто описание датасета на основе этих моделей :InternVL2, MiniCPM, Molmo, Ovis, Qwen2-VL .Я хз как они пойдут на моём ПК но если относительно быстро то это небольшая победа.Ведь мне больше не надо (почти)редактировать кривые описания от PromptGen-v1.5 вручную с Chatgpt-4o-mini .
Насчёт какого качества будет сама мультилора я точно пока не знаю . Потому что там конский датасет с множеством персонажами объектами и т д.Это может просто к чертям всё смещается и получится говно.
Ещё хотел сказать что в мультилору будет много новых дополнений,но пока я не буду их раскрывать
7 comments