Технически характеристики мультилоры :
Обучение будет происходить в программе: Onetrainer
Датасет :500 изображений (примерно)
Основное описание изображений : MiniCPM-V-2_6 8B.
Модель для обучения:flux 1.0 dev
Эпох : 100 (Тут другой метод обучения ,эпохами ,что типа качество зависит от ещё больше от эпох, а не от шагов )
Созданием триггер слов и коррекцией промтов : ChatGPT4o-mini
Данная мультилора будет мультимодальная. То есть она будет поддерживать много персонажей ,сцен и т д .
В ней я отказался от PromptGen-v1.5 в пользу более умной и большой модели.
В датасете будут чаще всего изображения с фоном а не просто пнг спрайты.Также весь датасет будет почти вручную прописан потому что я хочу добиться максимального качества
В датасете для каждого персонажа много разнообразных кадров ,поз, зимние версии.Триггер слова будут очень детально описывать основные черты персонажа .
В датасете ПОЛНОСТЬЮ НЕТУ кадров и спрайтов в
плохом качестве
Возможно так же что данная мультлора будет поддерживать (думаю криво) генерацию до 2-3 персонажей на одной сцене
К данной мультилоре будет также будет дополнительные маленькие лоры для новых плюшек которые не попали в основную модель
Тренировка основной мультилоры начнётся примерно вечером этой пятницы.
Щас я почти доделал датасет в плане изображений
0 comments