Next up
Если кому-то интересно сколько сейчас весит необработанный датасет то вот.Примерно после удаления ненужных изображений он будет весить где-то 300-500 мб
Ещё одна маленькая победа,осталось только найти идеальную модель для описания
Победа,я наконец нашёл идеальные модели для описания изображений.Они при стандартных промтах пишут не плохо и быстро (модели Qwen2-VL-2B-Instruct и OpenGVLab_InternVL2-2B).Для лучшего качества надо сделать всего лишь свой промт
Завтра должна начаться тренировка модели ,но наверное она начнётся в субботу потому что я не могу доделать датасет из за того что я сегодня не был весь день дома ну и завтра пол дня
RIDDLE.
Можно уже считать что датасет в плане картинок полностью готов.Я за вечер разобрал все спрайты и мне максимум из общего объёма добавить 10 спрайтов и немножко ещё удалить.Завтра будет самое сложное ,подписи
Описание датасета стартовало .Подписи будут довольно подробными .Качество их будет максимально хорошее
no pain no gain
Тестовая Лора для шнюка, нормально в принципе выглядит
0 comments