"Датасет - набор данных"
— Датасет будет переделан частично или полностью с нуля.
— Будет тестироваться новый тип датасета. Где первая половина подписей и изображений будет точные,вторая половина уже будет со средней точностью,а другая половина будет с более простыми подписями.
— Рассматривается новый типа датасета половина изображений будет в стиле 2д, а часть другая в 3д.
— Рассматривается новый тип подписей где некоторая часть подписей для обычных изображений будет вырезаться для оптимизации. Для более необычных изображений остаётся всё тоже самое.
Так, как я расширил датасет с 500 изображений до 1000, то надо его собрать.
Раньше когда я собирал датасеты для персонажей в 20 изображений то придерживался данной формулы:
Искались 10 изображений персонажа с определёнными позами, видом камеры и т п.
Вторая же часть включала себя 10 случайных изображений персонажа.
Сейчас же для каждого персонажа уже нужно собрать ещё 20 дополнительных изображений.
У меня есть свобода выбора и разнообразия,30000 кадров из двух сезонов(и то в планах у меня разделить все сезоны на кадры).
На этом же моменте начались проблемы.
Я просто не знаю что туда вставлять, как тупо это не звучало. Возможно это у меня из-за выгорания или другого.
Ладно там количество кадров много, в принципе можно просмотреть все за 2 часика максимум.
Вот какие именно изображения выбирать тут просто трындец.
Раньше была формула сбора, сейчас её тупо нету.
Нужно и разнообразие, и особенности ,и эмоции, и ещё что-то.
Была конечно идея оценивать кадры нейросетью по 10-ти бальной шкале ,а потом отбирать с наибольшей оценкой ,но тут это слишком медленно, да и качество не очень.
Есть так же вариант делать всё по старой формуле, но остаются для каждого персонажа 10 случайных кадров.
На данный момент я пытаюсь разработать новый способ отбора кадров .
Буду вам очень благодарен если, предложите свои идеи что можно добавить в датасет.
На этом всё.
1 comment