А мы могли бы служить в разметке...
Сегодня я расскажу про свою работу. Тружусь я в этой сфере 6 лет. Это аннотация или разметка данных для обучения ИИ.
Аннотация данных — это процесс разметки информации (картинок, видео, текста, аудио), чтобы её мог «понимать» искусственный интеллект.
Например, на фото человек видит «кошку», а компьютер видит только набор пикселей.
Чтобы компьютер «понял», что это кошка, человек обводит её рамкой или полигоном и подписывает «cat».
Так создаётся обучающий датасет.
Искусственный интеллект учится на данных. Чем больше у него качественно размеченной информации, тем точнее он работает.
Если мы хотим, чтобы AI умел распознавать дорожные знаки — ему нужно показать тысячи фото со знаками и их аннотациями.
Для медицины — разметить снимки опухолей, чтобы модель научилась отличать здоровую ткань от поражённой.
Для e-commerce — отметить одежду на фото, чтобы алгоритм находил похожие товары.
Я начинала с обычного аннотатора. Моя задача была просто аннотировать (отрисовывать) объекты. Работа мне очень нравилась, тебе дают задание на день-два и ты сам с собой его делаешь, можно слушать музыку, можно слушать книги или подкасты. Работа сама по себе не сложная, но требует большой усидчивости и дисциплины. Нужно внимательно читать инструкции, не лениться и проверять свою работу несколько раз, ведь глаза устают и можно пропустить какие-то мелочи. К примеру нужно 6 часов подряд сидеть и аннотировать картинки, это бывает тяжело.
Сейчас я уже руковожу проектами. У меня, как правило несколько проектов и несколько команд, которые работают на проектах. Моя задача выдать всем задания, написать подробные инструкции, обучить команду и проверить понимание, следить за ходом работы, подготовить данные к отправке заказчику.
Проекты самые разные. Это и разметка одежды, животных, машин, улиц. Запросы самые разные. И каждый раз ты погружаешься в новый мир. В мир заказчика. К примеру мне нужно разобраться, чем отличается один строительный блок от другого, визуально такого же. И да, если заказчик не может объяснить сам, то я читаю статьи и смотрю видео сама, а потом пишу список уточняющих вопросов по теме и тогда мы уже с заказчиком дополняем пробелы в инструкции. Я иногда шучу, что благодаря своей работе я знаю много разнообразной фигни).
Но, это все очень интересно. Бывает тяжело конечно, бывают очень сложные проекты, где инструкция может достигать 100 листов. А бывают очень занятные проекты, особенно люблю работать с животными или например порассматривать улицы разных городов.
Скажу сразу, зп у новичков не очень высокая, но опытные аннотаторы могут быть действительно очень восстребованы. Особенно ценятся люди, которые умеют читать инструкции и ответственные.
Когда работаешь с большими массивами данных и большим колличеством людей, то возникают комичные ситуации. Т.е все мы видим мир по-разному и восприятие мира разное, это отображается и в работе. Я много раз замечала, что некоторые люди не понимают глубину или объем предмета, у кого-то проблемы с определением тех или иных объектов, если съемка ведется в высоты. Я даже встречала проблемы с тенями объекта, где человек не понимает, что существуют тени и это не часть предмета. Еще, бывает что человек не понимает, что два объекта стоят друг за другом и ему кажется, что это один предмет, а не два.
Еще, ооочень важно составить подробную инструкцию, прям как для детей. У нас с коллегами даже есть фраза: если что-то может быть понято неправильно, это будет понято неправильно. Иногда диву даешься, на сколько мы все разные и ты даже додуматься не мог, а другой человек смог и воплотил)).
Мне нравится моя работа, конечно, бывает приходится очень много работать например на стадии сдачи проекта, особенно когда сдать нужно несколько проектов на неделе. Ну а куда без этого, на любой работе свои нюансы. А разметку я оченю люблю.
В будущем я бы хотела либо повысить квалификацию, либо получить дополнительное образование в сфере ИИ. Меня интересует этика искусственного интеллекта. Хочется больше узнать про моральные последствия использования ИИ и возможно работать в этом направлении.
Всем бобра!












































































