Всем привет!
Была у меня в апреле-мае этого года интересная история – я бы ее наверное и забыл, но я слежу за новостями по этой теме, и они периодически всплывают, а вчерашняя (ссылка на нее будет ниже) меня и подвигла написать этот пост.
Уточняю, что у меня нет цели на кого-то нажаловаться поэтому в ответах из министерств я убрал печати с именами и подписи ответственных чиновников.
Все началось с того, что в конце 2019 я понял, что в своей предыдущей области проф.деятельности достиг некого пика и дальше развитие в этой области мне: 1) не интересно 2) оно возможно, но, полностью соответствует принципу Парето где мне надо было бы потрать очень много усилий ради призрачных перспектив, да еще и не таких желанных, как мне казалось в начале пути.
Благодаря одной знаменательной посиделке у друзей я понял, что давнее, заглушаемое по разным причинам желание - "пойти в айти" а именно в дата сайнс (машинное обучение, нейронные сети, искусственный интеллект и прочее, далее буду писать ДС) на самом деле вполне реализуемо и конкретно у меня это может получиться. Придя домой погуглил с какого языка программирования начинать, что делать и как быть. На следующий день купил базовый курс по разработке на языке python (не дата сайнс а просто разработка) и понеслась.
Курс в итоге я забросил где-то на 30% и так его если честно и не прошел) Хотя в планах его добить.
Вообще моя учеба и то как я в итоге вышел на работу это тема для отдельного поста, если вдруг будет интересно – напишу.
Но если коротко – учился, совмещая с работой пару месяцев, потом уволился с работы что бы учиться еще больше. Учился как проклятый, почти каждый день с утра до ночи.
Месяца через 2 такого интенсива понял, что уже могу начинать искать работу в ДС на позицию джуна.
Но не тут-то было – разгоралась эпидемия короновируса, вакансий в этой области на позиции начального уровня стало катастрофически мало плюс в принципе эта тема в последнее время стала крайне популярной. Помимо новичков вроде меня в нее начали переходить программисты из других областей и на их фоне я выглядел совсем бледно, без хоть какого-то опыта работы в программировании. В итоге на все мои отклики на хх ответом была тишина, игнор и в лучшем случае вежливые отказы.
Что бы выделиться на фоне своих конкурентов, с учетом факторов, снижающих мои шансы (возраст 30+, отсутствие профильного образования, предыдущий опыт работы даже и близко не связан с ДС или программированием) нужны были проекты. Я к тому моменту написал штук 5 непричесанных и пару готовых простеньких проектов, но даже не стал их выкладывать т.к. они хоть и работали, но как мне кажется не тянули на то, чтобы их можно было показывать потенциальным работодателям.
Где-то неделю я ломал голову над темой проекта и его реализацией, перебирал варианты и меня в какой-то момент осенило – ковид же на дворе!
Что может быть лучше - сделать не просто хороший проект, а хороший проект на хайповой теме! Тут меня наверняка заметят и оторвут с руками. Так я тогда думал. Ага, щазз :) Это не особо повлияло на успешность поисков работы, но как я писал выше, это отдельная тема.
В общем немного погуглив и проконсультировавшись со знакомым рентгенологом я решил написать нейронную сеть, которая будет распознавать короновирус по изображениям рентгеновских снимков легких. Короновирус неплохо диагностируется по снимкам КТ и не очень хорошо по рентгеновским снимкам – на них врачу его заметить сложно, особенно на ранних этапах. Суть проекта такова, что нейронная сеть могла бы помочь рентгенологам в диагностике. Делается снимок, он прогоняется через сеть, она оценивает есть ли на снимке признаки короновируса или нет и выдает свой вердикт, врачу, который уже сам принимает решение о дальнейших действиях.
Идея была замечательная, была только проблема в том, что на тот момент в свободном доступе в интернете было очень мало рентгеновских снимков легких с короновирусом а для качественного обучения сети нейронной сети их нужно было больше, чем я нашел. Про аугментацию данных я тогда почти ничего не знал и поэтому взял набор снимков с вирусной пневмонией в тестовых целях – просто что бы проверить все ли будет работать как надо, а переобучить сеть на изображениях именно с ковидом дело техники.
Написал небольшую RNN сеть, обучил, точность была около 85% по определению признака наличия вирусной пневмонии (да/нет). Для проверки решил взять снимки с просторов интернета по запросу «вирусная пневмония рентген» и проверить с помощью все того же знакомого рентгенолога. Результаты получились чуть хуже, чем я предполагал. Так, на нескольких фотографиях которые сеть восприняла за бактериальную пневмонию на самом деле был туберкулез, но в остальном процент ошибок соответствовал оценке точности модели.
Я был окрылен.
Еще бы, я занимался настоящим дата сайнсом, а не делал 70-ый сабмишн в попытках прорваться в топ 1% прогнозируя цены на дома в Мельбурне. Не удивлюсь если узнаю, что у тамошних риелторов начинается приступ икоты при попытке оценить какой-нибудь дом. Извините, не удержался)
В общем я был воодушевлен, отправил свежий десяток откликов и … опять ничего.
Когда мне в голову пришла эта идея, я не могу сказать, что я руководствовался исключительно благими намерениями вроде миру-мир, спасем всех котят и другими. Нет, у меня была цель максимально быстро найти работу и для этого мне нужно было выделиться в положительном ключе из толпы таких же «хочу в МЛ».
Но, при этом, проходя в свое время подростковый кризис «зачем мы здесь» и будучи атеистом, я определил для себя свое кредо – что я хочу сделать мир лучше, т.к. остальное, в моем понимании не имеет реальной ценности в больших масштабах. Идеалистично и наивно? Да, это так и то, что я сделал и то, почему я вообще пишу этот пост как раз вытекает из этих моих качеств.
Я решил написать в приемную президента РФ предложение примерно следующего характера (точный текст у меня не сохранился, т.к. пишется он в специальной форме на сайте приемной): «я, такой-то такой-то, в рамках обозначения Президентом РФ ключевых направлений развития государства, а именно, в применении ДС в различных сферах государства предлагаю следующее: организовать хранилище больших данных, доступное для обработки методами ДС и возможностью подачи обратной связи». Грубо говоря аналог одного ключевого интернет ресурса среди дата сайнтистов - Каггла но на государственной основе и с данными про нашу страну. Далее я кратко описал свою модель, обозначил что даже я со своим небольшим багажом знаний смог сделать рекомендательную модель, которая сможет работать в паре с рентгенологом и принести пользу. А в России значительное количество энтузиастов ДС с очень высоким уровнем знаний/умений, которые смогут сделать очень многое не только в области медицины, но и в остальных областях где в принципе можно применить ДС.
Сообщение зарегистрировали, о чем пришло отдельное письмо, но я все равно изрядно удивился, когда увидел, что пришел ответ. Первый ответ был от Минздрава. Он был краток и лаконичен.
Суть ответа как мне видится – «ок, спасибо, не надо». Хотя я могу и ошибаться.
Я думал, что на этом история и закончилась, но пришел еще один ответ, уже от Министерства Промышленности и Торговли. Ответ очень развернутый и подробный, но у меня было ощущение что, то ли им передали искаженную информацию то ли они просто неправильно меня поняли.
Я не просил какой-то финансовой помощи для реализации этого проекта, более того я ни слова не написал о том, что я хочу в нем принимать участие (хотя я бы естественно не отказался).
Ну, ответили, хорошо, и на этом спасибо)
Я бы благополучно забыл про эту историю, если бы регулярно не натыкался на новости вроде этой:
https://ria.ru/20200706/1573937886.html
или этой
https://yandex.ru/news/story/Glava_Rostelekoma_otmetil_razvi...
или этой. После ее прочтения я посмеялся немного, потому что речь идет ровно о том, о чем я писал.
https://tass.ru/ekonomika/8778571
Ну и вишенка на торт – новость из-за которой я решил написать пост)
https://lenta.ru/news/2020/08/25/iskusst_intellekt/
Неужели сработало, пусть и не сразу или совпадение?)