Американцы научили программу распознавать "пьяные" записи в "Твиттере
Американцы научили компьютерную программу распознавать "пьяные" сообщения в "Твиттере". Разработчики из Рочестерского университета во главе с Набилом Хуссейном создали алгоритм, который позволяет отслеживать "нетрезвую" активность пользователей. Об этом пишет Technology Review [ https://www.technologyreview.com/s/601051/machine-learning-a... ].
С 2014 года Хуссейн и его команда отслеживали записи с геотегами, которые могли быть сделаны пользователями в нетрезвом состоянии. Их отбирали по ключевым словам, таким как "пьяный", "пиво", "вечеринка" и так далее. Затем при помощи специального сервиса они отфильтровывали только те твиты, которые имеют отношение к непосредственному употреблению алкоголя.
Такие записи отбирали по следующим критериям: говорится ли в твите об употреблении спиртного, сказано ли в нем о том, что спиртное употребляет сам автор записи, и была ли запись опубликована во время и в месте распития. В процессе поиска "пьяных" твитов программа постоянно учится распознавать такие записи, исходя из их содержания.
Разработчики также создали алгоритм, который позволяет с большой точностью определять, откуда пользователь пишет "пьяные" послания. Исследователи учитывали, откуда блогер пишет чаще всего, откуда он обычно пишет в период между часом ночи и шестью часами утра и где он находился, отправляя последний пост за день. Кроме того, они научили программу распознавать слова и фразы, которые могли бы указывать на то, что пользователь пишет из дома. К таким фразам относятся, например, "наконец-то я дома!".
Источник: http://www.vesti.ru/doc.html?id=2732256