Продавцов в даркнете можно вычислить по метаданным из их фотографий
Ресурс Black-Market Archives предлагает полтора терабайта данных для исследований. Здесь собраны данные с 83 различных порталов, 40 форумов и ряда других ресурсов, за период с 2013 по 2015 год, а это более 44 млн файлов.
Исследователи из Гарварда написали для работы с этим массивом данных Bash и Python скрипты и проанализировали только изображения, содержащиеся в архиве. Суммарно было просканировано 7 522 284 фотографии, и после 223 471 из них были отсеяны, так как являлись дубликатами.
Исследователи обнаружили, что 2 276 изображения содержат метаданные, в том числе, информацию о том, где именно было сделано фото. Затем студенты еще раз очистили выборку от дублей и изображений, чьи метаданные содержали лишь информацию о фотокамере и другие маловажные факты. В итоге осталось 229 уникальных изображений, из которых преступники забыли удалить действительно важные данные. Как выяснилось, фотографии, содержащие фактические GPS-координаты, были опубликованы их авторами неоднократно, на самых разных торговых площадках и форумах, поэтому процент дубликатов и был так велик.
Карта https://googl/amhfnd
Материалы:
Результаты исследования https://medium.com/@roselisker/illuminating-the-dark-web-d08...
BLACK-MARKET ARCHIVES http://www.gwern.net/Black-market%20archives
О метаданных в фото в Facebook https://www.facebook.com/security/posts/10151511111506886
Tl;dr
Студенты Гарвардского университета открыли EXIF? Вот это новость.
0.03% фоток спалилось. Это с дублями. Да уж, вот бы в реальном мире было так мало дебилов хД
они из жпэг файлов всю эту инфу вынимают?