Парсинг без единой строчки кода
Сегодня
Полная статистика будет доступна после того, как публикация наберет больше 100 просмотров.
Парсинг без единой строчки кода
И так ребят, возможно вы слышали такое выражение как парсинг сайтов. Но не все знают что это, поэтому предлагаю в этом разобраться.
И да, в этой статье не будет ни строчки программного кода - только теория.
И так определение парсинга гласит, что это автоматизированный сбор неструктурированной информации, ее преобразование и выдача в структурированном виде. Звучит как обычная обработка данных, например какой-нибудь бдшки. Но по факту это используется как воровство контента разного типа с сайтов.
Но вы наверняка думаете, что невероятно сложно. Ведь для этого нужно иметь доступ к базе данных и тд. НО ЭТО НИХУЯ НЕ ТАК достаточно просто посмотреть код элемента через браузер, найти нужный блок, узнать его класс и спиздить его содержание.
Кому это нужно?
Приведу банальный пример. Чтобы написать эту статью я изучал различные уроки и источники, а мог бы просто скопировать текст с какого-нибудь ноунейм сайта и не париться. Только в данном случае парсинг будет проблемно применить, а вот если бы я делал это на свой веб-сайт - было бы легко спиздить какую-нибудь статью.
Другой пример, все вы знаете что такое сайты с 18+ контентом. И неужели вы думаете, что все они заключают договора со студиями или сами все снимают. Нет, они просто парсят контент с сайта со схожим контентом.
Ну или ценовая "разведка". Такие сайты как “Wildberries” или “Lamoda“ свободно предоставляют доступ к ежедневным объемам продажи. И если мне нужно узнать какой сейчас ходовой товар, то я могу просто написать парсер на эти данные и все знать.