Парсинг без единой строчки кода

Сегодня

Полная статистика будет доступна после того, как публикация наберет больше 100 просмотров.

Парсинг без единой строчки кода

И так ребят, возможно вы слышали такое выражение как парсинг сайтов. Но не все знают что это, поэтому предлагаю в этом разобраться.

И да, в этой статье не будет ни строчки программного кода - только теория.

Парсинг без единой строчки кода Парсинг, Программирование, C, Csharp, Мат

И так определение парсинга гласит, что это автоматизированный сбор неструктурированной информации, ее преобразование и выдача в структурированном виде. Звучит как обычная обработка данных, например какой-нибудь бдшки. Но по факту это используется как воровство контента разного типа с сайтов.


Но вы наверняка думаете, что невероятно сложно. Ведь для этого нужно иметь доступ к базе данных и тд. НО ЭТО НИХУЯ НЕ ТАК достаточно просто посмотреть код элемента через браузер, найти нужный блок, узнать его класс и спиздить его содержание.

Кому это нужно?

Приведу банальный пример. Чтобы написать эту статью я изучал различные уроки и источники, а мог бы просто скопировать текст с какого-нибудь ноунейм сайта и не париться. Только в данном случае парсинг будет проблемно применить, а вот если бы я делал это на свой веб-сайт - было бы легко спиздить какую-нибудь статью.


Другой пример, все вы знаете что такое сайты с 18+ контентом. И неужели вы думаете, что все они заключают договора со студиями или сами все снимают. Нет, они просто парсят контент с сайта со схожим контентом.


Ну или ценовая "разведка". Такие сайты как “Wildberries” или “Lamoda“ свободно предоставляют доступ к ежедневным объемам продажи. И если мне нужно узнать какой сейчас ходовой товар, то я могу просто написать парсер на эти данные и все знать.