Crawler for linux?⁠⁠

Доброго дня!

Появилась задача парсинга данных со сложных страниц с динамическими данными.

API нет и не предвидется ближайшее время у сайта.

Хотел было на Lazarus + FPCEF3 реализовать, но покапав поглубже понял, что

1. Очень скудный инструментарий. Хотя можно обойти местами.

2. на Ubuntu горько смотреть на скомпилированный результат

Юнити мне как родной, но под него не видел вменяемых браузеров

на JavaScript видел crawler'ы но тормоза этих систем сильно останавливают.

Хотелось бы нативное некое решение.

Задачи две

1. Нужен хороший доступ к дому чтобы листнеры хотя бы на клик элементов реализовать

2. Кросс-платформенность

Подскажите, пожалуйста путь.

Возможно готовый к адаптации проект где-то скачать можно?

PS Гуглить конечно же умею.

Crawler for linux? Chromium, Программирование, Linux и Windows

GNU/Linux

1K постов15.5K подписчиков

Добавить пост

Правила сообщества

Все дистрибутивы хороши.

Будьте людьми.

Gerden

6 лет назад

JS по сути тебе в помощь. Тут все инструменты для работы с DOM, просто выхватывать эвенты, кроссплатформенность как бонус.

Насчёт тормозов, это результат непонимания языка и принципом парсинга DOM, и результат таскания за собой тонны тяжелых библиотек.

Всё от задачи зависит, очень абстрактное описание... Вам то ли налету нужно парсить, то ли вам нужно парсить и в БД куда-то писать а потом где-то показывать. Может ещё какие варианты.

раскрыть ветку (1)

RedBall

6 лет назад