RedBall

Crawler for linux?⁠⁠

8 лет назад

Доброго дня!

Появилась задача парсинга данных со сложных страниц с динамическими данными.

API нет и не предвидется ближайшее время у сайта.

Хотел было на Lazarus + FPCEF3 реализовать, но покапав поглубже понял, что

1. Очень скудный инструментарий. Хотя можно обойти местами.

2. на Ubuntu горько смотреть на скомпилированный результат

Юнити мне как родной, но под него не видел вменяемых браузеров

на JavaScript видел crawler'ы но тормоза этих систем сильно останавливают.

Хотелось бы нативное некое решение.

Задачи две

1. Нужен хороший доступ к дому чтобы листнеры хотя бы на клик элементов реализовать

2. Кросс-платформенность

Подскажите, пожалуйста путь.

Возможно готовый к адаптации проект где-то скачать можно?

PS Гуглить конечно же умею.

Crawler for linux?

[моё] Chromium Программирование Linux и Windows

1.2K поста15.6K подписчика

Добавить пост

Правила сообщества

Все дистрибутивы хороши.

Будьте людьми.

Вы смотрите срез комментариев. Показать все

0

8 лет назад

Сам напиши.

раскрыть ветку (6)

8 лет назад

Так и хочется написать. Стек технологий определяю.

раскрыть ветку (5)

2

8 лет назад

PhantomJS? Мне обычно хватало scrapy, или нужно снимать прямо с js-сгенеренные данные?

ещё комментарии

0

8 лет назад

если хотите сами писать и ЯП не важен, то можно сделать свой велосипед к примеру на golang + https://github.com/PuerkitoBio/goquery (вроде все необходимое в модуле есть ). Код будет кроссплатформенным и быстрым.

8 лет назад

Я сам не особо шарю, просто пара знакомых красноглазых бородачей пишут все себе сами по надобности, что-то ворча при этом. Иногда выглядит чуть пугающе:)

Вы смотрите срез комментариев. Чтобы написать комментарий, перейдите к общему списку