Portia visual web scraper

Aug 11, 2016 23:19

Portia - это надстройка для Scrapy, которая позволяет вместо ручного написания достаточно хитроумных спайдеров просто открыть нужный сайт и показывать, что из него следует извлекать.

Сейчас к ней появилась добавка в виде portia2code, которая позволяет плоды трудов по анализу сайтов выгрузить в виде текстов спайдеров, которые потом можно править вручную.

Ставил на Linux mint 18 по инструкции отсюда: http://portia.readthedocs.io/en/latest/installation.html

Только Vagrant и VirtualBox ставил Синаптиком, чтобы не возиться. Они в Синаптике чуть старее, чем на своих сайтах.

Короче, Portia стартует и работает, в отличие от тех версий, с которыми я возися в прошлом году.

Буду опробовать в деле.

софт

Previous post Next post
Up