Python | Beautiful Soup: chevalry

chevalry

Python | Beautiful Soup

Feb 03, 2012 12:42

В книге Тоби Сегерана "Программируем коллективный разум" рекомендована библиотека для парсинга HTML и XML файлов - называется Beautifulsoup
Вот ссылки на эту библиотеку:
BeautifulSoup
Документация BeautifulSoup
Основным достоинством является то, что BS довольно лоялен к неправильной разметке. Эта нелояльность послужила мне препятствием к использованию библиотеки lxml при парсинге HTML. Попробуем теперь этот вариант...

python