Beautiful Soup или как правильно грабить корованы?

Oct 18, 2022 20:42



Код доступа: РАЙ Request Headers

Что-то я запутался с парсингом на 5к строк и десятью переменными.
Изначальный код переделал под ХэХэ.ру, но возникла проблема с отображением информации (какая-то запутанная структура у сайта - это потребует доработки датасета "напильником"). Внёс изменения в код - дело пошло (правда только 8 переменных смог изыскать в коде - и то там сложно), но при парсинге, начиная с 11 страницы, постоянно вылетает ошибка.  Или это защита сайта (кто и как обходил), или это таки что-то с кодом?
Есть у кого желание поделиться опытом?)
https://colab.research.google.com/drive/1xGLSAnv691mPF0G20szI249LKznbOpVc?usp=sharing
Или подсказать более-менее нормальный сайт, где можно получить 5000 строк с 10 параметрами (качественными и количественными)?
А может код можно сделать проще и понятнее? О_о
[КДПВ]


Код "Зима". Гений

Previous post Next post
Up