Beautiful Soup или как правильно грабить корованы?
Oct 18, 2022 20:42
Код доступа: РАЙ Request Headers
Что-то я запутался с парсингом на 5к строк и десятью переменными. Изначальный код переделал под ХэХэ.ру, но возникла проблема с отображением информации (какая-то запутанная структура у сайта - это потребует доработки датасета "напильником"). Внёс изменения в код - дело пошло (правда только 8 переменных смог изыскать в коде - и то там сложно), но при парсинге, начиная с 11 страницы, постоянно вылетает ошибка. Или это защита сайта (кто и как обходил), или это таки что-то с кодом? Есть у кого желание поделиться опытом?) https://colab.research.google.com/drive/1xGLSAnv691mPF0G20szI249LKznbOpVc?usp=sharing Или подсказать более-менее нормальный сайт, где можно получить 5000 строк с 10 параметрами (качественными и количественными)? А может код можно сделать проще и понятнее? О_о [КДПВ]