Сап, Аноны! Хотел обратиться с вопросом к знающим людям. Если тема будет неприемлема, больше не буду. В общем вопрос такой: есть один форум лесной тематики. forums.wood.ru, так вот не могу его спарсить уже целый месяц. Дело в том, что этот ресурс непонятным для меня образом палит парсинг и блокирует доступ к сайту, напрочь. Что делал: пытался забирать Селениумом - палит, пытался обычным реквестом на Пайтон - тоже самое, пытался puppeteer на node.js - безуспешно (ни одной страницы), пытался через Тор, впн, покупку анонимных проксей - все без толку. Они что непобедимые? Даже курл на пэхопэ не берёт. Я в отчаянии, прошу помощи, может знает кто?
>>44690 нахуй пойдешь ты. хули ты мне кидаешь сурс одной страницы то? думаешь без тебя - дятла не додумались, что так можно? если пруфанешь тем, что ресурс тебя не заблочил, когда ты +10500 страниц форума забирал, тогда возьму свои слова обратно
>>44691 Какую проблему я увидел изначально в треде: >палит парсинг и блокирует доступ к сайту, напрочь >Он на любой запрос отдает пустую страницу. Эту проблему я решил.
То что тебя после 100500 запросов с одного айпишника 99% сайтов забанит и так очевидно. И решение этой проблемы очевиднейшее. Так бы и писал в оп посте: "Сап двач, я даун. Как спарсить сайт в 100500 страниц и не словить бан?".
А знаешь кто из нас сходил на хуй? Ты! Потому что хуй ты теперь выпросишь у меня код делающий запросы без получения бана. Парсь дальше свою пустую страницу и делай бочку.
>>44692 Где написано было, что парсил с одного айпишника, довен? Прочёл жопой оп пост и жидко обосрался. По существу есть что сказать, или так и будешь, как баран, отрицать очевидное?
>>44692 Лол, так что ты хуем своим трясешь то? Мы ведь тут не письками меряемся как ты школодаун. То что единоразовый доступ у тебя есть, так это давно всем известно. Рабочего решения у тебя нет, хули ты завелся то, если пруфануть не можешь?
Чего в этом сайте такого? Зачем его целый месяц парсить? Обычная доска объявлений, спарси другую. Или у тебя заказ на этот? Отказывайся, спокойнее спать будешь. Если реально месяц потрачен, то дешевле было бы попробовать базу купить, а то и весь сайт.
>>44739 там база мыл и имен людей занимающихся лесом. Как ни странно бы это не звучало, но закономерность в этой мысли прослеживается: на этой площадке сидят люди из 90-х, которые сколотили большой капитал, контактов их нигде больше нет, собственно никак кроме этой площадки с ними не связаться. Поэтому администрация форума тщательно скрывает данные и меня интересует во первых как и во вторых как ее все же можно обойти?
>>44743 забыл добавить: после прочтения может показаться, что я гонюсь за диким бабло и поэтому прошу Анона сделать работу за меня. Нет. в перспективе имея такую базу и клиентов можно было бы конечно продавать, но меня в первую очередь интересует механизм блокировки. До этого имея дело с множеством различных ресурсов я никогда не сталкивался с таким агрессивным баном, прокси, смена ЮА как правило решали, но тут абсолютно ничто не помогает. Как то анон запилил годный скрипт на js, но после тестирования он тоже провалился либо они пропалили и все исправили. Поэтому если аноны которые посчитают меня далбаебом и ебанутым фанатиком - прошу Вас не беспокоить, это мои личные проблемы, а те кому из спортивного интереса есть дело до такого энтузиазма и нужны детали и подробности - прошу в тред, господа!
Как успехи, криптоанончики? Кто-то кроме >>44692 смог написать парсер? У меня как у >>44148 и >>44152 Пробовал крутить requests, libcurl, selenium. Один хуй пустая страница
>>45028 Я вам выше уже кидал скрин своего успеха, но меня на хуй послали. Ну так как у вас успехи? Увидел на фрилансе заказ по парсингу оного сайта и вспомнил про вас