Скрапинг Сайта Авито За ПАРУ МИНУТ С Помощью Python

Рет қаралды 33,754

PyLounge - программирование на Python и всё о IT

Күн бұрын

Пікірлер

@pylounge 4 жыл бұрын

Поддержи лайком, если хочешь продолжение про динамический скрапинг с использованием Selenium)

@pylounge 4 жыл бұрын

@Интернет халява для ленивых Вполне возможно

@ПавелНосов-з8и 3 жыл бұрын

Огромное спасибо! Написал свой первый парсер благодаря этому видео. Посылаю лучи добра автору

@nickyr42 3 жыл бұрын

с рандомной зарежкой это крутой финт!!! Спасибо за идею!

@gamesskif6655 4 жыл бұрын

спасибо тебе брат от души.Не поверишь я перекупшекам этот код продаю за 500руб.ахахахах спасибо еще раз)))))))

@xm4dn355x 4 жыл бұрын

ещё есть фреймворк scrappy, но у меня до него пока руки не доходили))) судя по описанию он мощнее супа и удобнее))) А ещё я обычно загружаю первую страницу, парсю пагинатор и из него ворую количество страниц, если там указывается))) и потом циклом for бахаю GET-запросы и HTMLьки получаю))) На счет селениума тоже там подводных камней куча. Допустим под Windows и под Linux он по разному работает, по этому если под виндой работаешь, то надо сразу в докер контейнер запихивать, если у тебя будет на сервере парсер крутиться.

@181q 3 жыл бұрын

не работает response = 403 "Мы обнаружили на нём подозрительную активность, нарушающую работоспособность Авито."....

@dd-pe5dp 3 жыл бұрын

авито спалило тебя шо парсиш, пропиши user agent

@ВесёлыеМеханики 2 жыл бұрын

Добрый день . Подскажи пожалуйста почему такое выводит и как это изменить "Traceback (most recent call last): File "", line 1, in NameError: name 'response' is not defined"

@aleksandryushka9571 2 жыл бұрын

Нужно установить response в директорию(папку) с проектом командой pip install response. После нужно установить зависимости командой pip install -r requirements.txt. После чего ошибка уйдёт

@NATTOP 2 жыл бұрын

авито отбивает гет респонзом 403, соответственно все что дальше не работает. пробовал через юзер агента, но то же самое. подскажите кто сталкивался

@glebkublahanov Жыл бұрын

Я решил проблему так: сперва скачиваю страницу с помощью Selenium (для этого нужно всего несколько строк кода), а потом произвожу скрэпинг этой страницы с помощью BeautifulSoup. Библиотека requests при таком варианте не нужна, но на скачивание страницы уходит секунд 20.

@АлександерАлекс 4 жыл бұрын

Добрый вечер. А как сделать с получением номера тел ?. Спасибо

@rudmals_ 2 жыл бұрын

Добрый день, а как можно сделать чтоб цены обновлялись, не просто взять текст, а постоянно работало и следила за изменениями цен?

@manakh5566 2 жыл бұрын

Это можно сделать с помощью while True по моему?

@СергейЛарионов-у8в 2 жыл бұрын

В этом ролике, на 1' 40" Вы говорите, что есть ещё "динамический" скрапинг и у Вас будет отдельный ролик на эту тему. Я что-то не нашёл его... Можете дать URL ?

@yabloko7492 7 ай бұрын

Это гениально!!!! 🤩

@leoworker1752 4 жыл бұрын

А можешь создать скрипт залогинивания и парсящего все присланные тебе сообщения и отправляющий их на e-mail?

@ralphlauren8349 3 жыл бұрын

Да

@udozer6543 2 жыл бұрын

Спасибо за идею, с помощью тебя получилось допилить свой код) Лайк поставил)

@peppapig3834 2 жыл бұрын

Привет,как получилось обойти блокировку от ботов?У меня при отправке запроса возвращает html код в котором написано что доступ с этого ip ограничен.

@АлександрПфейфер-н4и 2 жыл бұрын

@@peppapig3834 Такая же проблема. Рандомная задержка не помогает. Вы нашли решение?

@peppapig3834 2 жыл бұрын

@@АлександрПфейфер-н4и У меня не получилось решить эту проблему. Как я понял есть два метода парсинга авито, первый заключается в request,я спрашивал на хабре, мне сказали что так можно парсить, но нужно подключить нужные заголовки. Второй метод заключается в использовании модуля selenium , с помощью него у меня тоже не получилось,но только потому что модуль у меня криво работал и я так и не разобрался. Попробуйте парсить через selenium может получится.

@АлександрПфейфер-н4и 2 жыл бұрын

@@peppapig3834 Тоже нашел метод с selenium. Примечательно, что для обхода нужно либо перенастроить браузер, чтобы он игнорировал режим автоматизации(доступно только в Firefox, chrome такое настраивать не позволяет), либо использовать selenium-steals

@AwesomeDude-w2l 10 ай бұрын

Этот код не работает. В ВК он вообще с ошибкой print(houses[0]) вместо 1. При проверке компилятором: Traceback (most recent call last): File "Жмите-зеленую-кнопку", line 1, in from bs4 import BeautifulSoup # для парсинга старниц ModuleNotFoundError: No module named 'bs4'.

@comachine 5 ай бұрын

подсказать, или сам догадаешься?)

@garrig1925 2 жыл бұрын

Привет. Время летит, сайты модернизируются и в итоге скрипт не работает (классы изменились и не могу выбрать нужный). Подскажите новичку...

@Mollysem 2 жыл бұрын

Братишка, ты не код копируй с видосов а суть понимай. Код страницы когда открываешь, наводись на нужный тебе блок (цена/название/адрес/не важно) и над блоком видно в каком классе этот код и под каким соусом.

@АнисимовСергей-в1з 2 жыл бұрын

@@Mollysem это еще часть проблемы понять принцип кода, самое тяжелое это то, что авито не дает доступ к информации для парсера, а вот обойти это для новичка без подсказки тяжеловато

@barcek2281 2 жыл бұрын

@@АнисимовСергей-в1з а другие сайты?

@JM-et2lx Жыл бұрын

ошибка 403 доступ запрещен к авито в переменной response из-за этого reasone:'Forbidden', status_code: 403. Так, что автор, кури бамбук, твой код не работоспособен.