Скрапинг Сайта Авито За ПАРУ МИНУТ С Помощью Python

  Рет қаралды 33,754

PyLounge - программирование на Python и всё о IT

PyLounge - программирование на Python и всё о IT

Күн бұрын

Пікірлер
@pylounge
@pylounge 4 жыл бұрын
Поддержи лайком, если хочешь продолжение про динамический скрапинг с использованием Selenium)
@pylounge
@pylounge 4 жыл бұрын
@Интернет халява для ленивых Вполне возможно
@ПавелНосов-з8и
@ПавелНосов-з8и 3 жыл бұрын
Огромное спасибо! Написал свой первый парсер благодаря этому видео. Посылаю лучи добра автору
@nickyr42
@nickyr42 3 жыл бұрын
с рандомной зарежкой это крутой финт!!! Спасибо за идею!
@gamesskif6655
@gamesskif6655 4 жыл бұрын
спасибо тебе брат от души.Не поверишь я перекупшекам этот код продаю за 500руб.ахахахах спасибо еще раз)))))))
@xm4dn355x
@xm4dn355x 4 жыл бұрын
ещё есть фреймворк scrappy, но у меня до него пока руки не доходили))) судя по описанию он мощнее супа и удобнее))) А ещё я обычно загружаю первую страницу, парсю пагинатор и из него ворую количество страниц, если там указывается))) и потом циклом for бахаю GET-запросы и HTMLьки получаю))) На счет селениума тоже там подводных камней куча. Допустим под Windows и под Linux он по разному работает, по этому если под виндой работаешь, то надо сразу в докер контейнер запихивать, если у тебя будет на сервере парсер крутиться.
@181q
@181q 3 жыл бұрын
не работает response = 403 "Мы обнаружили на нём подозрительную активность, нарушающую работоспособность Авито."....
@dd-pe5dp
@dd-pe5dp 3 жыл бұрын
авито спалило тебя шо парсиш, пропиши user agent
@ВесёлыеМеханики
@ВесёлыеМеханики 2 жыл бұрын
Добрый день . Подскажи пожалуйста почему такое выводит и как это изменить "Traceback (most recent call last): File "", line 1, in NameError: name 'response' is not defined"
@aleksandryushka9571
@aleksandryushka9571 2 жыл бұрын
Нужно установить response в директорию(папку) с проектом командой pip install response. После нужно установить зависимости командой pip install -r requirements.txt. После чего ошибка уйдёт
@NATTOP
@NATTOP 2 жыл бұрын
авито отбивает гет респонзом 403, соответственно все что дальше не работает. пробовал через юзер агента, но то же самое. подскажите кто сталкивался
@glebkublahanov
@glebkublahanov Жыл бұрын
Я решил проблему так: сперва скачиваю страницу с помощью Selenium (для этого нужно всего несколько строк кода), а потом произвожу скрэпинг этой страницы с помощью BeautifulSoup. Библиотека requests при таком варианте не нужна, но на скачивание страницы уходит секунд 20.
@АлександерАлекс
@АлександерАлекс 4 жыл бұрын
Добрый вечер. А как сделать с получением номера тел ?. Спасибо
@rudmals_
@rudmals_ 2 жыл бұрын
Добрый день, а как можно сделать чтоб цены обновлялись, не просто взять текст, а постоянно работало и следила за изменениями цен?
@manakh5566
@manakh5566 2 жыл бұрын
Это можно сделать с помощью while True по моему?
@СергейЛарионов-у8в
@СергейЛарионов-у8в 2 жыл бұрын
В этом ролике, на 1' 40" Вы говорите, что есть ещё "динамический" скрапинг и у Вас будет отдельный ролик на эту тему. Я что-то не нашёл его... Можете дать URL ?
@yabloko7492
@yabloko7492 7 ай бұрын
Это гениально!!!! 🤩
@leoworker1752
@leoworker1752 4 жыл бұрын
А можешь создать скрипт залогинивания и парсящего все присланные тебе сообщения и отправляющий их на e-mail?
@ralphlauren8349
@ralphlauren8349 3 жыл бұрын
Да
@udozer6543
@udozer6543 2 жыл бұрын
Спасибо за идею, с помощью тебя получилось допилить свой код) Лайк поставил)
@peppapig3834
@peppapig3834 2 жыл бұрын
Привет,как получилось обойти блокировку от ботов?У меня при отправке запроса возвращает html код в котором написано что доступ с этого ip ограничен.
@АлександрПфейфер-н4и
@АлександрПфейфер-н4и 2 жыл бұрын
@@peppapig3834 Такая же проблема. Рандомная задержка не помогает. Вы нашли решение?
@peppapig3834
@peppapig3834 2 жыл бұрын
@@АлександрПфейфер-н4и У меня не получилось решить эту проблему. Как я понял есть два метода парсинга авито, первый заключается в request,я спрашивал на хабре, мне сказали что так можно парсить, но нужно подключить нужные заголовки. Второй метод заключается в использовании модуля selenium , с помощью него у меня тоже не получилось,но только потому что модуль у меня криво работал и я так и не разобрался. Попробуйте парсить через selenium может получится.
@АлександрПфейфер-н4и
@АлександрПфейфер-н4и 2 жыл бұрын
@@peppapig3834 Тоже нашел метод с selenium. Примечательно, что для обхода нужно либо перенастроить браузер, чтобы он игнорировал режим автоматизации(доступно только в Firefox, chrome такое настраивать не позволяет), либо использовать selenium-steals
@AwesomeDude-w2l
@AwesomeDude-w2l 10 ай бұрын
Этот код не работает. В ВК он вообще с ошибкой print(houses[0]) вместо 1. При проверке компилятором: Traceback (most recent call last): File "Жмите-зеленую-кнопку", line 1, in from bs4 import BeautifulSoup # для парсинга старниц ModuleNotFoundError: No module named 'bs4'.
@comachine
@comachine 5 ай бұрын
подсказать, или сам догадаешься?)
@garrig1925
@garrig1925 2 жыл бұрын
Привет. Время летит, сайты модернизируются и в итоге скрипт не работает (классы изменились и не могу выбрать нужный). Подскажите новичку...
@Mollysem
@Mollysem 2 жыл бұрын
Братишка, ты не код копируй с видосов а суть понимай. Код страницы когда открываешь, наводись на нужный тебе блок (цена/название/адрес/не важно) и над блоком видно в каком классе этот код и под каким соусом.
@АнисимовСергей-в1з
@АнисимовСергей-в1з 2 жыл бұрын
@@Mollysem это еще часть проблемы понять принцип кода, самое тяжелое это то, что авито не дает доступ к информации для парсера, а вот обойти это для новичка без подсказки тяжеловато
@barcek2281
@barcek2281 2 жыл бұрын
@@АнисимовСергей-в1з а другие сайты?
@JM-et2lx
@JM-et2lx Жыл бұрын
ошибка 403 доступ запрещен к авито в переменной response из-за этого reasone:'Forbidden', status_code: 403. Так, что автор, кури бамбук, твой код не работоспособен.
@l7l7l7lful
@l7l7l7lful 2 жыл бұрын
Было и полезно и интересно)
@lox707
@lox707 3 жыл бұрын
Лайк за машину на превью видео!
@manakh5566
@manakh5566 2 жыл бұрын
У меня ошибка Info = houses[int(count)] IndexError: list index out of range
@hardt0x1c95
@hardt0x1c95 2 жыл бұрын
Авито все поменяли, теперь приходиться делать через костыли
@Скрим-е3я
@Скрим-е3я 2 жыл бұрын
Ничего не понял
@kakTyzZz69
@kakTyzZz69 3 жыл бұрын
огонь спс!
@ABtonatiza
@ABtonatiza 2 жыл бұрын
ну так себе не о чем
@dayanakassenova9802
@dayanakassenova9802 4 жыл бұрын
Как можно теперь отделить эти все данные по КОЛОНКАМ? СРОЧНО пожалуйста)))
@pylounge
@pylounge 4 жыл бұрын
строка.split(',') А дальше элементы массива распихивать куда угодно
@cultofsogga5863
@cultofsogga5863 2 жыл бұрын
айтем
@АлександрМорженко-поэткаменног
@АлександрМорженко-поэткаменног 4 жыл бұрын
Та не липецк а липеськ
@Charlottik
@Charlottik 2 жыл бұрын
это Visual Studio?
@pylounge
@pylounge 2 жыл бұрын
Да
@Charlottik
@Charlottik 2 жыл бұрын
@@pylounge спасибо, видео хорошее
@ilyamurychev8713
@ilyamurychev8713 2 жыл бұрын
title- тайтл, айтем-item. По сути неплохо, но англ. оставляет желать лучшего
Скрейпинг сайтов с помощью библиотеки Selenium
21:10
Мастерская Важных историй
Рет қаралды 43 М.
Enceinte et en Bazard: Les Chroniques du Nettoyage ! 🚽✨
00:21
Two More French
Рет қаралды 42 МЛН
When you have a very capricious child 😂😘👍
00:16
Like Asiya
Рет қаралды 18 МЛН
Une nouvelle voiture pour Noël 🥹
00:28
Nicocapone
Рет қаралды 9 МЛН
Основы PyCharm | Лучшая IDE Для Python
37:50
PyLounge - программирование на Python и всё о IT
Рет қаралды 189 М.
Telegram-бот + парсер на Python
21:29
Иван Викторович
Рет қаралды 124 М.
Читаю КНИГУ "Asyncio и конкурентное программирование на Python" Мэтью Фаулер / ВСЕ ГЛАВЫ
16:49:08
PyLounge - программирование на Python и всё о IT
Рет қаралды 2,2 М.
Решаю Задачи На SQL / SQL Academy
32:16
PyLounge - программирование на Python и всё о IT
Рет қаралды 5 М.
Обход защиты от ботов Cloudflare через Playwright, Python. 2025
2:08
Маэстро автоматизации
Рет қаралды 347
Enceinte et en Bazard: Les Chroniques du Nettoyage ! 🚽✨
00:21
Two More French
Рет қаралды 42 МЛН