Принципы работы парсера WebScraper на примере Авито

  Рет қаралды 20,339

Евгений Лукин

Евгений Лукин

Күн бұрын

Пікірлер: 109
@usota
@usota 3 жыл бұрын
00:24 Запуск парсера WebScraper 00:33 Парсинг с одной страницы 03:31 Парсинг со страниц пагинации 06:17 Парсинг внутренних страниц
@Zyaka-Byaka
@Zyaka-Byaka 3 жыл бұрын
Евгений, без преувеличения "Огромное СПАСИБО"! Если честно, то не ожидал что Вы ответите на просьбу о помощи, да еще и так быстро. Я уже начал готовить себя к тому что придется миллиона полтора картинок вытаскивать по одной вручную!
@usota
@usota 3 жыл бұрын
Пожалуйста, рад был помочь )
@ФедорСорокин-э7ь
@ФедорСорокин-э7ь 2 жыл бұрын
волшебный туториал, таких туториалов дай бог каждому! Лайк Подписка Комментарий
@РоманБлохин-и2ю
@РоманБлохин-и2ю 2 ай бұрын
Ценный видос, благодарность Евгений!
@Malkoilya
@Malkoilya 2 ай бұрын
Большое спасибо за ценную информацию! Всех благ и процветания желаю)
@МаратАрти
@МаратАрти 3 жыл бұрын
Очень полезное видео. И автор очень отзывчивый. Благодарю!
@usota
@usota 3 жыл бұрын
Пожалуйста, рад помочь!
@coolchannel4291
@coolchannel4291 2 жыл бұрын
Евгений огромное вам спасибо за ваш труд. Это самое лучшее видео по бесплатному парсеру. Спасибо что помогли мне) Почему так мало подписчиков не пойму)
@usota
@usota 2 жыл бұрын
Спасибо большое, очень приятно, рад, что пригодилось!
@mikegalaktionov4191
@mikegalaktionov4191 3 жыл бұрын
спасибо большое за обзор!! у меня получилось вытянуть всю необходимую инфу) блок про парсинг внутренних страниц оказался очень полезным. хотел сегодня покупать подписку на сервис, а оказалось можно парсить вручную! )
@usota
@usota 3 жыл бұрын
Очень рад, что пригодилось)
@nikolayjmaev6102
@nikolayjmaev6102 Жыл бұрын
Жень, огромное спасибо, ты сэкономил мне денег, тысяч так 20 в год )
@moon_star1961
@moon_star1961 3 жыл бұрын
Огромное спасибо! Очень помогли!
@dhard1410
@dhard1410 2 жыл бұрын
СПАСИБО ОГРОМНОЕ!
@ЛилияАксёнова-щ7ъ
@ЛилияАксёнова-щ7ъ 3 жыл бұрын
Евгений, +1000 Вам в карму, медаль за отмену крепостного права, и грамоту за отмену рабства! Сколько соков в нашей компании было выпито из студентов, тупо собирающих прайсы! Меня это не волновало, я же аналитик, пусть копают. Но когда передо мной - патологической лентяйкой - предстала необходимость копать самой в личных целях... Хотела уж школьника сына засадить за ковыряние, в 14 лет это же не должно считаться эксплуатацией))) И Ваше видео! Просто, доступно, гениально! Спасибо огромное! Только, простите, не могу поделиться видео. Во-первых, "такая корова нужна" самому. Во-вторых, боюсь стать той самой обезьяной, которая будет бегать на пальму за бананами для вожаков стаи.
@usota
@usota 3 жыл бұрын
Спасибо, очень приятно! )
@PoorRadio
@PoorRadio 3 жыл бұрын
спасибо за инструкцию
@usota
@usota 3 жыл бұрын
Пожалуйста, рад что пригодилось)
@newgen8136
@newgen8136 Жыл бұрын
Thank you very much !!!
@ДенисМаксимов-п2п
@ДенисМаксимов-п2п Жыл бұрын
Спасибо огромное! Работает! Очень удобно Но заткнулся на скролле, когда открывается новые элементы при скролле, покажете?
@blogowin
@blogowin Ай бұрын
По поводу бесплатности - это да, о вот по поводу понятности. С пагинацией уже несколько дней бьюсь. Сайт хитрый - страницы не обычными стрелками влево-вправо, а открытыми ссылками . Селектор текст - видит список, селектор линк - видит чистый список и список с ссылками., пагинация - видит так же как линк, но парсить отличную от первой страницу просто отказывается. укажи пятую, восьмую, десятую - в итоге ссылки будут все равно ТОЛЬКО на первую страницу
@ЖеняШвец-к5ы
@ЖеняШвец-к5ы 5 ай бұрын
Подскажите пожалуйста. Раньше я пользовался contentdowenlouder x1 но устал от него ищу альтернативу. Этот будет норм или есть ещё что-то интересное?
@usota
@usota 5 ай бұрын
Не работал с тем, что вы сказали) WS покрывает мои простые задачи на 100%. Если что-то сложное нужно решать - беру Python.
@snilkashnilka429
@snilkashnilka429 2 ай бұрын
добрый вечер. очень понравились ваши видео. посоветуйте как можно спарсить собственные переписки в авито коих великое множество. чтобы собрать их в один потом файл и проанализировать. пробовал скролить скрепить и линк ставить, но похоже не верная последовательность. у сообщенйи разные ссылки
@ВасяЛамбада-ж8ц
@ВасяЛамбада-ж8ц 3 жыл бұрын
хороший материал, спасибо. подскажите пожалуйста почему у Вас во втором результате (при добавления данных по типу дома) количество строк меньше, чем в первом? Парсер должен был просто добавить столбец же? или я что-то не так понял?
@usota
@usota 3 жыл бұрын
Спасибо за хорошую оценку. Строк меньше, потому что я прервал работу парсера и не стал дожидаться всех результатов.
@Vinchek
@Vinchek 6 ай бұрын
Можно ли сделать пагинацию с помощью Element Click? Пагинация сделана с помощью Java Script
@prosto-zritel
@prosto-zritel Жыл бұрын
А можно сделать, чтобы собирал статистику просмотров и применяемых услуг?
@usota
@usota Жыл бұрын
Если это есть в коде страницы - то это можно собрать.
@prosto-zritel
@prosto-zritel Жыл бұрын
@@usota Существуют на рынке парсеры, которые собирают эту информацию и по итогу формируется Ексель файл, со всеми данными, кроме номеров телефона, благодаря чему можно найти и отфильтровать популярные объявления и трендовые товары. Возможно парсинг происходит из кабинета Авито про расширенные версии, не с базового тарифа. А просто парсинг смысла практически никакого для анализа, только для мониторинга нужных товаров разве что.
@Дмитрий-э3с4и
@Дмитрий-э3с4и Жыл бұрын
Спасибо Вам огромное, все получилось, но только методом тыка. Вы почему-то не показываете ключевые моменты настройки, поэтому по Вашему материалу ничего не получилось сделать. Возможно сам парсер изменился. Но все равно огромное спасибо!
@ArtemLarin666
@ArtemLarin666 2 жыл бұрын
Спасибо, видео супер! А может ли он парсить страницы с бесконечной прогруткой? Т.Е. с автоматически подгружаемыми блоками
@usota
@usota 2 жыл бұрын
Спасибо за высокую оценку, очень приятно! Да, WebScraper парсит страницы с бесконечной прокруткой. Для этого используется селектор "Element scroll down". Я думаю, раскрою это тему подробнее в следующих видео.
@leolevkod3032
@leolevkod3032 Жыл бұрын
Здравствуйте, Евгений. Вопрос по иерархии элементов в Вашей карте выборки. Ссылка на страницу где Вы берете тип дома уже находиться в группе element может стоило "провалиться" в элемент родительский Item чтобы там добавить элемент Link как дочерний? Или это не имеет значения?
@usota
@usota Жыл бұрын
Да, можно и так
@Zyaka-Byaka
@Zyaka-Byaka 3 жыл бұрын
Евгений, спасибо за видео. Помогло справиться с сайтом поставщика автозапчастей, где другие парсеры ничего не парсили! Но! Есть вопрос и просьба о помощи! Не получается спарсить картинку товара в полном размере. Миниатюра парсится на ура, но чтобы получить полное изображение нужно кликнуть на миниатюру. Все страницы товара с бесконечным скроллом. При настройке парсинга одного товара, все норм, но как только настраиваю по скроллу, так картинка не парсится. Помогите пожалуйста.
@usota
@usota 3 жыл бұрын
1) Есть два способа получить полное изображение. Первый - найти тег с полным изображением в исходном коде сайта. Второй - выбрать селектор "Клик" и сэмулировать клик по изображению, а потом уже скачивать фото. 2) По вопросу скролла - скорее всего надо немного донастроить парсер и данные будут собираться. Смотрите, в парсере есть возможность экспортировать его настройки. Пункт меню Export Sitemap. Пришлите мне на почту эти данные, я смогу ответить на ваш вопрос более точно. Контакты в описании.
@Zyaka-Byaka
@Zyaka-Byaka 3 жыл бұрын
@@usota написал на почту
@goonik
@goonik 2 жыл бұрын
Я понял почему ты теперь ставишь свою **лицо** в треть экрана - хочешь чтобы все видели как ты похудел. За это видео спасибо, полезное.
@usota
@usota 2 жыл бұрын
Не переходите на личности пожалуйста
@goonik
@goonik 2 жыл бұрын
@@usota ладно, не заводись 🙄
@snilkashnilka429
@snilkashnilka429 2 ай бұрын
а настройки которые в описании куда вставлять?
@ГригореевичНадыр
@ГригореевичНадыр 3 жыл бұрын
Добрый день. Спасибо за полезную инфу. А как контакты вытягивать, подскажи пожалуйста.
@usota
@usota 3 жыл бұрын
Спасибо за вопрос. Если под контактами вы имеете ввиду номер телефона, то на авито - это изображение. Теоретически, если бы авито получил у своих пользователей разрешение на использование их персональных данных третьими лицами в соответствии с законом 152-ФЗ, то можно было бы спарсить номера в виде изображений и распознать цифры. Но это уже находится за рамками простого парсера WebScraper.
@ГригореевичНадыр
@ГригореевичНадыр 3 жыл бұрын
@@usota Спасибо
@spartach1925
@spartach1925 9 ай бұрын
добрый день. времени много прошло, но вдруг ответите, можно ли парсить календарь бронирований с объявлений посуточно?Придумал костыль в виде блока запросов на каждый день в заданном интервале, но в идеале хотелось бы иметь колонку со списком занятых дат допустим на неделю или месяц вперед в любом формате за один проход
@usota
@usota 9 ай бұрын
Добрый день, готового решения у меня нет, но я бы тоже начал с блока запросов, а там уже в процессе вырулил бы на оптимальный вариант. Сразу хорошо ничего не получается, сначала пару-тройку подходов с ошибками, и так в любой задаче. Уверен, у вас всё получится .
@beststoryNOGACHC
@beststoryNOGACHC Жыл бұрын
у меня парсится в стиле лесенки по абзатцам как их выровнить чтобы в вместе были в одной строке по разным столбцам как у вас??? помогите пожалуйста
@cubensis2367
@cubensis2367 Жыл бұрын
Все круто да только, контакты не могёт получается?
@usota
@usota Жыл бұрын
Скорее всего нет, не пробовал
@leolevkod3032
@leolevkod3032 Жыл бұрын
Здравствуйте, Евгений. Скажите пожалуйста как в процессе парсировки результатов поиска в гугл перебирать страницы если в перелистывание происходит списком например 20 записей? Что-то я не могу найти.
@leolevkod3032
@leolevkod3032 Жыл бұрын
Нашел. Использовал Pagination
@talgatmustafin5236
@talgatmustafin5236 3 жыл бұрын
Здравствуйте! Хорошая подача материала! Подскажите как установить этот Web Scraper в браузер?
@usota
@usota 3 жыл бұрын
Здравствуйте, спасибо! В описании оставил ссылку на официальный сайт. Но вы можете установить его и из каталога расширений для браузера.
@talgatmustafin5236
@talgatmustafin5236 3 жыл бұрын
@@usota Оперативно! Спасибо!
@SV-13
@SV-13 11 ай бұрын
Как вытянуть картинки по каждой квартире, если их там несколько штук? Не хватило такой информации. А так, конечно, очень познавательно, ага...
@usota
@usota 11 ай бұрын
WebScraper не профессиональный парсер и сбор картинок как привило я делаю отдельно через селектор img с отметкой галочки «мультипл». На официальном сайте WS есть подробные примеры с видео, поэтому тут разобран только базовый пример.
@evg3n1y
@evg3n1y 2 жыл бұрын
а как парсить с определенных страниц? например в пагинации указаны специально разные цифры тут либо по пагинации идти, либо вручную проставить где можно синтаксис еще глянуть парсера?
@usota
@usota 2 жыл бұрын
Про пагинацию расскажу в отдельном видео, там есть 3 способа, как это делать. Но чтобы не ждать - синтаксис описан в документации и есть примеры в видео на сайте WebScraper
@YourStationHere
@YourStationHere Жыл бұрын
Здравствуйте Евгений, Помогите Пожалуйста у меня выходит (FAILED_TO_CONNECT_TO_CHROME_TAB) когда нажимаю select, не знаю что делать. Спасибо вам за видео!
@igorkent
@igorkent 9 ай бұрын
Привет 🤗 Как телефон спарсить?)
@user_alex_
@user_alex_ 11 ай бұрын
👍👍👍👍👍👍👍👍👍👍👍👍
@МарияДемахина-ш4ф
@МарияДемахина-ш4ф Жыл бұрын
Добрый день! Подскажите, если link не находит ссылку на странице, но она есть. Но именно ее не видит, остальные видит. Что можно сделать?
@andr_hot
@andr_hot 2 жыл бұрын
Евгений, здравствуй, хотел спросить, есть допустим сайт одежды, и нужно про парсить его по некоторым пунктам, там цена, название, картинка, но пропарсить надо его все товары, которые есть на сайте, это возможно как-то по быстрому сделать? Или это надо тупо на кажду страницу категорий товара зходить и выбирать? А то я только понял как выбрать все товары с одной страницы, а если есть другие категории, как там быть?
@usota
@usota 2 жыл бұрын
Здравствуйте, вы верно рассуждаете - заходить в каждую категорию не нужно. Как правило структура категорий во всех разделах сайта одинакова. Поэтому указав парсеру, как парсить одну категорию, он по такому же принципу соберёт остальные категории.
@andr_hot
@andr_hot 2 жыл бұрын
@@usota Здравствуйте еще раз, хотел спросить, а как получить Sitemap? Я просто по вашему примеру делал, но только другой сайт, но у меня карта что-то не те результаты дает, точные почти никакие результаты не дает
@usota
@usota 2 жыл бұрын
Наберите в адресной строке имясайта/sitemap.xml и как правило сразу попадёте на карту сайта. Если я правильно понял вопрос )
@andr_hot
@andr_hot 2 жыл бұрын
@@usota спасибо, уже понял, и вообще спасибо за отзывчивость, не каждый отвечает подписчикам, спасибо ещё раз, удачи Вашему каналу!
@usota
@usota 2 жыл бұрын
Спасибо!
@user-ld1kf5gl4s
@user-ld1kf5gl4s 2 жыл бұрын
Здравствуйте, если парсить например заголовки и цены, то парсит не всё а только половину заголовков и половину цен. А если парсить только они заголовки, то парсит всё. Получается нужно по очереди, сначала например заголовки а после цены? Спасибо!
@usota
@usota 2 жыл бұрын
Здравствуйте. Парсер - это машина. Как ей скажешь, так и сделает. Попробуйте задать условия иначе. Я уверен, можно и заголовки и цены собрать за один проход.
@AlexeyParshykov
@AlexeyParshykov Жыл бұрын
Добрый день. Как номер телефона спарсить?
@usota
@usota Жыл бұрын
Здравствуйте, к сожалению, не знаю - с такой задачей не сталкивался. Номера всё равно подменные, потому и бесполезны.
@psergio_it4884
@psergio_it4884 Жыл бұрын
А есть ли возможность парсить данные Авито при задание периода (дата от и до)? Как это можно сделать.. Заранее благодарю
@usota
@usota Жыл бұрын
К сожалению, этот парсер не поддерживает условия выхода из парсинга. Ну кроме ограничения пагинации через квадратные скобки [1:10]
@ramilhafiz6741
@ramilhafiz6741 3 жыл бұрын
Реклама курсов по Python как бы намекает, что парсить лучше на Питоне)
@usota
@usota 3 жыл бұрын
Да, реклама прямо в тему))). А вобще лучше подбирать под задачу подходящий ей инструмент. Разовый парсинг Вебскрейпером будет быстрее, чем написать скрипт на пайтоне.
@ATTosco
@ATTosco 10 ай бұрын
можно ли настроить скраппер чтобы он пароль вводил и парсил в запланированное время регулярно?
@usota
@usota 10 ай бұрын
Парсинг по расписанию есть только в версии по подписке, но цены на подписку такие, что дешевле заказать парсер под свою задачу либо написать самому на Python или BrowserAutomationStudio.
@ATTosco
@ATTosco 10 ай бұрын
@@usota спасибо за ответ
@ATTosco
@ATTosco 10 ай бұрын
@@usota а сколько стоит заказать парсер? как узнать?
@usota
@usota 10 ай бұрын
Напишите в наш телеграм-чат @proparsing, там ребята отлично разбираются в парсинге. К сожалению, кого-то конкретно порекомендовать не могу.
@vasiliymalich
@vasiliymalich 2 жыл бұрын
Доброго времени, подскажите как парсить Ютуб, не все элементы видит (
@usota
@usota 2 жыл бұрын
Мало информации. Но предположу, что не все элементы успевают загрузиться - попробуйте увеличить задержку между запросами до 6-8 секунд.
@vasiliymalich
@vasiliymalich 2 жыл бұрын
@@usota могу вам как-то написать лично ?
@usota
@usota 2 жыл бұрын
Да, в описании есть контакты, напишите в WhatsApp.
@Mr-maxf
@Mr-maxf 3 жыл бұрын
Авито мобильный ip заблокировал после парсинга 6 страниц.
@usota
@usota 3 жыл бұрын
Возможно и такое. У любого бесплатного инструмента есть ограничения. В этом, к сожалению, нельзя использовать прокси. Но можно попробовать перенести парсинг на позже и делать более длинные паузы между запросами.
@МИШКАГАММИ-о8ф
@МИШКАГАММИ-о8ф 2 жыл бұрын
Приветствую а номера как то можно таким способом добыть? хочу пропарсить сайт с объявлениями в своем городе, но мне нужны только номера, получится? Я пробовал у меня не получается
@usota
@usota 2 жыл бұрын
Нет, таким способом не получится. Способ получить номера другой и не этой программой. Я, например, беру номера из мобильной версии.
@МИШКАГАММИ-о8ф
@МИШКАГАММИ-о8ф 2 жыл бұрын
@@usota можешь подсказать пожалуйста как это сделать, и какая программа нужна? очень нужно
@МИШКАГАММИ-о8ф
@МИШКАГАММИ-о8ф 2 жыл бұрын
@@usota там просто нужен переход на страницу номера сразу видны
@usota
@usota 2 жыл бұрын
Мне кажется только ленивый не предлагает парсинг телефонов авито) Там простенький скрипт на Python. Напишите мне, помогу. Контакты в описании есть
@МИШКАГАММИ-о8ф
@МИШКАГАММИ-о8ф 2 жыл бұрын
@@usota да я не про авито, спасибо, сейчас напишу
@vaxidjonbaratov2089
@vaxidjonbaratov2089 Жыл бұрын
Nomer telefon neto zdes. A kak mojna parsirovat telefon nomer toje?
@usota
@usota Жыл бұрын
Этим инструментом, к сожалению, не возможно. Номер телефона выводится в виде изображения, а не текста.
@PiZzDAO
@PiZzDAO Жыл бұрын
@@usotaа с сайтов где номер текстом отображается, можно спарсить номера?
@usota
@usota Жыл бұрын
@_technomutant_ да, текст можно спарсить селектором text
@jackspades6492
@jackspades6492 2 жыл бұрын
Сейчас нет смысла парсить так как авито ставит левые номера вместо реальных
@usota
@usota 2 жыл бұрын
Да, номера парсить смысла нет
@jackspades6492
@jackspades6492 2 жыл бұрын
А что есть смысл парсить ? )
@usota
@usota 2 жыл бұрын
Свежие объявления о квартирах или авто, чтобы не пропустить привлекательные, например. Не номерами едиными богато авито.
@СпециальныйагентСтивенс-ФБР
@СпециальныйагентСтивенс-ФБР 7 ай бұрын
Минус этой программки в том что сохраняет он в таблице ещё первые два не нужных столбца
@sse9686
@sse9686 2 жыл бұрын
Не лучший способ подачи информации, но на безрыбье и рак рыба. Направление задано, а дальше самим разбираться. Извините, лайк за такую подачу не поставлю.
@usota
@usota 2 жыл бұрын
Спасибо за обратную связь
@sse9686
@sse9686 2 жыл бұрын
@@usota , здравствуйте. Нашел Ваше второе более подробное видео. Вы хотели нам помочь, затратили своё время, поэтому мне несколько совестно Вас критиковать. Но Вы сами спросили моё мнение. Выскажусь относительно длительного видео. Рассказываете тактику подробно, но когда дело доходит до нажатия кнопок, происходит рассинхронизация голоса и дела. Например, Вы рисуете логику запросов на 8-й минуте. Это средствами обозреваемого плагина или другой утилитой. 2) Используете "кальку" английских слов, типа "пагинг", те самым теряется смысл рассказа. 3)Что-то нажимаете, на экране что-то изменилось, но не понятно, какую кнопку Вы нажали. Например, Вы нажимали кнопку ШИФТ или КОНТРЛ? Как бы я снимал? Я показал бы выполняемые шаги руками, что бы пользователь понял, что тоже самое будет делать программа. Со всем уважением к Вам.
WebScraper - парсим без кода сайт поставщика
46:39
Евгений Лукин
Рет қаралды 19 М.
Парсер авито - SuperSellerPRO -Jonn22 Поиск ниши и товара
22:28
Forum-X com Товарный бизнес от А до Я
Рет қаралды 12 М.
Do you love Blackpink?🖤🩷
00:23
Karina
Рет қаралды 22 МЛН
From Small To Giant 0%🍫 VS 100%🍫 #katebrush #shorts #gummy
00:19
coco在求救? #小丑 #天使 #shorts
00:29
好人小丑
Рет қаралды 40 МЛН
Парсинг без программирования II. WebScraper
30:30
Евгений Лукин
Рет қаралды 8 М.
No Code Web Scraping Tool: How to Extract Data with Octoparse
13:06
Web Scraping with Franek
Рет қаралды 18 М.
«Осень». Самая большая загадка Windows XP
14:36
Девять десятых
Рет қаралды 1,4 МЛН
Парсинг товаров с сайта
6:55
Руслан Фасхутдинов
Рет қаралды 130
Парсинг недвижимости Авито, Циан, Яндекс. Часть I
1:02:28
Парсер авито superseller.pro: анализ - часть 1. Как понять алгоритмы авито
27:12
Forum-X com Товарный бизнес от А до Я
Рет қаралды 7 М.
Do you love Blackpink?🖤🩷
00:23
Karina
Рет қаралды 22 МЛН