Если вы знаете другие полезные инструменты, не забудьте оставить их в комментариях, я попробую найти им применение и сделаю видео на эту тему 🙂 Всем спасибо
@НикитаОбухов-б2м Жыл бұрын
Есть возможность дождаться пока выполнятся ajax запросы, а затем обрабатывать html?
@saisho5545 Жыл бұрын
@@НикитаОбухов-б2месть библиотека puppeteer на js Очень удобная для парсинга
@goshaposhlyy2 жыл бұрын
Тор, спасибо , от тебя узнаю больше чем от 99% других каналов
@zproger2 жыл бұрын
Это круто =)
@ОлегШенкер-з8ш Жыл бұрын
Практически слово в слово озвучена документация к библиотеке. 😂😂😂 крутяк!!!
@sergeidb91992 жыл бұрын
Дружище, ты даже не представляешь как ты меня выручил. Написал огромный парсер для сайта с сотнями тысяч ссылок, работающий в многопотоке. Часть информации скрапил Селениумом, часть - LXML-ем, но куча открытых селениумом браузеров в режиме многопотока просто ложили сервак. Эта библиотека Requests-HTML просто в корне все меняет. Спасибо тебе огромное!
@nouaksomtac67827 ай бұрын
у меня не заработала в много потоке, имено функсия render
@СашаВетрогон-е7о7 ай бұрын
@@nouaksomtac6782 у меня даже без многопотока сейчас не работает функция render
@avax34962 жыл бұрын
Как ты угадал, что я хочу узнать про парсинг?))) Спасибо за ролик, пушка!
@zproger2 жыл бұрын
Я экстрасенс =)
@avax34962 жыл бұрын
@@zproger тогда это многое объясняет!)))
@Dreamer_782 жыл бұрын
Спасибо большое за видео! чудесный инструмент, желаю вам процветания и успехов!!!
@zproger2 жыл бұрын
Благодарю, желаю и Вам того же
@night_niker2 жыл бұрын
Слушай, спасибо тебе огромное!!! Я в восторге! Не мог несколько дней побороть скрипты на сайте, уже начал джаву учить, а тут всё настолько просто. Максимальное уважение, лайк, однозначно!
@zproger2 жыл бұрын
Рад что видео помогло =)
@night_niker2 жыл бұрын
@@zproger, ага, курс по парсингу тоже огонь🔥, проект в универе благодаря ему закрыл)
@QwDragon2 жыл бұрын
Вместо того, чтобы напрямую к api обратиться?
@bujik2 жыл бұрын
Шикарно, где же ты был раньше!
@zproger2 жыл бұрын
Был здесь =))
@its_niks2 жыл бұрын
Спасибо огромное) Полезная библиотека
@zproger2 жыл бұрын
Это да, достаточно интересная либа =)
@viktorpryima29942 жыл бұрын
Огонь!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! Благодраю за интересную информацию!!!!!!
@zproger2 жыл бұрын
Рад что помогло, спасибо =)
@sledleo2 жыл бұрын
Классно и познавательно! Ждём ещё!
@zproger2 жыл бұрын
Спасибо
@SkveerBoy2 жыл бұрын
Бомба вообще ) до этого думал какой библиотекой можно работать кроме selenium, теперь знаю.
@zproger2 жыл бұрын
Есть ещё несколько крутых инструментов, но это уже в других роликах =)
@SkveerBoy2 жыл бұрын
@@zproger круто ждём)
@artembagachkov9332 жыл бұрын
Это просто пушка, одно из самых полезных видео которые я когда либо видео, спасибо
@zproger2 жыл бұрын
Благодарю
@ktopogizni2 жыл бұрын
Очень полезная инфа, продолжайте в том же духе! подписчиков мало но это временно уверен! скоро будем 10000 лайков собирать :)
@zproger2 жыл бұрын
Благодарю, очень приятно
@Valarxx2 жыл бұрын
Камон, 20к не так уж мало)) Скажи это челу, который ждёт, когда у него накопится 200 подписчиков 😁
@Happy-rj7om2 жыл бұрын
Ты ж мое золото) Столкнулся с JS при парсинге, не знал что делать, уже руки опустил
@zproger2 жыл бұрын
Рад что помогло =)
@Tommy7417 Жыл бұрын
Спасибо за такие суперские ролики. 👍
@Shlapoklapik2 жыл бұрын
Это просто невероятно, спасибо я теперь не овощ
@zproger2 жыл бұрын
Рад что понравилось :))
@crutoboy2 жыл бұрын
Как только я наткнулся на твой ролик, мой мир разделился на до и после
@zproger2 жыл бұрын
=)
@RNikSan2 жыл бұрын
Круто! Как всегда на уровне, спасибо!
@zproger2 жыл бұрын
Благодарю!
@efamir82252 жыл бұрын
супер мега топ, завтра проверю. если это работает, то я счастлив
@zproger2 жыл бұрын
=)
@supreltd Жыл бұрын
Спасибо!! Этот способ мне на много больше понравился
@kozsv2 жыл бұрын
Ещё бы по больше про асинхронность, многопоточность и моного ядерность 😁
@zproger2 жыл бұрын
Постараюсь :)
@shustriy19802 жыл бұрын
Спасибо за ваше видео по парсингу. Очень полезно. Мне кажется было бы более наглядно если бы вы смогли на примере какого то сайта показать преимущества этой библиотеки по сравнению с bs4
@LOGOSTT2 жыл бұрын
Поддержу, лучше показывать на реальных задачах
@gilman20562 жыл бұрын
согласен, практическая задача лучше понимается, нежели абстрактная в вакуме
@cccombobreaker62172 жыл бұрын
Огромное спасибо, теперь надобность в bs4 отпадает) У тебя очень крутой канал!
@zproger2 жыл бұрын
Благодарю, рад что было полезно :)
@ДмитрийУшаков-л6ж2 жыл бұрын
А там bs4 в зависимостях, кста
@rokot2 жыл бұрын
Спасибо большое, очень полезно! Насчёт return надо произносить так "ритёрн"
@zproger2 жыл бұрын
Спасибо, учту
@HastaLM19872 жыл бұрын
Хорошее, полезное видео.
@zproger2 жыл бұрын
Спасибо
@Anonim-im6ln2 жыл бұрын
Дуже дякую!)😁💚
@margojazny2 жыл бұрын
Спасибо за информацию о библиотеке, она решила мою проблему! :-)
@kozsv2 жыл бұрын
Спасибо, про парсинг можно бесконечно смотреть ролики. Это золотая жила тем более если ещё больше разжовывать и показывать на целых небольших примерах, учу питон по видео, очень помогает разбор проектов как они работают. Ну для меня лично проще я так потом маленькие проекты свои делаю когда легко и понятно написан по нему учить легко.
@andrewsalnikov4382 жыл бұрын
Спасибо за видео, интересная бибилиотека...а то я все по старинке привык :-), через bs4 с BeautifulSoup...
@zproger2 жыл бұрын
Я тоже =)
@DIMFLIX2 жыл бұрын
Спасибо большое за такую крутую либу! Очень помогла в нынешнем проекте. Есть вопрос - как подключить туда прокси с авторизацией? В документации ничего не нашел, собственно как и в интернете тоже.
@vukeep2 жыл бұрын
Отличны материал для начинающих! интересно было бы посмотреть как использовать cookie для парсинга.
@zproger2 жыл бұрын
Уже есть такое видео на канале =)
@kutsokon2 жыл бұрын
Кажется это то, что я искал. До этого момента использовал только requests с простыми сайтами и selenium там где нужно было грузить js. С этой либой я так понимаю можно асинхронно делать запросы, подгружая js? А если не использовать асинхронность и грузить js, скорость должна быть примерно как на селениум? Хотя почему-то кажется что быстрее должно быть с request_html в последнем варианте
@vegameta2 жыл бұрын
Чел спасибо огромное!
@Кискисыч3 ай бұрын
привет, не мог ты записать видео о кастомизации твоего cinnamon, пожалуйста. я знаю что у тебя сейчас уже тайловый менеджер, но может всё таки вспомнишь названия тем
@ratmirbrooooo2 жыл бұрын
М-да.. Ты забыл упомянуть, что это библа использует также selenium, даже в документации написано, что она также будет использовать двигло chromium. Так что не думаю, что это библа как-то быстрее будет рендерить js... Из альтернатив могу посоветовать requestium - это библа так-же под капотом держит открытым selenium.
@zproger2 жыл бұрын
Да, но фишка что всё будет в одном месте. За библиотеку спасибо, не слышал о такой.
@Heymdale2 жыл бұрын
В зависимостях нет селениума, вместо него pyppeteer, который действительно использует chromium, разница в производительности возможна, нужно тестить.
@dicloniusN356 ай бұрын
А если сайт через js динамичный то эта библиотека похоже не работает - на озон 403. какбы этот js передать обратно playwright ?
@АлександрК-ш2 жыл бұрын
Здравствуйте. А можно исходник кода по последнему примеру, а то не понял?
@RPacket-hp5zk Жыл бұрын
А как вы открыли в терминале local или venv
@dendisega16752 жыл бұрын
Спасибо
@zproger2 жыл бұрын
=)
@GroledPlay2 жыл бұрын
Крутая библиотека
@zproger2 жыл бұрын
=)
@DF-09972 жыл бұрын
Давай про отпечаток системы на питоне! по звуку, по канвасу как в джаваскрипте 😁🚬
@zproger2 жыл бұрын
Крутая идея, сделаю обязательно :)
@bir52k1kv178 Жыл бұрын
@@zprogerкогда ? Год прошел уже )
@learninglearning3869 Жыл бұрын
Можно ли с помощью данной библиотеки нажимать на кнопки, как в селениум?
@accidiet Жыл бұрын
Благодарю Вас, потестирую данную библиотеку на парсинг сайтов под react_js если она будит рендерить и парсить html под react_js и это будит то что я конечно искал и вам респект, не не берет react_js нужен видимо senium
@ВоваВернов2 жыл бұрын
Я немного не понял в конце. Если использовать htmlsession и render это будет работать или обязательно импортировать HTML и уже с ним рендер?
@eygsdtucyug2 жыл бұрын
Спасибо, теперь я понял почему у меня не работал код. Запустить цикл забыл👍
@eygsdtucyug2 жыл бұрын
Как ты вовремя это снял
@zproger2 жыл бұрын
Круто что помогло :)
@notme7277 Жыл бұрын
очень хочется больше про асинхронность!! могу идею для видео подогнать: допустим, парсить определенную категорию озона. т.е. переходим на категорию, 1 страницу, асинхронно парсим посты и скачиваем обложку товара (тоже асинхронно). переходим на 2 страницу и тп..
@Dendrar2 жыл бұрын
Видео супер сохранил на ссд, скоро Ютюб заблокируют....... Надеюсь вы будете на другой какой то площадке выкладывать видео
@zproger2 жыл бұрын
Ничего не заблокируют)
@РоманМатиев-й5н2 жыл бұрын
Полезное видео. Вопрос немного не по теме, но хотелось бы увидеть видео со всеми возможными способами Basic authentication с помощью селениум, питон. Просто недавно столкнулся с проблемой что авторизация вроде проходит, а страница не рендерится. Пришлось изобретать велосипед с сохранением настроек пользователя и перезапуск браузера уже якобы залогиненым пользователем. Может есть варианты проще. Передача а url не считается, в моем случае не работало
@m2rd5182 жыл бұрын
ZProger, очень полезное и информативное видео! Не подскажите как можно сгенерировать список ютуб ссылок по определенному ключевому слову?
@shokavo22052 жыл бұрын
А если на сайте нужна регистрация, как выйти из положения? В селениуме я могу куки подгружать, а тут как быть?
@zproger2 жыл бұрын
Перехватить запросы в dev tools -> Network
@gooddevelopment13922 жыл бұрын
Почему если я использую response = session.get("ссылка") То у response нет атрибута html, тем самым я не могу использовать render() from requests_html import HTMLSession session = HTMLSession() response = session.get('ссылка', cookies=cookies, headers=headers) Дальше не могу вызвать рендер, т.к. просто нету у response атрибута html.. В чем может быть проблема?
@sobolenkoyevgeni3772 жыл бұрын
Такая же фигня
@СергейЮркин-ч1ь2 жыл бұрын
тоже самое, html_ None
@Eslen922 жыл бұрын
После запуска кода с requests_html, он начинает устанавливать chromium, но на 88 процентах вылазит ошибка. Я пробывал установить вручную но не знаю куда перекилывать хромиум, помоги пожалуйста
@Вячеслав-х4е5щ10 ай бұрын
как можно обойти BX.bitrix_sessid() ?
@theG4NS2 жыл бұрын
Могу ли я войти в аккаунт на сайте где используеться яваскрипт с помощью данной библиотеки? За ранее спасибо
@p_r_o_e_k_t_o_r2 жыл бұрын
Эта библиотека при рендеринге JavaScript скачаивает чтоли Chromium? Это чертовски неудобно.
@night_niker2 жыл бұрын
Привет еще раз, в общем, задача спарсить динамически изменяющиеся цены на объявлений на бирже, но requests, requests-html и bs4 не парсят всю страницу целиком. Получается так, что циферок и нет в .text. Подскажи, пожалуйста, что с этим можно сделать? Куда копать?
@Katsiarina12 жыл бұрын
откуда скрипт взялся? что-то не до конца поняла как этим пользоваться :(
@zengl96582 жыл бұрын
Было бы очень кстати узнать как использовать его с прокси, метод который используют для библиотеки requests не подошел
@zproger2 жыл бұрын
Забыл рассказать об этом, но думаю в оф.документации есть примеры с прокси
@zengl96582 жыл бұрын
@@zproger Может я плохо искал и гуглил, но способа для прокси с авторизацией я не нашел. Пойду посмотрю еще раз доки
@usertwgetrukwwr96692 жыл бұрын
@@zengl9658 нашел в итоге ?
@zengl96582 жыл бұрын
@@usertwgetrukwwr9669 Нет!
@alekron852 жыл бұрын
Может кто-нибудь помочь, на сайте, с которого хочу получить данные есть ссылки типа: Text, когда нажимаю, рендерится js code с параметром data-identifier, и страница приобретает тот вид, который мне нужен, как это всё провернуть с помощью python и получить данные?
@deymonster2u2 жыл бұрын
То есть если на странице выполняется какой то js скрипт (вычисляется токен, или какое то уникальное рандомное значение), то я могу отрендерить такой запрос? И ещё положим js меняет куки определенным образом, чтобы защититься от ботов, я смогу получить таким образом правильные куки?
@zproger2 жыл бұрын
Токен можно рендерить, а вот кукисы уже сами обновляться будут в активной сессии
@deymonster2u2 жыл бұрын
@@zproger у меня несколько сложных запросов, в конечном последнем post нужно передать в пейлоад токен и некое рандомное значение, которое вычисляется исходя из токена, и вот его я не могу никак получить: оно точно генерируется где-то в js скрипте ...
@deymonster2u2 жыл бұрын
@@zproger я нашел интересную надстройку-библиотеку selenium wire - она захватывает все запросы браузера, и соответственно все аргументы запросов - в том числе тело запроса и ответы, что мне и нужно было, выдает в виде списка
@zproger2 жыл бұрын
Да, крутая либа, пользовался раньше
@ПищащийГолландец2 жыл бұрын
Вопрос немного не по теме данного видео - Как отключить подсветку комментариев в коде зелёным?
@youngtitanium64182 жыл бұрын
В какой IDE, это вообще зависит от цветовой схемы(В PyCharm: settings=>editor=>color scheme)
@nikitak98412 жыл бұрын
подскажите что за скин пайчарма на видео ?
@zproger2 жыл бұрын
Это из Material UI
@nikitak98412 жыл бұрын
@@zproger благодарю! Очень полезный канал
@Naberegn Жыл бұрын
Я так понимаю что уже не актуальна? Попробовал метод render не работает на сайтах
@zproger Жыл бұрын
Не на всех сайтах будет работать
@blackcatdevel0per2 жыл бұрын
Попробовал requests_html и на linux он грузит копию chromium, почему разрабы просто не используют системный или не дают выбор 😒 (Это конкретно в модуле pyppeteer в файле chromium_downloader.py)
@luispakvard56812 жыл бұрын
Привет Вы не вкурсе вот я хочу скрипт написать который будет загружать картинки на хостинг там скрипт на сервере принимает файл через POST запрос раз в секунду а на бесплатном хостинге ограничения на количество запросов в день как такое осуществить моя программа должна шифровать и выгружать на сервер скриншоты что бы меня потом не забанили на хостинге
@develper22 жыл бұрын
По кайфу
@zproger2 жыл бұрын
=)
@KadenDev2 жыл бұрын
Час назад решил проблему, работал над заказом. ПОЧЕМУ НЕ РАНЬШЕ?)
@zproger2 жыл бұрын
Не успел :))
@mjeday2 жыл бұрын
Супер топ. А клаудфаер обходит?
@zproger2 жыл бұрын
Не, нужно отдельно обходить
@hinomuratomisaburo49012 жыл бұрын
Блин круто 😎. Вопрос a как получать результат от выполнения асинхронной функции? 🤔 return
@bir52k1kv178 Жыл бұрын
Ещё бы узнать как с помощью java кликать по кнопкам и заполнять формы :(
@ВикторНестеренко-н9о2 жыл бұрын
18 часов предлагает качать chromium . ну спасибо. Пойду дальше искать варианты
@AleksandrMelnikov-bo1sn2 жыл бұрын
Не со всеми сайтами работает(
@zproger2 жыл бұрын
это да, инструмент не панацея
@dd-pe5dp2 жыл бұрын
у меня одного майскор не рендерит?
@fushibuzuka74632 жыл бұрын
жаль с Cloudflare не работает.... спасибо за видео и вообще за канал.
@zproger2 жыл бұрын
Есть либы для cloudflare, думаю можно сделать интеграцию
@alexchto2 жыл бұрын
@@zproger какие например? ничего рабочего кроме undetect не нашел, но он на селениум. на 08.2022 очень нужна инфа, как обходить клауд. если сделаешь видос, будет легендарно
@SkveerBoy2 жыл бұрын
Сделай видео как можно отправлять пост запрос с текстом, например на сайте в чат писать! Что то!
@ithelper92 жыл бұрын
А в чём суть видео я не понял?
@zproger2 жыл бұрын
Суть в том, чтобы можно было парсить сайты более удобно
@comingflex2 жыл бұрын
На озон не работает
@zproger2 жыл бұрын
Ну да, он не всегда работает, на специфических скриптах может и не получится
@lordorbit2 жыл бұрын
Создатель либы - гений
@zproger2 жыл бұрын
=)
@maz5718 Жыл бұрын
Ролик пушка, спасибо Пытаюсь по ролику спарсить всем известный яндовский онлайн редактор кода, header прописал как у меня браузер отдает, нифига, JS не рендерится может кто подскажет как это обойти или пофиксить)
@Human-de8nf10 ай бұрын
Давайте теперь наберем 6000 лайков😅
@zproger10 ай бұрын
Давайте)
@Alegudbusiness4 ай бұрын
Не работает
@idensas2 жыл бұрын
Ммм, спасибо
@zproger2 жыл бұрын
=)
@ИмяФамилия-у4п4ф2 жыл бұрын
Зачем рендерить, когда можно просто посмотреть запросы в инструментах разработчика и брать данные с них.
@zproger2 жыл бұрын
Там далеко не всегда есть эти запросы, иногда какой-то важный токен генерится именно с js
@ИмяФамилия-у4п4ф2 жыл бұрын
@@zproger да, они могут быть зашифрованы и спрятаны различным образом. Рендеринг в данном случае более простой вариант, но если разобраться в сайте можно сделать более быстрый парсер)
@ANUARKA2 жыл бұрын
Сделай для сайтов с реакт
@zproger2 жыл бұрын
Если видео зайдет, попробую реализовать что-то подобное
@ЕгорРалович Жыл бұрын
r.html.render() не рендерит страницу с выполнением js, автор просто пересказал документацию толком не разобравшись сам в том, что работает, а что нет.
@BROnik2 жыл бұрын
серьезно? а за что мой коммент удалили? нормальный вопрос же задал... шозабаги)
@zproger2 жыл бұрын
Никто ничего не удалял, ютуб иногда автоматически отправляет в спам, какой у Вас был вопрос?
@BROnik2 жыл бұрын
@@zproger пытался опять добавить, видать опять он удаляется, проверь удаленные, я реально не пытался ничего рекламить или вроде того)
@zproger2 жыл бұрын
Никаких комментариев нет, возможно это баг. Мне как-то от ютуба спустя пол года только прилетело около 300 комментариев за 1 день, которые были написаны уже очень давно
@BROnik2 жыл бұрын
и опять, короче забей, я не могу коммент даже написать длинный, сразу удаляется :(
@ДмитрийПоляков-ю6г Жыл бұрын
Вроде ничего, но по JS очень мало было сказано, ну прям совсем милипуська
@denissunyaev3119 Жыл бұрын
Спасибо за основы, к сожалению ничего кроме основ.
@zproger Жыл бұрын
Пока что да, возможно найдется сайт для более детального видео.
@НиколайПрокопьев-т4м4 ай бұрын
Блин, через два года уже не работает!!! Зае.... лся ошибки исправлять. Строка r.html.render() не работает. Видео устарело.
@zproger2 ай бұрын
А что поделать) Технологии так долго не живут, и через неделю может уже не работать. Но в целом я думаю надо просто актуальные версии поискать на гитхабе, вот и все.
@НиколайПрокопьев-т4м2 ай бұрын
@@zproger Это точно!
@QwDragon2 жыл бұрын
Ни одного реалистичного примера со скриптами... 2:50 Такие два await'а посылают запросы последовательно, а не параллельно.
@ДмитрийУшаков-л6ж2 жыл бұрын
Неее, так не пойдёт. Тема сисек не раскрыта. Раз умеет в настоящий JavaScript рендеринг, то надо было попрововать скормить React приложение. Его отрендерить и попробовать посмотреть получившийся DOM.
@zproger2 жыл бұрын
Если соберем 1к лайков, может быть сделаю продолжение и попробую какой-то сайт на примере автоматизировать