Лучшая поддержка канала - поддержка копеечкой 🥺 boosty.to/pseudodev
@CaptainBab3 ай бұрын
Учусь по твоим видосам парсить, офигел от такого малого каличества просмотров и комментов, спасибо за такую подачу и вообще ролики.
@dyze8847Ай бұрын
занимаюсь автоматизацией сайтов уже +- более года. Посмотрел видео - открыл для себя что-то новое! Совет: можно скрывать присутствие робота на сайте, добавляя заголовки, отключающие "автоматизацию" на сайте. Много раз выручало. Без лишних импортов) Ну тут как кому удобно. Сам придерживаюсь мнению: программист, как художник - свое видение. Для задачи - много методов решения
@SergeyPopovichevPS28 күн бұрын
Шатунов жив и парсит сайты
@Vladimirelec25 күн бұрын
ждал в конце песню про светку соколову, а ее нет... отписываюсь
@devidbrown817619 күн бұрын
Спксибо за ролик. Очень хорошо рассказываешь и все по делу !;)
@domafon1083Ай бұрын
Спасибо за видео!
@ДанилПахолко3 күн бұрын
Как сделать бота или exel есть видео???
@IPCamera-w2xАй бұрын
Друг, ну какой TSP/IP, камон
@justmrr35933 ай бұрын
Можешь использовать undetected_chromedriver для парсинга?
@PseudoDev3 ай бұрын
Хм, в первый раз слышу об этом модуле. Выглядит интересно, и в теории можно протестировать
@ДенисСушков-с1г16 күн бұрын
Грузит только 12 карточек(. Не могу понять, как увеличить список до последней карточки в скроллинге.
@VV-yg1inАй бұрын
Мильярд тегов, ответ один - regex
@smollegik2 ай бұрын
Это все здорово и методом тыка можно догадаться, а как сделать что бы библиотека соларис обновлялась сама, вместе с хромом? Уж больно это занудо...
@cryptohyde3 ай бұрын
14:22 откуда ссылка нарисовалась?
@PseudoDev3 ай бұрын
Магия монтажа ✨
@Enial_222 ай бұрын
Пытаюсь спарсить отзывы ,страница грузит все кроме отзывов , в месте для отзывов белое пустое поле , если зайти самому с браузера все норм ,а с селениум вот так
@tomcherrr3 ай бұрын
Пытаюсь сделать то же самое на js с помощью puppeteer-extra-plugin-stealth. Навешиваю всякие псевдо-аттрибуты user-agent, но ничего не выходит. Что такого делает под капотом stealth, что позволяет пройти cloudflare?
@PseudoDev3 ай бұрын
Увидел твой комментарий и полез изучать внутрянку модуля. Без 100 грамм тут не разберёшь, но в репозитории некоторый функционал продублирован на JS, думаю это можете тебе пригодиться - github.com/diprajpatra/selenium-stealth
@tomcherrr3 ай бұрын
@@PseudoDev самое интересное, что на bot.sannysoft.com у меня всё светится зеленым. Мол, я всамделишный браузер. Но если меняю урл на ozon, то сразу посылают нахер...
@knowledgedose1956Ай бұрын
не понятно, зачем bs4 если уже есть selenium? можно просто при помощи selenium все спарсить, без лишних зависимостей. в целом за видео спасибо
@hshbidneo2 ай бұрын
вебдрайвер уже не нужен для селениума последних версий
@m941103 ай бұрын
Лучше посмотри в сторону playwright
@PseudoDev3 ай бұрын
Хорошо 👌
@tina_vor17 күн бұрын
Скопировала код прям с гита, упал на всем(
@MrKim-pt2vm2 ай бұрын
Сломался парсер, на всех страницах упал.
@Lisan22._.3 ай бұрын
Так вот из-за кого у нас на складе перебои, гребанные парсиры))
@PseudoDev3 ай бұрын
@@Lisan22._. ХАХАХАХАХА, ну зато теперь понятно почему такая защита от скрапинга стоит 😁
@cryptohyde3 ай бұрын
вы серваки гнилые юзаете... те что амазон ещё в прошлом веке на свалку вывез...вот и перебои
@Drochuk3 ай бұрын
В итоге на бусти будет разбор самого дырявого сайта, чья апишка отдаёт тебе всю инфу без лишних проблем🤡
@PseudoDev3 ай бұрын
@@Drochuk ну, с этой дырявой апишкой нужно ещё разобраться. А это тоже работа)
@Drochuk3 ай бұрын
@@PseudoDev даже не знаю. Если говорить про содержимое в целом - ничего особенного, простейший json. Не более 21 ключа не верхнем уровне. Полезных +- половина. Вот у самого юрл товара (если говорить про парсинг по артикулу) есть свои подводные камни, но я думаю кому нужно - тот разберётся)
@andreymudrakov39163 ай бұрын
омг...в слове tcp ошибку сделал...в слове из 3 букв..
@PseudoDev3 ай бұрын
🤓
@ZheKaYT3 ай бұрын
У вас такое большое лицо, абсолютно не пропорционально телу..
@PseudoDev3 ай бұрын
@@ZheKaYT что? 😐
@Drochuk3 ай бұрын
@@PseudoDev видимо он предлагает пойти в бобик билдинг
@tokosotomimo14Ай бұрын
ozon отдает json прямо в html странице, нужно просто указать куки и хедерсы. зачем для этого использовать драйвер?
@PseudoDevАй бұрын
Если у тебя есть рабочий вариант такого кода, с удовольствием его изучу. У меня не получилось подобрать рабочие куки и заголовки 🤷♂️
@tokosotomimo14Ай бұрын
@@PseudoDevДа, есть. Можешь в телеге мне написать
@tokosotomimo14Ай бұрын
@@PseudoDevOxFF00FF
@tokosotomimo14Ай бұрын
O x F F 00 F F Без пробелов, незнаю как еще написать. Всё удаляется 😢
@kostyakuzmin345Ай бұрын
Ты захотел запилить ролик "как сделать самый медленный парсер в мире"?))) мало того плейрайт, так ещё и бс4)). Такого контента в Ютубе жопой жуй. Лучше бы рассказал, как сделать быстрый и эффективный парсер, который не будет использовать целый браузер и бс4. А если точнее, то браузер нужен только чисто для обхода защиты, вытаскивая куки и дальше делать гет/пост запросы, обрабатывая данные в lxml/selectolax (забудь блять про bs4, это дно it мира и всего программирования, он слишком медленный)