Парсинг Динамических Сайтов в Python | Парсер OZON

  Рет қаралды 6,591

Псевдо Программист

Псевдо Программист

Күн бұрын

Пікірлер: 44
@PseudoDev
@PseudoDev 3 ай бұрын
Лучшая поддержка канала - поддержка копеечкой 🥺 boosty.to/pseudodev
@CaptainBab
@CaptainBab 3 ай бұрын
Учусь по твоим видосам парсить, офигел от такого малого каличества просмотров и комментов, спасибо за такую подачу и вообще ролики.
@dyze8847
@dyze8847 Ай бұрын
занимаюсь автоматизацией сайтов уже +- более года. Посмотрел видео - открыл для себя что-то новое! Совет: можно скрывать присутствие робота на сайте, добавляя заголовки, отключающие "автоматизацию" на сайте. Много раз выручало. Без лишних импортов) Ну тут как кому удобно. Сам придерживаюсь мнению: программист, как художник - свое видение. Для задачи - много методов решения
@SergeyPopovichevPS
@SergeyPopovichevPS 28 күн бұрын
Шатунов жив и парсит сайты
@Vladimirelec
@Vladimirelec 25 күн бұрын
ждал в конце песню про светку соколову, а ее нет... отписываюсь
@devidbrown8176
@devidbrown8176 19 күн бұрын
Спксибо за ролик. Очень хорошо рассказываешь и все по делу !;)
@domafon1083
@domafon1083 Ай бұрын
Спасибо за видео!
@ДанилПахолко
@ДанилПахолко 3 күн бұрын
Как сделать бота или exel есть видео???
@IPCamera-w2x
@IPCamera-w2x Ай бұрын
Друг, ну какой TSP/IP, камон
@justmrr3593
@justmrr3593 3 ай бұрын
Можешь использовать undetected_chromedriver для парсинга?
@PseudoDev
@PseudoDev 3 ай бұрын
Хм, в первый раз слышу об этом модуле. Выглядит интересно, и в теории можно протестировать
@ДенисСушков-с1г
@ДенисСушков-с1г 16 күн бұрын
Грузит только 12 карточек(. Не могу понять, как увеличить список до последней карточки в скроллинге.
@VV-yg1in
@VV-yg1in Ай бұрын
Мильярд тегов, ответ один - regex
@smollegik
@smollegik 2 ай бұрын
Это все здорово и методом тыка можно догадаться, а как сделать что бы библиотека соларис обновлялась сама, вместе с хромом? Уж больно это занудо...
@cryptohyde
@cryptohyde 3 ай бұрын
14:22 откуда ссылка нарисовалась?
@PseudoDev
@PseudoDev 3 ай бұрын
Магия монтажа ✨
@Enial_22
@Enial_22 2 ай бұрын
Пытаюсь спарсить отзывы ,страница грузит все кроме отзывов , в месте для отзывов белое пустое поле , если зайти самому с браузера все норм ,а с селениум вот так
@tomcherrr
@tomcherrr 3 ай бұрын
Пытаюсь сделать то же самое на js с помощью puppeteer-extra-plugin-stealth. Навешиваю всякие псевдо-аттрибуты user-agent, но ничего не выходит. Что такого делает под капотом stealth, что позволяет пройти cloudflare?
@PseudoDev
@PseudoDev 3 ай бұрын
Увидел твой комментарий и полез изучать внутрянку модуля. Без 100 грамм тут не разберёшь, но в репозитории некоторый функционал продублирован на JS, думаю это можете тебе пригодиться - github.com/diprajpatra/selenium-stealth
@tomcherrr
@tomcherrr 3 ай бұрын
@@PseudoDev самое интересное, что на bot.sannysoft.com у меня всё светится зеленым. Мол, я всамделишный браузер. Но если меняю урл на ozon, то сразу посылают нахер...
@knowledgedose1956
@knowledgedose1956 Ай бұрын
не понятно, зачем bs4 если уже есть selenium? можно просто при помощи selenium все спарсить, без лишних зависимостей. в целом за видео спасибо
@hshbidneo
@hshbidneo 2 ай бұрын
вебдрайвер уже не нужен для селениума последних версий
@m94110
@m94110 3 ай бұрын
Лучше посмотри в сторону playwright
@PseudoDev
@PseudoDev 3 ай бұрын
Хорошо 👌
@tina_vor
@tina_vor 17 күн бұрын
Скопировала код прям с гита, упал на всем(
@MrKim-pt2vm
@MrKim-pt2vm 2 ай бұрын
Сломался парсер, на всех страницах упал.
@Lisan22._.
@Lisan22._. 3 ай бұрын
Так вот из-за кого у нас на складе перебои, гребанные парсиры))
@PseudoDev
@PseudoDev 3 ай бұрын
@@Lisan22._. ХАХАХАХАХА, ну зато теперь понятно почему такая защита от скрапинга стоит 😁
@cryptohyde
@cryptohyde 3 ай бұрын
вы серваки гнилые юзаете... те что амазон ещё в прошлом веке на свалку вывез...вот и перебои
@Drochuk
@Drochuk 3 ай бұрын
В итоге на бусти будет разбор самого дырявого сайта, чья апишка отдаёт тебе всю инфу без лишних проблем🤡
@PseudoDev
@PseudoDev 3 ай бұрын
@@Drochuk ну, с этой дырявой апишкой нужно ещё разобраться. А это тоже работа)
@Drochuk
@Drochuk 3 ай бұрын
@@PseudoDev даже не знаю. Если говорить про содержимое в целом - ничего особенного, простейший json. Не более 21 ключа не верхнем уровне. Полезных +- половина. Вот у самого юрл товара (если говорить про парсинг по артикулу) есть свои подводные камни, но я думаю кому нужно - тот разберётся)
@andreymudrakov3916
@andreymudrakov3916 3 ай бұрын
омг...в слове tcp ошибку сделал...в слове из 3 букв..
@PseudoDev
@PseudoDev 3 ай бұрын
🤓
@ZheKaYT
@ZheKaYT 3 ай бұрын
У вас такое большое лицо, абсолютно не пропорционально телу..
@PseudoDev
@PseudoDev 3 ай бұрын
@@ZheKaYT что? 😐
@Drochuk
@Drochuk 3 ай бұрын
@@PseudoDev видимо он предлагает пойти в бобик билдинг
@tokosotomimo14
@tokosotomimo14 Ай бұрын
ozon отдает json прямо в html странице, нужно просто указать куки и хедерсы. зачем для этого использовать драйвер?
@PseudoDev
@PseudoDev Ай бұрын
Если у тебя есть рабочий вариант такого кода, с удовольствием его изучу. У меня не получилось подобрать рабочие куки и заголовки 🤷‍♂️
@tokosotomimo14
@tokosotomimo14 Ай бұрын
​@@PseudoDevДа, есть. Можешь в телеге мне написать
@tokosotomimo14
@tokosotomimo14 Ай бұрын
​@@PseudoDevOxFF00FF
@tokosotomimo14
@tokosotomimo14 Ай бұрын
O x F F 00 F F Без пробелов, незнаю как еще написать. Всё удаляется 😢
@kostyakuzmin345
@kostyakuzmin345 Ай бұрын
Ты захотел запилить ролик "как сделать самый медленный парсер в мире"?))) мало того плейрайт, так ещё и бс4)). Такого контента в Ютубе жопой жуй. Лучше бы рассказал, как сделать быстрый и эффективный парсер, который не будет использовать целый браузер и бс4. А если точнее, то браузер нужен только чисто для обхода защиты, вытаскивая куки и дальше делать гет/пост запросы, обрабатывая данные в lxml/selectolax (забудь блять про bs4, это дно it мира и всего программирования, он слишком медленный)
@PseudoDev
@PseudoDev Ай бұрын
ок
Python Быстрее чем Си?! Ускоряем Python До Максимума!
15:22
Псевдо Программист
Рет қаралды 21 М.
Парсинг динамических сайтов | selenium python
43:00
Алексей Куличевский
Рет қаралды 14 М.
МЕНЯ УКУСИЛ ПАУК #shorts
00:23
Паша Осадчий
Рет қаралды 4,9 МЛН
When Cucumbers Meet PVC Pipe The Results Are Wild! 🤭
00:44
Crafty Buddy
Рет қаралды 56 МЛН
Noodles Eating Challenge, So Magical! So Much Fun#Funnyfamily #Partygames #Funny
00:33
كم بصير عمركم عام ٢٠٢٥😍 #shorts #hasanandnour
00:27
hasan and nour shorts
Рет қаралды 5 МЛН
4. Парсинг сайта на Python. Библиотека Selenium
11:11
ITMouse: международная школа программирования
Рет қаралды 1,1 М.
Скрейпинг сайтов с помощью библиотек Beautifulsoup и Requests на Python
23:05
Мастерская Важных историй
Рет қаралды 80 М.
Что нужно знать Backend Разработчику?
13:57
Андрей Иванов | Python
Рет қаралды 14 М.
Трафареты на озон. Показываю каждый шаг! Вывод в топ, продвижение в поиске
29:10
Вячеслав Григорьев на маркетплейсах
Рет қаралды 13 М.
МЕНЯ УКУСИЛ ПАУК #shorts
00:23
Паша Осадчий
Рет қаралды 4,9 МЛН