Обучение парсингу на Python, парсинг любых сайтов, в том числе SPA

  Рет қаралды 76,124

blacktrub channel

blacktrub channel

Күн бұрын

Пікірлер: 150
@blacktrub
@blacktrub 3 жыл бұрын
Если интересуешься backend разработкой, советую заценить видос - kzbin.info/www/bejne/onO9hpawnJ17rLM
@Manyearsago
@Manyearsago 2 жыл бұрын
А что делать если API ключ инвалид?
@ICastTheBan
@ICastTheBan Жыл бұрын
Инструкция как спарсить любой сайт 1. Заходите на сайт 2. Парсите
@РобертГумеров-р1и
@РобертГумеров-р1и 2 жыл бұрын
Спасибо! Я уже замучался искать способы парсить быстрее через селениум а тут такое откровение
@camdenhobby3940
@camdenhobby3940 2 жыл бұрын
Спасибо большое, очень просто и понятно объяснили, все четко. Сейчас с этим и столкнулись что больше сайтов стало отправлять пустые страницы. И надо с этим как то работать ....
@НеопознанныйБобр
@НеопознанныйБобр 2 жыл бұрын
Selenium
@cucumberinfinity2629
@cucumberinfinity2629 3 жыл бұрын
Спасибо за труд! Полезное видео. Продолжай годноту пилить. Недавно на твой канал наткнулся много интересного.
@bodunidze
@bodunidze 3 жыл бұрын
Трабл в том что я хочу чекнуть каким способом был построен сайт перехожу Network-DOC и ничего не отображается
@blackcatdevel0per
@blackcatdevel0per 2 жыл бұрын
Недавно парсил сайт, и в нём была связка из websocket и graphgl, нашёл библиотеку для python и теперь могу парсить там прогнозы(на сайте было много чего, от nfc до примерных курсов криптовалют в будущем)
@dasdasfsdgjopjtopheoibzfdbf
@dasdasfsdgjopjtopheoibzfdbf 2 жыл бұрын
Круто Думал, что Client Render сайты можно только через Selenium парсить
@АнарГусейнов-с5ы
@АнарГусейнов-с5ы Жыл бұрын
Крутой контент подача отличная Молодец 👍
@AleksTrifonov
@AleksTrifonov Ай бұрын
Возможно ли на Питоне написать скрипт, который бы смог авторизоваться на сайте с CSRF защитой?
@ИльяВасильков-п2р
@ИльяВасильков-п2р 2 жыл бұрын
а как распарсить статический контент со страниц ютуба?
@a2wars
@a2wars Жыл бұрын
Спасибо автору. Если есть видео для юристов, чтобы помочь парсить сайты судов был бы благодарен.
@alexzir
@alexzir 2 жыл бұрын
Спасибо! Не курса случаем в рекомендациях?
@Genkay_777
@Genkay_777 Жыл бұрын
А как без библиотеки спарсить ? на aiohttp \ async
@madman9412
@madman9412 2 жыл бұрын
Спасибо, в других видео не видел информации об апи
@Nicklebackrtv
@Nicklebackrtv 2 жыл бұрын
не могу понять как у вас получилось открыть сервер часть рендеринг 2:45 секунда видео. То же самое проделываю и открывается клиент-сайт рендеринг. Подскажите в чем проблема.
@Tanya-Travel
@Tanya-Travel Жыл бұрын
а как открыть панель разработчика?)
@bjj1423
@bjj1423 Жыл бұрын
Круто. Но что то не разобрал синтаксис последнего примера что бы(
@user-rb7ee7ex4g
@user-rb7ee7ex4g 3 жыл бұрын
это просто невероятно!!!!!! я именно этот сайт и хотел спарсить, капец!!!!!
@ДмитрийСоколовский-щ1щ
@ДмитрийСоколовский-щ1щ 3 жыл бұрын
у тебя получилось сделать парсер?
@user-rb7ee7ex4g
@user-rb7ee7ex4g 3 жыл бұрын
@@ДмитрийСоколовский-щ1щ 1 монеты, а потом мне стало это не нужно
@StankBrewing
@StankBrewing Жыл бұрын
Очень полезная инфа! Спасибо!
@isded1681
@isded1681 2 жыл бұрын
Супер, очень полезно!
@davidissak-zade3662
@davidissak-zade3662 3 жыл бұрын
Отличное видео, продолжай в том же духе!!!
@blacktrub
@blacktrub 3 жыл бұрын
спасибо!
@ГубкаБоб-р8ъ
@ГубкаБоб-р8ъ 3 жыл бұрын
Спасибо, полезная инфа, подписался
@vladimirgrebenev1981
@vladimirgrebenev1981 2 жыл бұрын
и ещё вопрос: каким образом парсится весь json со страницы?
@JohnDoe-hp5kw
@JohnDoe-hp5kw 2 жыл бұрын
Можете подсказать что делать если вместо GET запроса (на вашем видео это 6:10) отображается метод POST и выдает ошибку
@wikigame7942
@wikigame7942 2 жыл бұрын
Пасаны почему когда парсю на винде 7 то в место Русского языка краказябры?
@numunucomanche5013
@numunucomanche5013 Жыл бұрын
Подскажите пожалуйста, существуют ли легкие программы для цветового парсинга с экрана? к примеру есть 2 необходимых цвета - и нужно запарсить их последовательность и представить к примеру в виде таблицы?
@street1904
@street1904 2 жыл бұрын
Автор спасибо, очень подробно рассказал. Пробовал selenium парсить как раз csr, очень долго работает конечно, но наткнулся на твое видео и код упростился и работает все быстро. Но столкнулся еще с одним вопросом, который никак не могу решить, может подскажешь как можно сделать или какой инструмент для такой цели подойдет. Сайт wildberries, собираю цену товара и потом сравниваю, он как раз сделан с подходом client site rendering, получаю json там все данные есть, НО для авторизованных и неавторизованных цены разные и на выходе получаю, что для отслеживания цены она не совсем актуально. Как можно авторизацию реализовать? К тому же wb не использует постоянный логин и пароль, а смс при каждой авторизации.
@blacktrub
@blacktrub 2 жыл бұрын
можешь просто взять свои cookie из браузера и попробовать сделать запрос с ними
@alexdixon2844
@alexdixon2844 Жыл бұрын
Как на одном и том же сайте может быть 2 подхода?
@Chel1k7
@Chel1k7 Жыл бұрын
Сайты разные глаза открой))
@АлександрСергеев-о6х
@АлександрСергеев-о6х 2 жыл бұрын
Вопрос: Как спарсить сообщения в ВК, в момент открытия сообщений? Условия: Без API VK, не используя авторизацию в python (пользователь уже зашел в вк в своем браузере, нужно забрать информацию). Запущено приложение, написанное на Python и мониторит события открытия сообщений в браузере. Как только пользователь открыл сообщения, нужно их спарсить. И продолжать парсить новые. Не нашел такого решения на Python. Такое могу сделать на JS, но нужен Python. Все парсят простые страницы, либо сами ручками проходят авторизация или используют API сайта.
@yurras96
@yurras96 2 жыл бұрын
ну с вк реально же проще через api
@АлександрСергеев-о6х
@АлександрСергеев-о6х 2 жыл бұрын
@@yurras96 Согласен, но задача такая, что его нельзя использовать
@kirill7707
@kirill7707 2 жыл бұрын
добрый день! помогите пожалуйста!!! не получается спарсить данные с сайта. при запросе выдает не полный список, первая строчка если смотреть через браузер, и спарсить не получается никак. ПОМОГИТЕ ПОЖАЛУЙСТА!!!!
@planetaryengineer
@planetaryengineer Жыл бұрын
@SuperGoodman4ik
@SuperGoodman4ik 3 жыл бұрын
Ты четкий, в Махачкале будешь, набери
@_hugoru_
@_hugoru_ 2 жыл бұрын
Не все сайты парсятся через requests + bs4. Например, Авито не парсится. Неужто такие сайты парсятся только через selenium? Нет менее ресурсозатратных способов?
@Chel1k7
@Chel1k7 Жыл бұрын
С какого перепугу авито не парсится реквестом и бс4? Сам пару недель назад парсил.
@_hugoru_
@_hugoru_ Жыл бұрын
@@Chel1k7 скинь ссыль на проект посмотреть, у меня выxодил экран, что то типа "с вашего IP зафиксированы автоматические запросы и он был заблокирован". Парсил через Селениум, но тоже не все так просто: Авито выдавало немного другой контент, но разница была небольшой и IP естественно не улетал в баню.
@Chel1k7
@Chel1k7 Жыл бұрын
@@_hugoru_ обычным кодом всё делается: from requests import Session work = Session() response = work.get(url, headers=headers) вместо url ставишь ссылку на авито, и заголовки свои, только что проверил статус 200 приходит
@artemmedyuho5375
@artemmedyuho5375 3 жыл бұрын
Мужик, отличное видео, может следующее видео про контейнеры в докере?
@blacktrub
@blacktrub 3 жыл бұрын
возможно)
@ДмитрийСоколовский-щ1щ
@ДмитрийСоколовский-щ1щ 3 жыл бұрын
полностью переписал первый код для маркет капа и выдает только
@blacktrub
@blacktrub 3 жыл бұрын
нужно вызвать функцию
@MetamorphosisMetamorphosis-s
@MetamorphosisMetamorphosis-s 2 жыл бұрын
Бро, а если я с винды7 парсю то у меня краказябры в место кирилицы. Можно что то типа encoding сделать что русский тоже отображалось?
@yurras96
@yurras96 2 жыл бұрын
в utf-8 сделай кодировку страницы
@memr404
@memr404 Жыл бұрын
Ролик полезный!
@F_C_T_L
@F_C_T_L 2 жыл бұрын
Привет, подскажите как парсингом получить все видео с определённого ютуб канала. Если кто знает подскажите пожалуйста.
@Keefear
@Keefear Жыл бұрын
Download master умеет качать плейлисты
@F_C_T_L
@F_C_T_L Жыл бұрын
@@Keefear Спасибо
@АлександрПлатонов-м1э
@АлександрПлатонов-м1э 3 жыл бұрын
Ну круто! По существу.
@Евгений-щ3т4ы
@Евгений-щ3т4ы 2 жыл бұрын
фильтрацию бы расшифровать
@CreatorDreamer
@CreatorDreamer 2 жыл бұрын
Скажите, каким образом следить за изменением котировок. Что бы каждую секунду не делать get запросы, а один раз открыв сайт следить за изменением котировок.
@planetaryengineer
@planetaryengineer Жыл бұрын
зациклить
@CreatorDreamer
@CreatorDreamer Жыл бұрын
@@planetaryengineer Спасибо друг, за ответ. Я с тех пор, как задавал вопрос уже изучил тонкости работы webdriwer и get запросов.
@planetaryengineer
@planetaryengineer Жыл бұрын
@@CreatorDreamer до сих пор веришь в стратегии ставок?
@CreatorDreamer
@CreatorDreamer Жыл бұрын
@@planetaryengineer Нет я на заказ писал для парсинга Binance по-моему тогда. Поэтому котировки парсил.
@Всепровсе-б2х
@Всепровсе-б2х 3 жыл бұрын
Спасибо за урок. А что за браузер ты используешь?
@blacktrub
@blacktrub 3 жыл бұрын
Google Chrome
@НеопознанныйБобр
@НеопознанныйБобр 2 жыл бұрын
Internet explorer
@akdesign5467
@akdesign5467 2 жыл бұрын
А кнопки нажимать на других сайтах программно можно?
@yurras96
@yurras96 2 жыл бұрын
можно вообще все вопрос в реализации
@ВиталийГорьков-з1ч
@ВиталийГорьков-з1ч 2 жыл бұрын
Спасибо, мне понравилось видео
@flaretvlive9823
@flaretvlive9823 3 жыл бұрын
Привет есть такой вопрос получилось авторизоваться на сайте, но при попытке получить какие то данные с сайта появляется то ли загрузка то заглушка с анимацией. И парсится она вместо контента на страница . Сайт доступен только после авторизации. Как с этим бороться? сайт сделан по технологии клиенский рендеринг веба
@blacktrub
@blacktrub 3 жыл бұрын
привет! если там клиентский рендеринг то посмотри как там работает авторизация, если просто выставляется кука, то ищи запросы которые получают нужную тебе информацию и запрашивай их в парсере, ну и соответственно подставляй туда свою куку из браузера.
@СергейСмирнов-ь8у
@СергейСмирнов-ь8у 3 жыл бұрын
Спасибо за видео!
@Чуваш-ы3ц
@Чуваш-ы3ц 2 жыл бұрын
Не плохо, но у меня не получается спарсить сайт с авторизацией, сайт отображает нормально, но данные не берет. сохранил страницу для проверки тегов в браузере, но их нет нифига. Не пойму нифига. Подскажэи как спарсить, есть чат для обсуждения?
@blacktrub
@blacktrub 2 жыл бұрын
под любым видео ссылка на телеграм канал, к нему прикреплён чат
@kavajno
@kavajno 2 жыл бұрын
Сбросьте код. А то у меня с мобилки не работает веб инструменты разработчика
@МишаДжонов
@МишаДжонов 2 жыл бұрын
Здравствуйте! Пробую парсить один сайт, но возникла одна задачка: дело в том что когда я на нужной мне странице нажимаю на "посмотреть код" и ищу нужные мне теги ссылок, что бы их спарсить- они есть. Но когда я нажимаю "Посмотреть код страницы", то в новом окне мне выдает какой то другой код, где нет многих элементов и в том числе моих ссылок. Я узнал что это как то связано с doctype, но все равно никак не могу разобраться что делать и как парсить ссылки в таком случае. Огромная просьба помочь! Спасибо!
@blacktrub
@blacktrub 2 жыл бұрын
может оно просто джаваскриптом подгружается?
@МишаДжонов
@МишаДжонов 2 жыл бұрын
@@blacktrub хм... и как определить или что сделать что бы полный код получить?
@blacktrub
@blacktrub 2 жыл бұрын
ты сделал как в видео показано? что происходит в вкладке network? данные прилетают где-то в вкладке xhr?
@МишаДжонов
@МишаДжонов 2 жыл бұрын
@@blacktrub Да, но как дальше спарсить весь код- не знаю. и уж тем более отдельные ссылки
@МишаДжонов
@МишаДжонов 2 жыл бұрын
я по моему задал вопрос
@Chel1k7
@Chel1k7 Жыл бұрын
Ты не удачно выбрал коинмаркеткеп. Если ты захочешь получить инфу и все монетах на страницы, или хотя бы одну но на 15+ месте (вроде динамически по 15 там грузятся) но получишь шыш с таким подходом
@vkb0086
@vkb0086 3 жыл бұрын
Спасибо за видео!, но у меня возник вопрос, в моем случае Client Side rendering и нужные данные приходят post запросом, как мне их достать?
@eugencosciug9339
@eugencosciug9339 3 жыл бұрын
Нашёл ответ ? Меня мучает такой-же вопрос
@blacktrub
@blacktrub 3 жыл бұрын
привет! да вообще всё тоже самое, если у тебя конкретный случай то скидывай, посмотрю
@blacktrub
@blacktrub 3 жыл бұрын
например вот - gist.github.com/blacktrub/82e2c95e7c30c801eb55cae6e642d3f8 тут я сделал просто веб сервер который отвечает на POST запрос, и пример кода который просто дергает url с помощью requests и получает данные как обычный json
@Александр_1-й
@Александр_1-й 3 жыл бұрын
Браузер под управлением и парси с него без всяких танцев с бубном ввиде поиска запросов и ответов.
@pcholken
@pcholken 3 жыл бұрын
@@Александр_1-й ага, потом страдай от нестабильности и низкой производительности
@ЗахарИгнатьев-е3э
@ЗахарИгнатьев-е3э 3 жыл бұрын
Афигенно просто. Начал фриланс. И как раз вчера, первый запрос от человека именно на яваскрипт сайт. Чуть позже буду тестировать Вашу инфу!!! Хочу сделать первый заказ и получить завершение сделки!!! Это должно стать идеальной мотивацией!!! Спасибо Вам!!! Вы Молодец!!!
@Jilexa
@Jilexa 3 жыл бұрын
Ну и как? Получилось с первым заказом?
@СмирновМаксим-м2г
@СмирновМаксим-м2г 2 жыл бұрын
@@Jilexa пропал чувак.....
@yurras96
@yurras96 2 жыл бұрын
мамкины фрилансеры)
@tofutureguest
@tofutureguest Жыл бұрын
Яваскрипт 😂😂😂😂
@TRALIX
@TRALIX 2 жыл бұрын
Спасибо за тему, но выдает ерор( AttributeError: 'NoneType' object has no attribute 'text'
@blacktrub
@blacktrub 2 жыл бұрын
значит элемент на странице не найден
@bogdanusachov4985
@bogdanusachov4985 3 жыл бұрын
Привет. как спарсить ссылку с сайта авториа. ссылку на карточку товара. ?
@blacktrub
@blacktrub 3 жыл бұрын
привет! например вот так - pastebin.com/rUAgBm6G
@ЕвгенияЗайцева-ж8б
@ЕвгенияЗайцева-ж8б 3 жыл бұрын
Привет! а можно парсить без сторонних библиотек?
@blacktrub
@blacktrub 3 жыл бұрын
Привет! Без сторонних библиотек можно, но хочу заметить что это будет немного сложнее. Например вот так - pastebin.com/hfYcFE1t Тут используется только стандартная библиотека, python 3 версии
@ЕвгенияЗайцева-ж8б
@ЕвгенияЗайцева-ж8б 3 жыл бұрын
@@blacktrub мне дали тестовое задание, там запарсить статьи на сайте без использования сторонних библиотек, 🤷🤷 Может есть конечно более глобальные библиотеки, чем beautifulsoup, requests. Я не сильно секу пока ещё в этом моменте, Спасибо за пример!
@blacktrub
@blacktrub 3 жыл бұрын
@@ЕвгенияЗайцева-ж8б если ты никогда не работала с регулярками, тогда возможно будет сложно) в целом requests и beautifulsoup вполне подходит под определение "сторонние библиотеки". Ты главное посмотри разметку и подумай как ты можешь вытащить необходимый текст из этого.
@ЕвгенияЗайцева-ж8б
@ЕвгенияЗайцева-ж8б 3 жыл бұрын
@@blacktrub никто не говорил, что будет легко 😄 Всё идёт к тому, что будет максимально сложно, это и манит ) Ещё раз, спасибо!)
@nvmnvm786
@nvmnvm786 3 жыл бұрын
@@ЕвгенияЗайцева-ж8б Любопытно узнать, кто и с какой целью дает такие тестовые задания(городить костыли вместо специально заточенных под это библиотек)? Может потом попросят писать код исключительно в Блокноте и обращаться к базе на Бейсике?
@AnuarLife
@AnuarLife 3 жыл бұрын
Приветствую! Отличное видео, а как спарить весь элемент боди?
@blacktrub
@blacktrub 3 жыл бұрын
Спасибо! Например вот так - pastebin.com/DTrq3dms
@user-rb7ee7ex4g
@user-rb7ee7ex4g 3 жыл бұрын
автор, извини что я тебя опять беспокою( скажи пожалуйста, есть ли такая функция, чтобы можно было отобрать из списка монет такие, цена которых в течение определенного времени, изменилась в определенный процент? я вот допустим их спарсил как в твоем видео, а как сделать дальше?( буду очень благодарен за помощь( хотя бы просто скажи какая функция? list.sort ? это вообще возможно сделать?
@blackcatdevel0per
@blackcatdevel0per 2 жыл бұрын
Спасибо!
@ДмитрийЯковлев-д6э
@ДмитрийЯковлев-д6э 3 жыл бұрын
классный шрифт) какой используете?
@blacktrub
@blacktrub 3 жыл бұрын
смотря где) если ты про надпись на превью - Impact
@goldline3144
@goldline3144 Жыл бұрын
Иногда проще и быстрее зайти на сайт, и получить нужную информацию и скопировать ее в нужный документ, чем изобретать велосипед, привязывать наперстки к веревке и крутя педали вычерпывать воду из колодца наперстками.
@Chel1k7
@Chel1k7 Жыл бұрын
🤡
@rzhumen882
@rzhumen882 Ай бұрын
А если нужно открыть 10 000 ссылок и считать название вкладки, как вы поступите?
@ПоповРоман-ь5п
@ПоповРоман-ь5п 3 жыл бұрын
у меня с ajax проблемы
@iq-andi3811
@iq-andi3811 3 жыл бұрын
Привет, а как проходить капчу?
@blacktrub
@blacktrub 3 жыл бұрын
привет! лучшей стратегией будет - избегать капчу, если это возможно, если ты не всегда получаешь капчу, то попробуй при парсинге вести себя более естественно, не делать много запросов сразу и т.д. если же никак не обойтись без её прохождения, то гугли сервисы по прохождению капчи, но не факт что это 100% поможет
@iq-andi3811
@iq-andi3811 3 жыл бұрын
@@blacktrub Хорошо, спасибо!)
@Александр_1-й
@Александр_1-й 3 жыл бұрын
@@blacktrub тем способом который в видео, Яндекс и нормальный интернет магазин пошлет Вашего бота на три буквы. Кроме того Вы не ответили на вопрос человека вообще.
@Александр_1-й
@Александр_1-й 3 жыл бұрын
Пользуйтесь браузером под управлением, но играйте настройками, чтоб скрыть это управление. В интернете есть сайты на определение бот или обычный человек зашёл. Разрешите куки, пусть спокойно их сохраняет. Не парсите сайт с капчами быстро, задавайте интервал между запросами больше. После выставления капчи очищайте браузер, перегружает его, ещё лучше меняйте IP путем перезагрузки роутера. Использование всяких бесплатных анимайзеров безполезно так,как их IP не знает только ленивый.
@nicolaivlasov9197
@nicolaivlasov9197 3 жыл бұрын
труба жесткий тип
@r0m1mpl97
@r0m1mpl97 3 жыл бұрын
Парсинг на python на примере сайта rozetka - kzbin.info/www/bejne/f4fWc3qrdtyJlbc
@user-tetcher365
@user-tetcher365 6 ай бұрын
HTLM? 1:06 🥲
@denischo2133
@denischo2133 3 жыл бұрын
Как парсить так чтобы тебя не забанил сервер?
@blacktrub
@blacktrub 3 жыл бұрын
тут нет однозначного ответа, в целом нужно придерживаться стратегии что бы ты при парсинге выглядел как браузер для сервера, ведь ресурс хочет огородиться от парсеров, а нет от клиентов. попробуй для начала использовать те же заголовки что и при запросе делает браузер, если есть рейт лимиты их нужно подобрать эмпирическим путём и выставить в парсере соответствующие тайм-ауты между запросами, и уже после всех этих действий, при необходимости прибегать к использованию прокси серверов, нужно равномерно распределять запросы по прокси
@Vlad1998996
@Vlad1998996 2 жыл бұрын
спасибо
@jekavovk7148
@jekavovk7148 Жыл бұрын
Я б сказал что видео малоинформативное. Большенство API закрытые. Получить от данные них таким методом не получится.
@danielp5904
@danielp5904 3 жыл бұрын
Видео супер! То, что нужно для начинающих! Не подскажешь, как настроить парсер таким образом, чтобы он: 1) автоматически выполнял запрос в поисковой строке по комбинированному критерию (например, фильтры "категория"+ "цена" + "недавно добавленные"). На практике методом перебора не получается найти статический URL, который бы объединял два и более фильтра. Ссылка приходит в виде абра-кадабры на 100+ символов каждый раз. 2) запоминал, на каком результате парсинг остановился в прошлый раз. Например, нужно каждую пятницу парсить блок объявлений и добавлять в excel только новые данные, игнорируя уже пропарсенные за прошлую неделю? Буду признателен за идеи!
@blacktrub
@blacktrub 3 жыл бұрын
Привет! Спасибо, по поводу идей: 1) GET параметры работают следующим образом, если они есть, допустим у тебя есть адрес site.com первый параметр будет добавлен после знака ?, т.е. будет урл site.com?param=1 если же нужны еще параметры то он будет добавлен через &, т.е. site.com?param=1&param2=1 Это стандартное поведение GET параметров, обычно с помощью них фильтры и делают. по поводу "абра-кадабры", попробуй такие URL прогнать с помощью функции urllib.parse.unquote, скорее всего данные в урле просто заэнкожены 2) Тут зависит от данных которые ты получаешь, если ты допустим парсишь и там есть какой-то ID, то просто запоминай последний ID, если есть дата, то тебе нужно спарсить её и сравнить с нужной
@Улучшайзер-т3ы
@Улучшайзер-т3ы 2 жыл бұрын
Боже, топ контент
@Александр_1-й
@Александр_1-й 3 жыл бұрын
На кой чёрт нужны эти сложности? Браузер под управлением и парсим с загруженной браузером страницы все что нужно, при необходимости можно и кнопочки нажать и скролин сделать. А если что-то изменится, то будете каждый раз анализировать куда ведут новые ссылки вместо простого изменения Xpath? В случае с requests любой нормальный сайт определит в бота и пошлет на три буквы. Предложенным моим способом нормально парсю интернет магазины и Яндекс Маркет.
@blacktrub
@blacktrub 3 жыл бұрын
рад что у вас есть лучший способ, пользуйтесь им
@ABtonatiza
@ABtonatiza 3 жыл бұрын
м да чет я посмотрел и на сайтах нету того что ты показываешь нетворк а там дом хотя на видео подписано как любой сайт спарсить диза ((
@blacktrub
@blacktrub 3 жыл бұрын
уточни какой браузер ты используешь? вот пример для chrome - support.google.com/campaignmanager/answer/2828688?hl=ru
@ABtonatiza
@ABtonatiza 3 жыл бұрын
@@blacktrub хром и что зайди например в гугл поисковик и покажи где там есть то что ты говоришь в видео так как у тебя ток 2 варианта я и говорю что твоя инфа не для всех сайтов
@blacktrub
@blacktrub 3 жыл бұрын
@@ВладиславХатико привет! недавно выпустил обзор на splash - kzbin.info/www/bejne/fGfTmYyifrKVd5I с помощью него у меня получилось получить готовую страницу с твиттера, только выставляй wait побольше, попробуй от 10сек
@blacktrub
@blacktrub 3 жыл бұрын
@Byu Beats конечно, это просто приложение которое крутится где угодно, еще кстати как вариант попробуй найти свой запрос в браузере, и посмотри какие заголовки отправляются, может быть у тебя что-то не сходится с тем что ты делаешь
@max_wbw
@max_wbw Жыл бұрын
Если человек зашёл посмотреть про парсинг он по-любому должен знать разницу SPA и MPA. Лично я зашёл посмотреть на твой подход к парсингу, а мне тут про построения приложений рассказывают. Диз.
@АнарГусейнов-с5ы
@АнарГусейнов-с5ы Жыл бұрын
Ты не прав Если ты такой умный делай сам если нет то имей совесть слушать от начала до конца. Если не то не другое хотя бы не ставь плохой коммент за старания человека будь хотя бы человеком будь
@max_wbw
@max_wbw Жыл бұрын
@@АнарГусейнов-с5ы если ты начал интересоваться парсингом ты как минимум должен понимать устройства сайтов и приложений. На счёт делай сам, я сам и делаю, если ты не в курсе, подходов к написанию кода очень много и подобные видео смотрят не только чайники вроде тебя. На счёт совести, если ты такой совестный зачем тебе парсинг, ты же занимаешься сбором данных с чужих сайтов в один клик, а кто-то тратил время на её сбор, структурирование и залив на сайт разбив по нужным категориям, а это не малый труд. Ну что, не мучает совесть, нет? Вот и мне пофиг.
@ЕгорТупикин-л6ъ
@ЕгорТупикин-л6ъ 2 жыл бұрын
Здравствуйте, понимаю, что шанс получить ответ весьма мал, но все же , при парсинге анекдотов к примеру anerdot.text ломает всю структуру анекдота, так как убирается тэг переноса на следующую строку , вопрос, можно ли как-то этого избежать?
@ondest5059
@ondest5059 2 жыл бұрын
Тащить не по ключам, а с помощью регулярных выражений тогда, но регулярные выражения это не шутки, это как отдельный язык в языке
@ЕгорТупикин-л6ъ
@ЕгорТупикин-л6ъ 2 жыл бұрын
@@ondest5059 понял, спасибо большое, попробую !!!!
@user-rb7ee7ex4g
@user-rb7ee7ex4g 3 жыл бұрын
Автор, если у вас будет время, помогите пожалуйста. Скопировал ваш код, но почему-то не работает((( Ругается на вот это ".text" в 8 строчке. если убрать ".text", то начинает работать, но выдается только "Dogecoin rate: None" . В чем может быть дело???
@blacktrub
@blacktrub 3 жыл бұрын
а что ты хочешь спарсить?
@user-rb7ee7ex4g
@user-rb7ee7ex4g 3 жыл бұрын
@@blacktrub вот именно этот сайт, несколько монет(дальше выбрать из них несколько особенных, но главное сначала хотя бы спарсить)
@user-rb7ee7ex4g
@user-rb7ee7ex4g 3 жыл бұрын
@@blacktrub короче, я слэшь пропустил, лол)))) всё работает)
Простой парсинг сайтов на Python | requests, BeautifulSoup, csv
1:11:50
Андрей Андриевский
Рет қаралды 136 М.
Парсинг динамических сайтов | selenium python
43:00
Алексей Куличевский
Рет қаралды 16 М.
Сестра обхитрила!
00:17
Victoria Portfolio
Рет қаралды 958 М.
Quando eu quero Sushi (sem desperdiçar) 🍣
00:26
Los Wagners
Рет қаралды 15 МЛН
Самое простое объяснение нейросети
16:30
Программный Кот
Рет қаралды 133 М.
Скрейпинг сайтов с помощью библиотек Beautifulsoup и Requests на Python
23:05
Мастерская Важных историй
Рет қаралды 81 М.
БЕГУЩИЙ ПО PYTEST
10:22
мыш
Рет қаралды 953
Все JOIN в SQL Для Начинающих За 15 Минут
15:48
Скрейпинг сайтов с помощью библиотеки Selenium
21:10
Мастерская Важных историй
Рет қаралды 43 М.
Как парсить любой сайт в make.com
29:50
Ai ii Нейросети
Рет қаралды 15 М.
КАК УСТРОЕН TCP/IP?
31:32
Alek OS
Рет қаралды 243 М.
Сестра обхитрила!
00:17
Victoria Portfolio
Рет қаралды 958 М.