Скрейпинг сайтов с помощью библиотек Beautifulsoup и Requests на Python

  Рет қаралды 80,684

Мастерская Важных историй

Мастерская Важных историй

Күн бұрын

Пікірлер: 216
@istories_workshop
@istories_workshop 2 жыл бұрын
❗❗❗Так называемое Министерство юстиции РФ признало «Важные истории» «нежелательной организацией». Так что репост этого и любого другого нашего видео может караться штрафом, а повторный репост - уголовным делом. Но никто не может запретить вам смотреть и думать. Поэтому подписывайтесь на наш канал, просите подписаться своих друзей и оставайтесь с нами - в это темное время выжить мы сможем только вместе.
@yarmik3d
@yarmik3d 2 жыл бұрын
Так называемы "программист\ка" решила учить, сама не особо понимая, что делает.
@ВладиславГладкий-ъ7н
@ВладиславГладкий-ъ7н 2 жыл бұрын
@@yarmik3d ахахах, любитель рУЗКОГО мира будет нам тут кукареть как правильно родину любить, иди грим смой, клоун😂
@yarmik3d
@yarmik3d 2 жыл бұрын
@@ВладиславГладкий-ъ7н А ты любитель какого мира пишущего на русском языке?
@ВладиславГладкий-ъ7н
@ВладиславГладкий-ъ7н 2 жыл бұрын
@@yarmik3d я сторонник цивилизованного мира, основанного на демократии, свободе слова и верховенства права. И какая тебе разница на каком языке я пишу. Ты же наверняка не знаешь ни одного другого языка кроме русского
@yarmik3d
@yarmik3d 2 жыл бұрын
@@ВладиславГладкий-ъ7н Все это ты мог выразить одним словом - ПРЕДАТЕЛЬ
@МихаилРойтман-ъ5у
@МихаилРойтман-ъ5у 2 жыл бұрын
Добрый день. Мне 60 лет, изучаю аналитику данных. Ваш урок - это СУПЕР. Все понятно, логично, доходчиво! Спасибо! Удачи Вам!
@Storks40
@Storks40 Жыл бұрын
Мне 66.Тоже подсел на эту тему) По этому видео сделал календарь культурных событий в нашей области. Очень хорошее объяснение.
@art_alf-b9b
@art_alf-b9b 11 ай бұрын
Вы крутые!
@clear1948
@clear1948 3 жыл бұрын
У меня всегда было предвзятое отношение к русскоязычным урокам. Всегда смотрю туториалы на английском, так как они проще все обьясняют. Но здесь, Алеся вы просто супер. Как же вы круто обьясняете, быстро и понятно без лишних слов. Вы мастерский учитель. Спасибо вам большое ❤
@istories_workshop
@istories_workshop 3 жыл бұрын
Спасибо большое за просмотр и такую оценку! Очень рады)) ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@weik_gamecut_ru
@weik_gamecut_ru 3 жыл бұрын
Смотрел уроков 5 по парсингу и тяжело было уловить суть в какой последовательности и логике все делать, чтобы без подсказок самому делать потом. А здесь объяснение шикарное, у меня прям картинка прорисовалась в голове сразу, особенно хорошо, что сначала пишутся строки под один фильм, а уже когда понял это, показано как объединить строки чтобы получить все фильмы, а потом как и с каждой страницы. Так удобнее, спасибо!
@istories_workshop
@istories_workshop 3 жыл бұрын
Йее! Очень рады, что вам подошел наш подход (простите за тавтологию) ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@LifterAndy
@LifterAndy 2 жыл бұрын
Начни лучше не с парсинга, а с решения олимпиадных задач и синтаксиса языка.
@PapaBOSS
@PapaBOSS 3 жыл бұрын
Какая же ты молодец! Всё очень доходчиво и спокойно объяснила . Спасибо!
@ЕвгенСахаров
@ЕвгенСахаров 3 жыл бұрын
Алеся, какая же Вы молодец! Я собираюсь изучать пайтон, уже проплатил годовой онлайн курс. Мне 48 лет. Пробовал писать код по видео других авторов. Не получалось. Но по Вашему видео я дошол до конца. Все же прошол скрипт по всем страницам, спарсил все 250 фильмов и собрал все данные в файл. Вы дали возможность поверить в себя. Огромное Вам,Алеся,спасибо.
@istories_workshop
@istories_workshop 3 жыл бұрын
Очень приятно, спасибо и вам! ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@glimmer5103
@glimmer5103 3 жыл бұрын
@@istories_workshop Что это значит "ДАННОЕ СООБЩЕНИЕ"... ?
@istories_workshop
@istories_workshop 3 жыл бұрын
ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА Что нас внесли в реестр СМИ-"иноагентов". Мы с этим не согласны и оспариваем через суд. Но т.к. мы живем в России и работаем в России, то вынуждены (пытаться) выполнять требования этого "закон об иноагентах". По нему мы должны вообще на все наши сообщения (тексты, видео, комментарии, репосты, ретвиты, и т.п.) ставить эту пометку. В противном случае наше юрлицо и главный редактор получат штраф. После нескольких штрафов главреду грозит уголовное преследование.
@ИванЕвдокимов-л6ь
@ИванЕвдокимов-л6ь Жыл бұрын
как успехи?)
@ЕвгенСахаров
@ЕвгенСахаров Жыл бұрын
@@ИванЕвдокимов-л6ь Дается не легко, не скрою. Но безумно интеоесно. Взял академ, на работу вызвали. Остановился на ООП. Через 2 недели домой. Вахта заканчивается. Думаю летом будет защита. Думаю какой проект взять. Уже написал самостоятельно несколько программ. Так что, Иван, всё хорошо!
@Моментыизфильма-н3р
@Моментыизфильма-н3р Жыл бұрын
Как бывший преподаватель, работавший в SkillFactory, GeekBrains MailRu и других компаниях, подтверждаю - очень качественный контент, очень понравился ваш урок, со всеми разъяснениями. Понятно, что для того, чтобы точно всё понимать, без изучения азов вебверстки и самого языка python не обойтись. Однако, если вы уже знакомы со всеми этими технологиями, данный материал будет для вас максимально понятен и полезен. Всё даётся по пунктам, достаточно развёрнуто. Да, где-то приходится откатываться назад, чтобы пользователь понимал, откуда что берётся. Однако это не просаживает урок, всё очень динамично и не даёт уснуть. Спасибо!
@istories_workshop
@istories_workshop Жыл бұрын
Спасибо!
@non5309
@non5309 3 жыл бұрын
первый дисклеймер это похоже новый знак качества )
@ДмитрийВаськин-й6л
@ДмитрийВаськин-й6л Жыл бұрын
Классно объясняет, не зная языка питона, немного разбираясь в пхп, после просмотра урока получилось решить свою задачу)) Однозначно лайк и подписка, теперь пересмотрю все уроки 😂
@Mr6epkym
@Mr6epkym 2 жыл бұрын
Это лучшие уроки по парсингу которые я когда-либо встречал!
@msv108
@msv108 2 жыл бұрын
Огромное спасибо! С обработкой none нигде не могла найти решение. А вы так просто все объяснили! Лайк и подписка!
@ЮрийМашинистов-и6о
@ЮрийМашинистов-и6о Жыл бұрын
Иноагент - это знак качества в наше время.
@vvitasikm3341
@vvitasikm3341 2 жыл бұрын
Супер ! Спасибо тебе милая девушка😊
@cosmonaut380
@cosmonaut380 Жыл бұрын
Этот канал - сокровище, которое лежало у меня под ногами, о котором я узнал благодаря Кацу. Полезность этого видео зашкаливает, спасибо огромное! Подписался
@andreyandreyovich5454
@andreyandreyovich5454 Жыл бұрын
я загалом працюю в дотичній до іт галузі, але була потреба викростати скрейпінг, зазвичай теж дивлюся англійською, але ваші найкращі. дякую, все зрозуміло і по ділу
@ЛеонидСвиридов-г9ш
@ЛеонидСвиридов-г9ш 5 ай бұрын
Благодарю, урок просто шикарен!
@ВикторФомичёв-х8л
@ВикторФомичёв-х8л 2 жыл бұрын
Спасибо вам большое за толковые и интересные видеоуроки
@fghhna
@fghhna Жыл бұрын
Шикарная подача информации. Крайне полезное видео.
@ВиталийКоновалов-г1ц
@ВиталийКоновалов-г1ц 2 жыл бұрын
Спасибо! Информация доходчивая и легко усваиваемая во всех видео на канале!
@istories_workshop
@istories_workshop 2 жыл бұрын
Спасибо, что смотрите :) ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@НиколайПрокопьев-т4м
@НиколайПрокопьев-т4м Жыл бұрын
кое как вырулил себе список ссылок с другого сайта, так как начинающий. Но все же у вас более доходчивое объяснение парсинга
@eldardev
@eldardev 2 жыл бұрын
Супер! Спасибо за пример! Идеально взяли пример и объяснили кристально
@larsthorleik2484
@larsthorleik2484 Жыл бұрын
Всё понятно, только сайт Кинопоиск блокирует парсинг-запросы. В первый раз запрос срабатывает и данные получаются, потом выскакивает ошибка. Приходится мучиться. Может нужен прокси, а может в Юпитере нет таких проблем как в Пайчарме, в котором я работаю.
@noname1999x
@noname1999x 3 жыл бұрын
Большое вам спасибо за самые крутые уроки во вселенной! ❤️❤️❤️
@istories_workshop
@istories_workshop 3 жыл бұрын
Рады, что нравится, спасибо, что смотрите! ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@an-rh8bp
@an-rh8bp 3 жыл бұрын
Держитесь, ребята, благодарю!
@maestr0G
@maestr0G Жыл бұрын
Вы просто супер , объясняет очень хорошо. Спасибо вам большое за контент ❤❤❤
@АндрейСамохин-о2ь
@АндрейСамохин-о2ь 2 жыл бұрын
Супер урок! Спасибо!:)
@almaz1839
@almaz1839 2 жыл бұрын
Лучше пояснение! Спасибо, ты богиня!)
@ЯрославЛеонов-з8д
@ЯрославЛеонов-з8д Жыл бұрын
УМНИЦА, очень круто объясняешь , спасибо тебе
@yauhenilamakin8495
@yauhenilamakin8495 2 жыл бұрын
Спасибо большое. Все просто и понятно. И главное, что работает
@nadiiaschmitz2306
@nadiiaschmitz2306 2 жыл бұрын
Очень классное видео, прямо кристальная ясность наступает, спасибо огромное! 🌹🌹🌹
@kirillsidorov6641
@kirillsidorov6641 Жыл бұрын
Просто отлично, лайк хоть можно поставить?
@rikenbaker1
@rikenbaker1 9 ай бұрын
Похоже что сайт стал динамическим и простыми запросами уже данные из него не получить.
@ThisIsGreenRoom
@ThisIsGreenRoom 2 жыл бұрын
Зачётно всё понятно и доступно 💢 спасибо
@chekito
@chekito 2 жыл бұрын
Просто поклон до земли за эти уроки! Только у вас понял технику. Но возник вопрос. При парсинге вылетает исключение 'requests.exceptions.ConnectTimeout:' Как его лечить? Что конкретно прописать в except?
@pervosled
@pervosled 3 жыл бұрын
Очень полезно, спасибо!
@МортиМортимер-э1р
@МортиМортимер-э1р 2 жыл бұрын
очень доступно, понятно, круто
@morinks
@morinks 10 ай бұрын
Это лучшее обучение что я видел
@YAUHENNAUROTSKI
@YAUHENNAUROTSKI Жыл бұрын
Здрастауйте ,а есть ли курсы при вашей поддержки по скрейпингу и анализу данных?
@Denmark1150
@Denmark1150 2 жыл бұрын
Что-то у менявроде сначала все работало почти правильно, а потом перестало работать. Вроде с кодом все впорядке, но первый раз вывело не весь список, а потом и вовсе перестало выводить. Может ли быть такое, что кинопоиск мой айпишник из-за такой активности заблочил на какое-то время? В частности когда я по отдельности пытаюсь запустить запросы на один из пунктов(ссылка, название, страна и т.д.) выходит ошибка AttributeError 'NoneType' object has no attribute 'find'. Не мог же я наковырять во всех этих пунктах. Раньше они исправно работали UPD: заработало само через некоторое время, но почему-то выдало только 150. Но тоже не плохо😀 Спасибо за видео, вы крутые
@МишаКулешов-ф2ф
@МишаКулешов-ф2ф 2 жыл бұрын
Руслан, у меня такая же история, в тч выдает другой скрипт страницы через некоторое время...А на последнем цикле выдает строго одну страницу, а в след раз просто пустой список О_о Магия какая-то, иначе не могу объяснить...
@timuryuldoshev1609
@timuryuldoshev1609 2 жыл бұрын
@@МишаКулешов-ф2ф это не магия, это защита от парсинга =) пробуйте внедрять в код "обманки".
@КатяШатохина-ь1в
@КатяШатохина-ь1в 2 жыл бұрын
Подскажите, плиз, что не так после soup = bs(r.text, 'lxml') всё выходит в одну длинную строку. И потом при поиске soup.find('div', class_='styles_root__ti07r') ничего не находит
@sokatef
@sokatef Жыл бұрын
Контент динамически загружается, т.е. просто так нельзя получить, так как js код в процессе исполняется. Используйте selenium, чтоб получить html вид страницы и уже по видео обработку делайте.
@non5309
@non5309 3 жыл бұрын
следующий урок будет интересным, видимо там будет про user_agent и подобное
@Arnur-wt3vd
@Arnur-wt3vd 2 жыл бұрын
А почему при парсинге вместо данных я получаю none?(
@drgg9368
@drgg9368 Жыл бұрын
Расскажите пожалуйста data science и скрейпинг это одно и тоже. Просто хотел купить книгу для изучения, а книга про скрейпинг 2016 года, я боюсь покупать т.к инфа может быть устарела . И я нашёл книгу про data science 2023 хорошую судя по отзывам и т.д. Вопрос такой мне нужна книга про то что говорится в видео . Подскажите пожалуйста какую взять накидайте вариантов буду очень благодарен. И ещё все таки data science и парсинг и скарпинг сайтов это одно и тоже?
@VitaliiTriboi
@VitaliiTriboi Жыл бұрын
У меня не работает. Возможно потому что страница стала динамической. Я не получаю элементов с таким же классом как в браузере. можете пояснить?? Думаю многим будет интересно.
@name91fhghghg8
@name91fhghghg8 3 жыл бұрын
с возвращением из застенков
@ВячеславТурубаров
@ВячеславТурубаров Жыл бұрын
Спасибо!
@ИгорьКузнецов-т8р
@ИгорьКузнецов-т8р 3 жыл бұрын
Спасибо за курсы! А можно ссылку на репозитории с кодом для предыдущего проекта(бот) и по текущему проекту тоже?
@istories_workshop
@istories_workshop 3 жыл бұрын
Здравствуйте! ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА Ссылка на код робота ждала вас под последним видео курса, вот она: github.com/iStoriesMedia/robot По текущему будет чуть позже - тоже под видео появится ссылка.
@ИгорьКузнецов-т8р
@ИгорьКузнецов-т8р 3 жыл бұрын
@@istories_workshop спасибо!
@МаринаВласова-и7у
@МаринаВласова-и7у Жыл бұрын
очень доступно подан материал, но не понятны слова запустим. это print в pyCharm? какая программа стоит у вас для кода?
@garrig1925
@garrig1925 2 жыл бұрын
Привет. При вводе soup = BeautifulSoup(r.text, "lxml") выводит ошибку FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library? / Кое как запустил скрипт pycharm, выбрал как указали классы (но классы отличаются от ваших - время много прошло сайт поменялся), на выходе очень большой объем информации не получается уменьшить. Подскажите в чем ошибка
@yaroslavkuznetsov5016
@yaroslavkuznetsov5016 2 жыл бұрын
нужно установить lxml так же как и BeautifulSoup - Pycharm - File - Settings - Python interpreter + ищешь и инсталируешь lxml
@МишаКулешов-ф2ф
@МишаКулешов-ф2ф 2 жыл бұрын
Также выводится огромный нечитаемый массив данных, а при установке lxml пишет requirement already satisfied(
@daxorid
@daxorid Жыл бұрын
А это на какой версии пайтона? Просто я пробую парсить на 3.11 и у меня часть кода работает, а часть нет. Например: не работает .text, .get и др. Попробую установить более старую версию, например 3.10
@Hacking-NASSA-with-HTML
@Hacking-NASSA-with-HTML Жыл бұрын
Здравствуйте, я очень извиняюсь за возможно тупой вопрос, а может парсер - работать в режиме event listener🤔? Чтобы "поселить" парсер на форум, и чтобы парсер сообщал о наиболее активных темах, типа "на ветке велосипеды за последний час появилось 9 сообщений". Как такое сделать 🤔?
@Hacking-NASSA-with-HTML
@Hacking-NASSA-with-HTML Жыл бұрын
Бэкэнд сайта сделан на node js. Как вот такое сделать 🤔? Чтобы парсер "слушал" двести веток форума одновременно. Объясните пожалуйста хотя бы в общих чертах, дальше я уже сам догуглю, ато я даже не знаю что пока гуглить 😁🤷
@forexmio
@forexmio Жыл бұрын
иноагенту лайк!!!! три раза!!!
@АлисаВасильева-б1х
@АлисаВасильева-б1х 2 жыл бұрын
здравствуйте! я +- разобралась в парсинге на реквестс, можете, пожалуйста, подсказать, как мне начать поиск по введенным данным пользователя (input) и вытащить первые 10 ссылок, которые находятся в браузере по этому запросу?
@istories_workshop
@istories_workshop 2 жыл бұрын
Здравствуйте! Здесь (kzbin.info/www/bejne/paK2XpWIatJkmKs) рассказываем, как искать поле ввода и нажимать enter, чтобы поиск выполнился. И в этом же уроке есть пример того, как можно собрать первые 10 строк выдачи. ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@picassos3017
@picassos3017 Жыл бұрын
Пробую повторить 2.01.2023. Названия классов сменились. Это как?
@Onixx616
@Onixx616 3 жыл бұрын
Очень позновательный видос
@АртемАлексеев-ж2ь
@АртемАлексеев-ж2ь Жыл бұрын
Топ!!
@andrewhkh23
@andrewhkh23 2 жыл бұрын
Ребята, а почему не в pycharm или vs code? там же приходится каждую строчку через print выводить, или же с другими манипуляциями. Новички, в таком случае, не будут понимать основ кодировки. Юпитер это конечно прикольно. Но теряется смысл понимания алгоритмики кода. На win 10 этот юпитер, если честно очень криво работает. Точнее не срабатывает запуск окна ссылками. Приходится через отдельное приложение его запускать. Баг как никак. Недоработка на мультисистемность. А так не плохие у вас видео. Но все же разработка, должна вестись по правилам программирования.
@ИгнатМирзализадэ
@ИгнатМирзализадэ 3 жыл бұрын
Каждый что то подчерпнет в этом видео. Я вот узнал, что я оказывается дата-журналист. Пойду ХХ шерстить на вакансии )
@istories_workshop
@istories_workshop 3 жыл бұрын
День прошел не зря)) ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@Dmitrijs.Skorohodovs
@Dmitrijs.Skorohodovs Жыл бұрын
Выдаёт ошибку - raise FeatureNotFound( bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library? Что делать?
@B1eka
@B1eka 11 ай бұрын
Библиотеки надо сначало скачать и импотритовать
@Dmitrijs.Skorohodovs
@Dmitrijs.Skorohodovs Жыл бұрын
Почему выдаёт ошибку raise FeatureNotFound( bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library? Даже если lmlx установлен?...
@alexdixon2844
@alexdixon2844 Жыл бұрын
"видим что теперь наш код упорядочен..." - только почему он в реальности выводится в одну строчку?)
@gruzin01
@gruzin01 Жыл бұрын
Спасибо большое за ваши уроки. Вы знаете, что на сегодняшний день ваш урок потерял актуальность так как сайт скорее всего переписали и теперь в объект soup попадает нечитаемая ерунда. Хорошо было бы если бы вы сняли видео как бы продолжение и рассказали как теперь парсить этот сайт.
@lifenow6078
@lifenow6078 Жыл бұрын
да, тоже столкнулся с этой проблемой( смогли решить?
@moksggwp4195
@moksggwp4195 2 жыл бұрын
Можете прикрепить готовый ipynb, py файл из этого видео? Буду очень рад если скинете!❤
@floki_spb
@floki_spb 2 жыл бұрын
УМНИЦА!!!!!!
@vasiliyovchinnikov1731
@vasiliyovchinnikov1731 2 жыл бұрын
Спасибо огромное!
@АлексейС-ч3г
@АлексейС-ч3г 2 жыл бұрын
Так вот для кого продвигают Python! Иноагентки и иноагенты всех стран, саморазоблачайтесь!
@MadinaAbaeva-b4w
@MadinaAbaeva-b4w Жыл бұрын
Здравствуйте, у меня есть 30 тыс ссылок и мне нужно из каждой ссылки собрать - артикул, описание и картинку. Заметила, что сайт не любит большое количество запросов. Есть ли способ обойти эту защиту используя прокси или что-то другое. Хотела купить прокси, но это дорого.
@РомаДинисов-э5б
@РомаДинисов-э5б 3 жыл бұрын
Добрый день, мне просто стало интересно вы по паспорту Алеся? Или все таки это опечатка, на сколько мне известно данное имя пишется Олеся!
@istories_workshop
@istories_workshop 3 жыл бұрын
Нет, она Алеся) Вряд ли бы мы не научились правильно писать имя коллеги)) ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@АлександрТележанин
@АлександрТележанин 2 жыл бұрын
Очень живо и понятно всё! Спасибо за урок!
@rakhmanovtr
@rakhmanovtr 2 жыл бұрын
шикарно для новичка
@sikirey4151
@sikirey4151 2 жыл бұрын
код может работать но при следующем включении выдает ошибку: 'NoneType' object has no attribute 'find' понимаю что ошибка связана с тем что какая-то деталь find() - None, но прикол в том что он код работал
@timuryuldoshev1609
@timuryuldoshev1609 2 жыл бұрын
точно такая же проблема...второй атрибут .find и атрибут .get не признаёт. Может bs4 изменился?
@ВладЯрмолюк-р3л
@ВладЯрмолюк-р3л Жыл бұрын
Тоже столкнулся с такой проблемой. Код работает и при следующем запуске уже не работает поиск, так как исходник пустой. Как я понял, сайт блокает ваш запрос. Ведь сменив сайт и проделав всё тоже самое - таких проблем нет. Это при условии, что вы не ошиблись в самом коде
@ДенисЭдуардович-э8щ
@ДенисЭдуардович-э8щ 2 жыл бұрын
так и не понял где до цикла определена "переменная" film использующася в цикле.... после переименования соуп в филм, пропадает подкрашивание синтаксиса find
@istories_workshop
@istories_workshop 2 жыл бұрын
Здравствуйте. Попробуйте написать в наш чат t.me/istories_helloworld, не видя ваш код невозможно понять, в чем может быть проблема. ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@patriziab6782
@patriziab6782 3 жыл бұрын
Здравствуйте, на предпоследнем шагу len(data) возвращает 0. Код вроде точь-в-точь, не пойму в чём проблема. Код вроде точь-в-точь, не пойму в чём проблема. Не могли бы вы подсказать, что может быть тому причиной, или опубликовать исходник? Спасибо, видео очень понравилось!
@istories_workshop
@istories_workshop 3 жыл бұрын
Здравствуйте! Видимо, все же не один в один... Попробуйте показать ваш код в нашем чате, постараемся помочь: t.me/istories_helloworld ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@academy-mu6uh
@academy-mu6uh Жыл бұрын
У меня вопрос, а как быть со страницами на которых кодьнельзя просмотреть (resources page), нажимая а открывается тупа пустая страница?
@osvab000
@osvab000 Жыл бұрын
На 9 минуте, после команды: soup.find('div', class_='desktop-rating-selection-film-item').find('a', class_='selection-film-item-meta_link') - выскакивает ошибка! У вас работает а у меня нет и не могу понять почему? Может это из-за Коллаба?
@istories_workshop
@istories_workshop Жыл бұрын
Чтобы ответить на вопрос, нужно видеть текст ошибки. Там должно быть написано, почему код не может пройти дальше и в какой строке проблема. Если не получается найти самому, погуглите текст ошибки - на StackOverflow скорее всего уже будет ответ
@codywallker1208
@codywallker1208 2 жыл бұрын
Я вот Scraph делаю в VS и все правильно делаю но у меня выходит ошибка None object type Error и я не понимаю почему но я все правильно делаю
@codywallker1208
@codywallker1208 2 жыл бұрын
Только не скажите надо гуглить я ютублю а не гуглю ) и от вас хочу узнать проблему
@istories_workshop
@istories_workshop 2 жыл бұрын
так если ошибка выходит, значит все-таки что-то неправильно делаете)) Но по комментарию в ютубе сложно понять, что пошло не так, надо видеть код ошибки и ваш код. У нас в описаниях к видео есть ссылка на чатик, куда можно задавать такие вопрос, если вы не хотите задавать их гуглу (мы, как видите, в комментариях отвечаем медленновато)
@gcodegsk9632
@gcodegsk9632 2 жыл бұрын
Искренне не понимаю, как с таким качеством контента у вас такое небольшое количество подписчиков, уверен, это временно конечно, но возможно, стоит сменить название канала на что-то более логически подходящее к формату ;)
@feelingshady
@feelingshady 2 жыл бұрын
Сначала все работало, а потом find перестал что-либо искать, словно кинопоиск поставил какую-то защиту типа капчи.
@sofiam2237
@sofiam2237 2 жыл бұрын
Как решить эту проблему?
@ВладЯрмолюк-р3л
@ВладЯрмолюк-р3л Жыл бұрын
Допишите юзер агент после юрл. На первые пару запросов хватит. Но это значение нужно бдует менять постоянно. Советую найти другой сайт для практики
@CatMebelevich
@CatMebelevich 2 жыл бұрын
Хорошо бы еще про установку BeautifulSoup
@АекссКек
@АекссКек Жыл бұрын
В начале видео было … pip install bs4
@ПавелЛешок-ь7л
@ПавелЛешок-ь7л 2 жыл бұрын
Скачал пайтон, запустил, открылась системная трока (чёрное окно). Как сделать такой же удобный интерфейс, как у вас?
@Arnur-wt3vd
@Arnur-wt3vd 2 жыл бұрын
у автора Jupyter Notebook
@alexdixon2844
@alexdixon2844 Жыл бұрын
Скажите пожалуйста, почему вместо кода пишет результат None?
@Your.m.o.t.h.e.r
@Your.m.o.t.h.e.r 2 жыл бұрын
При добавлении этой строчки soup = BeautifulSoup(r.text, "lxml") Выдает ошибку File "C:\Users\thxmd\PycharmProjects\html_pars\venv\Lib\site-packages\bs4\__init__.py", line 248, in __init__ raise FeatureNotFound( bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library? Что я делаю не так ?
@kos6036
@kos6036 Жыл бұрын
попробуй "lxml" в одинарные кавычки 'lxml'
@Павел-у9г1р
@Павел-у9г1р Жыл бұрын
Если актуально то обнови lxml (pip install --upgrade lxml), перезагрузи kernel и импортируй все библиотеки заново. У меня сработало.
@valdemarvaldemar4734
@valdemarvaldemar4734 2 жыл бұрын
Добрый день! Огромная благодарность за видео и знания, которыми Вы делитесь! Прошу помощи! Сложил код, но работает странно: выбирает данные только из первых двух (из 5) страниц сайта. Остальные 3, 4 и 5 просто под номером принтит (согласно коду), но без результатов парсинга данных в файл. Цикл страниц задан верно (1-6). Но, увы и ах...
@istories_workshop
@istories_workshop 2 жыл бұрын
Здравствуйте. Попробуйте написать в наш чат t.me/istories_helloworld, не видя ваш код невозможно понять, в чем может быть проблема. ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@valdemarvaldemar4734
@valdemarvaldemar4734 2 жыл бұрын
@@istories_workshop Спасибо за обратную связь, к этому моменту я понял в чем проблема. После второй страницы на сайте появляется "капча". А значит Вашим урокам есть куда развиваться. Ждем предложений :)
@alex_grothendieck9701
@alex_grothendieck9701 2 жыл бұрын
@@istories_workshop у меня появляется капча ещё на первой странице, совсем не даёт ничего спарсить :( Причем пробовал и устройства менять, и сети подключения. Это можно как-то починить? Ну или возможно вы могли бы подсказать какой-то другой сайт вместо КиноПоиска со схожим устройством разделов, чтобы можно было на этом сайте потренироваться?
@day_tradingnew
@day_tradingnew Жыл бұрын
Если для той страницы что я хочу спарсить требуется авторизация? Как быть в этом случае?
@B3CK0FF
@B3CK0FF Жыл бұрын
смотреть урок про парсинг с авторизацией) там вроде работа с куками и их сохранение...
@JohnDoe-hp5kw
@JohnDoe-hp5kw 2 жыл бұрын
У меня почему-то периодически выдает ошибку 'NoneType' object has no attribute 'find' С чем это может быть связано? Первый раз пишу print и все ОК, а на второй или 3 раз вылезает такая ошибка
@istories_workshop
@istories_workshop 2 жыл бұрын
Здравствуйте. Попробуйте написать в наш чат t.me/istories_helloworld, не видя ваш код невозможно понять, в чем может быть проблема. ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@teacherit5840
@teacherit5840 11 ай бұрын
Сейчас у меня не работает видимо сайт стал динамическим?
@teacherit5840
@teacherit5840 10 ай бұрын
Возможно.ВОзможно заголовки просит
@Stereophoto
@Stereophoto 9 ай бұрын
пробуйте другие ресурсы, я на этом примере сделал скрейпинг каталога виниловых пластинок с одного ресурса
@МишаКулешов-ф2ф
@МишаКулешов-ф2ф 2 жыл бұрын
Здравствуйте, кто-то может подсказать пожалуйста? Вот какая проблема. Делал все пошагово - работало. Ровно до тех пор, пока на попытался парсить все пять страниц. После этого мне вначале выдало исключительно 4ю страницу. А затем цикл просто стал выдавать пустой лист. Перешел к первым шагам, решил еще раз попробовать на одной странице и теперь request.get(url) с той же самой ссылкой выдает абсолютно другой скрипт страницы, как это происходит и что с этим делать?..
@sg6630
@sg6630 Жыл бұрын
Подскажите как вытягивать из одинаковых тэгов инфу 12,500.00 12,721.97 мне выдает первый тэг и все, остальные как?
@sg6630
@sg6630 Жыл бұрын
решил сам. Кому интересно. Мы ищем find_all все элементы, потом из списка выбираем то что нужно
@restsheets2962
@restsheets2962 3 жыл бұрын
Спасибо за видео! А можно также брать информацию из сайта, где постоянно сервер перезагружается. Сайт универа ужасный, если просто вырвать ссылку, то нужно заходить по логину и паролю и всё заново
@istories_workshop
@istories_workshop 3 жыл бұрын
Здравствуйте! Сложно сказать, не видя сайт и код. Возможно, придется логиниться каждый раз. Заходите в наш чат t.me/istories_helloworld, постараемся подсказать более детально. ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@constantine_rolls
@constantine_rolls Жыл бұрын
@alexeymendrin
@alexeymendrin 3 жыл бұрын
Подскажите, когда будет следующее видео?
@istories_workshop
@istories_workshop 3 жыл бұрын
Здравствуйте, планируем на понедельник. ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@alexeymendrin
@alexeymendrin 3 жыл бұрын
@@istories_workshop Спасибо! Очень интересные и познавательные видео. Буду ждать :)
@ThisIsGreenRoom
@ThisIsGreenRoom 2 жыл бұрын
@@istories_workshop 🤦‍♂ каждый комментарий должен быть сопровождён этой чушью про "шпионов"? в кремле вообще кукухой поехали, курсы кройки и шитья скоро будут иноагентами...
@karimjapparov5324
@karimjapparov5324 11 ай бұрын
thank you
@TiHbUA
@TiHbUA 3 жыл бұрын
Что делать если возвращает ошибку "'NoneType' object is not callable" , после вызова findall?
@istories_workshop
@istories_workshop 3 жыл бұрын
То же самое, что и при любой другой ошибке: гуглить ее и читать, как подобные ошибки решали другие. Потому что явно у кого-то было то же самое ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА Т..к мы не видим ваш код, то, возможно, вам подойдет этот ответ. stackoverflow.com/questions/41614706/nonetype-object-is-not-callable-when-i-learn-web-scraping Если нет - нужно поискать еще)
@TheMrDivinsky
@TheMrDivinsky 3 жыл бұрын
Good soup 👌
@Евгений-д5з7ф
@Евгений-д5з7ф 3 жыл бұрын
спасибо
@Reach_of_the_Astronomican
@Reach_of_the_Astronomican 3 жыл бұрын
а, блин, это же тоже иностранный агент, а то я захожу в мастерскую как в другой мир обычно
@istories_workshop
@istories_workshop 3 жыл бұрын
Теперь это одна коновселенная)) ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@dicloniusN35
@dicloniusN35 2 жыл бұрын
а как то же самое с мобильным приложением сделать?)
@tengenuzui3907
@tengenuzui3907 2 жыл бұрын
У меня высвечивается None что делать
@alexeiiminailov560
@alexeiiminailov560 Жыл бұрын
soup=BeautifulSoup(r.text, "lxml") выскакивает ошибка NameError Traceback (most recent call last) Cell In[12], line 1 ----> 1 soup=BeautifulSoup(r.text, "lxml") NameError: name 'BeautifulSoup' is not defined
@НикитаМихайлович-ч5п
@НикитаМихайлович-ч5п Жыл бұрын
Может у вас библиотека не импортирована?
@emrullahergun7318
@emrullahergun7318 2 жыл бұрын
Здравствуйте, я хочу извлечь данные с иностранного сайта. За плату. можете вы помочь мне?Пожалуйста, мне нужно срочно((
Скрейпинг сайтов с помощью библиотеки Selenium
21:10
Мастерская Важных историй
Рет қаралды 42 М.
Парсинг динамических сайтов | selenium python
43:00
Алексей Куличевский
Рет қаралды 14 М.
How To Choose Mac N Cheese Date Night.. 🧀
00:58
Jojo Sim
Рет қаралды 104 МЛН
BeautifulSoup + Requests | Web Scraping in Python
6:58
Alex The Analyst
Рет қаралды 159 М.
4. Парсинг сайта на Python. Библиотека Selenium
11:11
ITMouse: международная школа программирования
Рет қаралды 1,1 М.
Веб-скрейпинг с помощью библиотек Selenium и Beautifulsoup
16:24
Мастерская Важных историй
Рет қаралды 7 М.
Why is Python 150X slower than C?
10:45
Mehul - Codedamn
Рет қаралды 30 М.