Скрейпинг сайтов с помощью библиотеки Scrapy

  Рет қаралды 31,761

Мастерская Важных историй

Мастерская Важных историй

Күн бұрын

Пікірлер: 67
@istories_workshop
@istories_workshop 2 жыл бұрын
❗❗❗Так называемое Министерство юстиции РФ признало «Важные истории» «нежелательной организацией». Так что репост этого и любого другого нашего видео может караться штрафом, а повторный репост - уголовным делом. Но никто не может запретить вам смотреть и думать. Поэтому подписывайтесь на наш канал, просите подписаться своих друзей и оставайтесь с нами - в это темное время выжить мы сможем только вместе.
@TheJonvish
@TheJonvish Жыл бұрын
Здравствуйте. Можно ссылку на тот материал из за которого вас признали «нежелательной организацией»?
@whosane9923
@whosane9923 10 ай бұрын
Что значит "так называемое"? Вы клоуны если являетесь иноагентами , говорите об этом и всё. А сказки про уголовные дела за репост, это вы бабушке своей рассказывай 😂
@Amigun_yo
@Amigun_yo Жыл бұрын
"yield - это ключевое слово в scrapy, которое позволяет выполнить разные действия" - это, конечно, мощно
@antont5229
@antont5229 Жыл бұрын
Тоже резануло ухо от этой фразы )))
@gutis_g
@gutis_g 8 ай бұрын
women @@antont5229
@den-rad
@den-rad 2 жыл бұрын
Никогда бы не подумал, что исчерпывающую информацию по python библиотеке я получу на ютюб канале СМИ, которое признано инагентом :) Удачи вам!
@MrFerting
@MrFerting 2 жыл бұрын
Хочу отметить, что подача материала очень легкая. Несомненный плюс, что вы обучаете предметно. Материал запоминается проще и есть желание искать доп. информацию самостоятельно. Молодцы, что тут сказать. Видно, что любите свою работу и делитесь знаниями бесплатно.
@istories_workshop
@istories_workshop 2 жыл бұрын
Спасибо! ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@nurlansalkinbayev3890
@nurlansalkinbayev3890 3 жыл бұрын
Здравствуйте. Спасибо вам за работу и видео. Очень подробное объяснение, такое редко встретишь на KZbin. Ещё раз спасибо.
@lostinchineseroom
@lostinchineseroom 3 жыл бұрын
вы большие молодцы, что ведёте эти серии. прям совсем молодцы
@alexeytsar
@alexeytsar 3 жыл бұрын
Ура! следующая серия
@oldlipton3443
@oldlipton3443 3 жыл бұрын
Спасибо за паука🕷️, и с возвращением!
@slavpetrovich32
@slavpetrovich32 Жыл бұрын
Цена этому уроку "yield - ключевое слово в скрэппи". Думайте
@herman_guilliman
@herman_guilliman Жыл бұрын
на этом моменте человек которому заплатили за написание урока решил схалтурить, а я заорал как резаный
@Crwbsko
@Crwbsko 2 жыл бұрын
Очень хорошая подача, всё наглядно и понятно
@Did_You_Know_DE
@Did_You_Know_DE Жыл бұрын
Спасибо
@РусланКурбанов-о4н
@РусланКурбанов-о4н 2 жыл бұрын
Спасибо, очень доступно и понятно, так держать!!!!
@istories_workshop
@istories_workshop 2 жыл бұрын
Спасибо!) ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@isagidaiki
@isagidaiki Жыл бұрын
Огромное спасибо!!!
@talgatmustafin5236
@talgatmustafin5236 Жыл бұрын
Здравствуйте! Можно ли Scrapy использовать в Jupiter notebook? Пытаюсь найти ответ в интернете, безрезультатно.
@aleksey2408
@aleksey2408 2 жыл бұрын
Спасибо большое за весь ваш материал на KZbin !!!
@istories_workshop
@istories_workshop 2 жыл бұрын
Спасибо, что смотрите) ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@vladimirantonov4506
@vladimirantonov4506 Жыл бұрын
Можно просто scrapy shell "" - минуя fetch... Хорошее видео!
@Rinova638
@Rinova638 2 жыл бұрын
Со 2 раза все понял , спасибо Вам )))
@akim7130
@akim7130 Жыл бұрын
Пробую отправить response, но в ответ приходит пустой список, пробовал и за id зацепиться и пробелы заменил на точки - не выходит. Сайт не динамический. В чем можем быть проблема?
@talgatmustafin5236
@talgatmustafin5236 Жыл бұрын
Здравствуйте! Что за ошибка raise KeyError(f"Spider not found: {spider_name}")?
@genylivnev7822
@genylivnev7822 Жыл бұрын
День добрый! На 8:40, вы показываете название класса, которое нужно вставить в response, что бы найти ссылку, а когда проверяете в scrapy shell название класса совсем другое, это как? По названию видно, что наверное вы тянули ссылку на изображение
@p_r_o_e_k_t_o_r
@p_r_o_e_k_t_o_r 2 жыл бұрын
Любимый писатель Пелевин.
@ДжонСмит-ч5ь
@ДжонСмит-ч5ь Жыл бұрын
На винде не выделяется цветом ответ и запрос, в терминале, у меня выбор cmd/ps1 только а там Python
@ДжонСмит-ч5ь
@ДжонСмит-ч5ь Жыл бұрын
Разобрался, нужно было добавить цвета в settings.json "workbench.colorCustomizations": { "terminal.background":"#000000", "terminal.foreground":"#D0D0D0", "terminalCursor.background":"#D0D0D0", "terminalCursor.foreground":"#D0D0D0", "terminal.ansiBlack":"#000000", "terminal.ansiBlue":"#0066FF", "terminal.ansiBrightBlack":"#808080", "terminal.ansiBrightBlue":"#0066FF", "terminal.ansiBrightCyan":"#00FFFF", "terminal.ansiBrightGreen":"#33FF00", "terminal.ansiBrightMagenta":"#CC00FF", "terminal.ansiBrightRed":"#FF0000", "terminal.ansiBrightWhite":"#FFFFFF", "terminal.ansiBrightYellow":"#FF0099", "terminal.ansiCyan":"#00FFFF", "terminal.ansiGreen":"#33FF00", "terminal.ansiMagenta":"#CC00FF", "terminal.ansiRed":"#FF0000", "terminal.ansiWhite":"#D0D0D0", "terminal.ansiYellow":"#FF0099" }
@xe34__47
@xe34__47 Жыл бұрын
сидят как-то 2 паука в джакузи
@markhavidzer7249
@markhavidzer7249 Жыл бұрын
Разве в приведенном примере кода мы не соберём первую страницу раздела дважды?
@ИгорюшаЗелёнкин
@ИгорюшаЗелёнкин 2 жыл бұрын
У меня после запуска паука, такая вот краказябра в логах: ignoring response 520 http status code is not handled or not allowed. В итоге файл создаётся, но он пустой(
@Леонид-ш6я
@Леонид-ш6я Жыл бұрын
меня просто это убивает, с помощью питона вы сможете парсить всё что захотите, а что блять мне делать если у меня не двести
@SleepMashine
@SleepMashine Жыл бұрын
Хорош ваш ужвак)
@ДмитрийДмитриев-м1ф
@ДмитрийДмитриев-м1ф Жыл бұрын
Розамунд Пайк не ваша сестра случайно?
@ДеньгизаПользу
@ДеньгизаПользу 2 жыл бұрын
капец. Без знания основ синтаксиса, напоровшись на значение класса написанное с пробелом, можно всю схему завалить. Чуть башка не лопнула, пока пытался догадаться, как выкрутиться или в чём ошибся.. И о чудо.. этот моментик, решён в следующем ролике. Скрапи-2. Ваще жесть. Сколько ещё таких подножек я поймаю в будущем )))
@Denmark1150
@Denmark1150 2 жыл бұрын
Прикольно
@СергейИванов-с1в3ч
@СергейИванов-с1в3ч 2 жыл бұрын
Можете подсказать как не нарваться на капчу или обойти её?
@ArtyomSmirnov-ds1gp
@ArtyomSmirnov-ds1gp Жыл бұрын
Отличное видео! Отвратительная статья! Где код вставлен скриншотами
@constantine_rolls
@constantine_rolls Жыл бұрын
Вижу штамп порядочной организации, ставлю лайк❤
@neivanitsa7913
@neivanitsa7913 2 жыл бұрын
Аааа! Нельзя же мышкой файлы создавать!!!! Ааааа!! Вас настигнет кара божья!!! Нужно срочно переписать видео с touch Господи помилуй! Господи прости!
@Мерзавцы
@Мерзавцы Жыл бұрын
Вы из-за лого python не желательная организация, у нас теперь же все сочетания голубого и жёлтого теперь под запретом))) Это подсказка как удалиться из этого реестра.
@istories_workshop
@istories_workshop Жыл бұрын
Поверьте, такой лайфхак не сработает))
@vladtroshin421
@vladtroshin421 2 жыл бұрын
А как скрапить данные со страниц с Ajax, которые бесконечно прокручиваются вниз ?
@istories_workshop
@istories_workshop 2 жыл бұрын
Об этом можно почитать в документации библиотеки Selenium, но возможно мы сделаем об этом отдельный урок :) ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@daddy_eddy
@daddy_eddy 2 жыл бұрын
@@istories_workshop Я думаю огромноеколичество народа посмотрит такое видео. А еще бы про шаблоны Scrapy расскажите плиз.
@user---------
@user--------- 2 ай бұрын
Вы бы хоть сказали между делом про прокси, лимиты и тп. А то новичок запустит ваш паук и сразу получит бан от сайта (почти любого). Хоть задержку между запросами поставили бы что-ли, ну как-то совсем дилетантский подход у вас. В 99% случаев вашего паука забанят после пары десятков-сотен запросов
@ValorantBaku
@ValorantBaku Жыл бұрын
что делать если получаю 403
@return_1101
@return_1101 2 жыл бұрын
Паук кажется эффективнее.
@istories_workshop
@istories_workshop 2 жыл бұрын
Зависит от задач. И от того, кому с чем удобнее работать
@AnnaIsHere
@AnnaIsHere 2 жыл бұрын
Музыка почти такая же громкая, как речь. Из-за этого сложно слушать
@spyphyfarnsworth6050
@spyphyfarnsworth6050 2 жыл бұрын
Почему Скрейпинг? Вы же не говорить "скрейпи"
@Raspi8
@Raspi8 3 жыл бұрын
Может не Control, а Command?
@ИгнатМирзализадэ
@ИгнатМирзализадэ 3 жыл бұрын
Еще скажи, что клавиатура без клавиши delete пригодна для написания кода )))
@istories_workshop
@istories_workshop 2 жыл бұрын
Если у вас Мак, то command ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@ggus0569
@ggus0569 2 жыл бұрын
@@ИгнатМирзализадэ еще скажи что ты не знал, что с фн-ом бэкспейс становится делитом...
@ГеоргийПанков-ь7д
@ГеоргийПанков-ь7д Жыл бұрын
а к вам можно на работу попасть?
@dd-pe5dp
@dd-pe5dp 3 жыл бұрын
с 9 минуты тяжело понять
@istories_workshop
@istories_workshop 3 жыл бұрын
Здравствуйте! Попробуйте задать вопрос более детально в нашем чате: t.me/istories_helloworld ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
@Сергей-ъ9ь5р
@Сергей-ъ9ь5р 2 жыл бұрын
костыльная и не удобная бандура
@norman5324
@norman5324 Жыл бұрын
А чем по вашему удобно парсить динамические сайты?
@uvencosuper3471
@uvencosuper3471 2 жыл бұрын
Тут вообще началось "как нарисовать сову" )
@istories_workshop
@istories_workshop 2 жыл бұрын
🤔🤔 ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
Скрейпинг сайтов с помощью Scrapy. Часть 2 | Crawl Spider
9:17
Мастерская Важных историй
Рет қаралды 10 М.
Скрейпинг сайтов с помощью библиотек Beautifulsoup и Requests на Python
23:05
Мастерская Важных историй
Рет қаралды 80 М.
Муж внезапно вернулся домой @Oscar_elteacher
00:43
История одного вокалиста
Рет қаралды 7 МЛН
How To Choose Mac N Cheese Date Night.. 🧀
00:58
Jojo Sim
Рет қаралды 104 МЛН
Скрейпинг сайтов с помощью библиотеки Selenium
21:10
Мастерская Важных историй
Рет қаралды 42 М.
Scrapy Course - Python Web Scraping for Beginners
4:37:09
freeCodeCamp.org
Рет қаралды 472 М.
Парсинг без программирования II. WebScraper
30:30
Евгений Лукин
Рет қаралды 8 М.
Понять Django. Пишем "Hello world". Объясняю просто и с картинками.
25:49
Клуб дедов-программистов
Рет қаралды 190 М.
Веб-скрейпинг с помощью библиотек Selenium и Beautifulsoup
16:24
Мастерская Важных историй
Рет қаралды 7 М.
Scrapy for Beginners - A Complete How To Example Web Scraping Project
23:22
John Watson Rooney
Рет қаралды 278 М.
Муж внезапно вернулся домой @Oscar_elteacher
00:43
История одного вокалиста
Рет қаралды 7 МЛН