[Udemy] Веб-парсинг на Python с BeautifulSoup и Selenium 2021(Christopher Zita)

Самый современный и проектный курс Web Scraping на Python с использованием BeautifulSoup и Selenium!

Язык: Английский + англ. субтитры + !!!русские субтитры!!!

Чему вы научитесь

  • Понимание основ веб-парсинга
  • Создавайте собственные проекты по парсингу
  • Изучите основные компоненты двух самых мощных библиотек парсинга: BeautifulSoup и Selenium
  • Как нажать кнопку, отправить текст в поле ввода и выполнить самопрокрутку с помощью Selenium
  • Удаление данных с одностраничных, многостраничных и бесконечных веб-сайтов с прокруткой
  • 5 проектов, каждый со своей уникальной задачей
  • Автоматизировать скрипты Python
  • Понимание селекторов HTML и Xpath
Описание
Веб-парсинг стал одной из самых горячих тем в мире науки о данных, поскольку получение доступа к данным может помочь или сломать вас.

Вот почему компании из списка Fortune 500, такие как Walmart, CNN, Target и Amazon, используют парсинг веб-страниц, чтобы опережать и опережать данные.

Добро пожаловать в веб-парсинг на Python с BeautiuflSoup и Selenium!

Самый современный и ориентированный на проекты курс на данный момент.

В этом курсе вы узнаете, как очищать данные с некоторых из самых известных веб-сайтов, в том числе:
  • Twitter
  • Airbnb
  • Nike
  • Google
  • Indeed
  • NFL
  • MarketWatch
  • Worldometers
  • IMDb
  • Carpages
В конце этого курса вы поймете самые важные компоненты веб-парсинга и сможете создавать свои собственные веб-парсеры для получения новых данных с любого веб-сайта, автоматизации любых задач с помощью веб-парсинга и т.

Кроме того, ознакомьтесь с некоторыми из наиболее распространенных методов очистки и отточите свои навыки программирования на Python, пока вы занимаетесь этим!
  1. Во-первых, изучите основы веб-парсинга, изучите структуру веб-сайта и подготовьте свою локальную среду к решению задач парсинга с помощью BeautifulSoup и Selenium.
  2. Затем расскажем об основах BeautifulSoup, воспользуемся библиотекой запросов и LXML-анализатором и увеличим масштаб для развертывания нового алгоритма парсинга для извлечения данных из любой таблицы в сети и с нескольких страниц.
  3. В-третьих, настройте Selenium для работы с веб-страницами, управляемыми JavaScript, и используйте уникальные функции Selenium для взаимодействия со страницами.
  4. Объедините концепции BeautifulSoup и Selenium, чтобы создать наиболее эффективные парсеры для работы с некоторыми из самых сложных веб-сайтов.
  5. Наконец, узнайте, как сделать парсинг веб-страниц полностью автоматическим, запустив парсер каждый день в определенное время.

Что отличает этот курс от других и почему вам следует записаться на него?
  • Во-первых, это самый обновленный курс на данный момент.
  • Во-вторых, это наиболее ориентированный на проекты курс, который вы найдете, где мы проанализируем многие из самых известных веб-сайтов в Интернете.
  • У вас будет подробное пошаговое руководство о том, как стать профессиональным парсером.
  • Вы узнаете, как использовать Selenium для очистки веб-сайтов JavaScript, и я могу заверить вас, что вы не найдете никаких руководств, которые научили бы вас, как действительно использовать Selenium, как я буду делать в этом курсе.
  • Вы узнаете, как создать полностью автоматизированный скрипт парсинга веб-страниц, который периодически запускается без вашего вмешательства.
Итак, являетесь ли вы специалистом по обработке данных, машинным обучением или инженером искусственного интеллекта, который хочет получить доступ к большему количеству источников данных; веб-разработчик, стремящийся автоматизировать задачи, или любитель данных, интересующийся наукой о данных и парсингом…

Этот курс представляет собой углубленное представление основ, методологий и подходов парсинга веб-сайтов, которые вы можете легко применить в своих личных проектах или в реальном мире бизнеса.