[Специалист] Анализ и визуализация данных на языке Python. Уровень 4 (Илья Елисеев)

Цена:
1078
doneМного
doneЗаканчивается
highlight_offНет в наличии
notifications_none
Уведомить

[?IMG]

?
The data analysis and visualization in Python. Packages Pandas, numpy, Matplotlib
Всего за несколько лет средства анализа данных, доступные разработчикам на Python, совершили рывок вперёд. Появились мощные пакеты, реализующие алгоритмы машинного обучения, обработку естественных языков, статистический анализ и визуализацию.
Инструменты языка Python просты в использовании, при этом имеют широкие возможности применения. Программирование на Python – простой и эффективный вариант для вхождения в популярную сферу Data Science.

Уникальная особенность языка – возможность быстрого встраивания анализа данных в веб-приложения.
Курс «Анализ и визуализация данных на языке Python. Библиотеки Pandas, numpy, Matplotlib»предназначен для тех, кто ищет гибкий инструмент обработки, анализа и визуализации данных и планирует применять свои навыки в работе большими массивами информации.
Слушатели изучат важнейшие и широко распространенные библиотеки numpy, Matplotlib и Pandas, которые массово применяются в различных областях производственной, финансовой и научной деятельности.
Обучение на курсе построено на примерах реальных проектов в области обработки данных.
Курс читается на базе операционной системы Linux, однако его материал может быть применен и на Windows.
Курс предназначен для программистов, аналитиков, научных работников. Также курс может служить введением в Data Science.

По окончании курса Вы будете уметь:
  • Создавать и обрабатывать числовые массивы.
  • Создавать диаграммы и графики различных видов и форматов.
  • Объединять и переформировывать данные.
После окончания обучения Вы будете знать:
  • Основы анализа и визуализации данных, применяемый для этой цели базовый инструментарий языка Python;
  • Основные понятия и методики библиотеки numpy: массив, скаляр, массовая операция, основные операции с массивами, основные функции библиотеки;
  • Библиотеку Matplotlib ее основные понятия и методики применения;
  • Основные виды графиков и диаграмм, способы их построения;
  • Основные понятия и методики библиотеки Pandas.
Специалисты, обладающие этими знаниями и навыками, в настоящее время крайне востребованы. Большинство выпускников наших курсов делают успешную карьеру и пользуются уважением работодателей

Модуль 1. Установка и настройка программного обеспечения. Базовый инструментарий.
  • Принципы организации и управления вычислениями. Используемые языки программирования и взаимосвязь между ними.
  • Необходимые пакеты Python: numpy, Matplotlib, Pandas, Jupyter и другие.
  • Дистрибутив Anaconda, его преимущества и недостатки.
  • Установка пакетов в Linux.
  • Установка пакетов в Windows. Возможные проблемы и методы их решения.
Модуль 2. Библиотека numpy. Вычислительные задачи.
  • Понятие массива и его основные характеристики.
  • Структура библиотеки.
  • Типы данных библиотеки numpy.
  • Принципы вычислений.
  • Универсальные функции.
  • Важнейшие стандартные функции.
Модуль 3. Практикум.
Работа с массивами и матрицами.

Модуль 4. Библиотека Matplotlib. Визуализация данных.
  • Виды графиков и диаграмм.
  • Основные элементы диаграммы.
  • Создание диаграммы.
  • Форматы изображений.
Модуль 5. Практикум.
  • График функции.
  • Гистограмма.
Модуль 6. Библиотека Pandas. Статистика и анализ
  • Объект Series.
  • Объект DataFrame.

Модуль 7. Практикум.
Первичная обработка данных.


  • Загрузка и выгрузка данных.
  • Организация колонок и строчек.
  • Пропуски и повторы.
Модуль 8. Статистика. Временные ряды.
  • Типы данных для представления времени.
  • Объект Period.
  • Основные операции статистики.
Модуль 9. Практикум.
Статистика. Объединение и переформирование данных.


  • Объединение данных.
  • Сцепление и наложение (concatenating and stacking).
  • Слияние (merging and joining).