[Специалист] Анализ и визуализация данных на языке Python. Уровень 4 (Илья Елисеев)
?
Всего за несколько лет средства анализа данных, доступные разработчикам на Python, совершили рывок вперёд. Появились мощные пакеты, реализующие алгоритмы машинного обучения, обработку естественных языков, статистический анализ и визуализацию.
Инструменты языка Python просты в использовании, при этом имеют широкие возможности применения. Программирование на Python – простой и эффективный вариант для вхождения в популярную сферу Data Science.
Уникальная особенность языка – возможность быстрого встраивания анализа данных в веб-приложения.
Курс «Анализ и визуализация данных на языке Python. Библиотеки Pandas, numpy, Matplotlib»предназначен для тех, кто ищет гибкий инструмент обработки, анализа и визуализации данных и планирует применять свои навыки в работе большими массивами информации.
Слушатели изучат важнейшие и широко распространенные библиотеки numpy, Matplotlib и Pandas, которые массово применяются в различных областях производственной, финансовой и научной деятельности.
Обучение на курсе построено на примерах реальных проектов в области обработки данных.
Курс читается на базе операционной системы Linux, однако его материал может быть применен и на Windows.
Курс предназначен для программистов, аналитиков, научных работников. Также курс может служить введением в Data Science.
По окончании курса Вы будете уметь:
- Создавать и обрабатывать числовые массивы.
- Создавать диаграммы и графики различных видов и форматов.
- Объединять и переформировывать данные.
- Основы анализа и визуализации данных, применяемый для этой цели базовый инструментарий языка Python;
- Основные понятия и методики библиотеки numpy: массив, скаляр, массовая операция, основные операции с массивами, основные функции библиотеки;
- Библиотеку Matplotlib ее основные понятия и методики применения;
- Основные виды графиков и диаграмм, способы их построения;
- Основные понятия и методики библиотеки Pandas.
- Принципы организации и управления вычислениями. Используемые языки программирования и взаимосвязь между ними.
- Необходимые пакеты Python: numpy, Matplotlib, Pandas, Jupyter и другие.
- Дистрибутив Anaconda, его преимущества и недостатки.
- Установка пакетов в Linux.
- Установка пакетов в Windows. Возможные проблемы и методы их решения.
- Понятие массива и его основные характеристики.
- Структура библиотеки.
- Типы данных библиотеки numpy.
- Принципы вычислений.
- Универсальные функции.
- Важнейшие стандартные функции.
Работа с массивами и матрицами.
Модуль 4. Библиотека Matplotlib. Визуализация данных.
- Виды графиков и диаграмм.
- Основные элементы диаграммы.
- Создание диаграммы.
- Форматы изображений.
- График функции.
- Гистограмма.
- Объект Series.
- Объект DataFrame.
Модуль 7. Практикум.
Первичная обработка данных.
- Загрузка и выгрузка данных.
- Организация колонок и строчек.
- Пропуски и повторы.
- Типы данных для представления времени.
- Объект Period.
- Основные операции статистики.
Статистика. Объединение и переформирование данных.
- Объединение данных.
- Сцепление и наложение (concatenating and stacking).
- Слияние (merging and joining).