[karpov.courses] Симулятор Machine Learning Engineer, продвинутая практика (Валерий Бабушкин)
На симуляторе вы получите доступ к инфраструктуре и задачам разного уровня, которые подготовили ML-инженеры с опытом работы в ритейле, e-commerce и BigTech-компаниях.
Здесь вас ждёт практика на задачах, максимально приближенных к реальным, и в окружении, максимально похожем на рабочее. Вы сможете начать с комфортного для вас уровня сложности и повышать его по мере развития ваших навыков. Закрепив знания на кейсах из индустрии, вы подготовите себя к решению аналогичных задач на работе.
Для кого эта программа:
1. Хотите отработать знания на практике
Уже умеете обучать и деплоить ML-модели, писать SQL-запросы к базам данных, проводить A/B-тесты и строить BI-дашборды, но хотите закрепить свои знания.
2. Никогда не работали в индустрии
Хорошо разбираетесь в теории машинного обучения, но никогда не работали в индустрии и хотите получить опыт решения реальных бизнес-задач.
Как проходит обучение:
1. Используйте нашу инфраструктуру
- Работайте со всеми необходимыми инструментами на выделенном сервере.
- Практикуйтесь на данных из реальных задач.
- Отправляйте свои решения на автоматическую проверку нашей системой.
- Решайте актуальные задачи ML-инженера.
- Занимайтесь практикой без скучной теории.
- Главное — это работающее решение.
- Решайте задачи разных уровней: от Intern до Senior
- Пишите несложный код или создавайте полноценные ML-сервисы
1. Строить дашборды и писать SQL запросы.
2. Оценивать влияние моделей на показатели бизнеса с помощью A/B-тестов.
3. Деплоить модели и создавать свои микросервисы для ML
Задачи, которые мы будем решать:
ДИНАМИЧЕСКОЕ ЦЕНООБРАЗОВАНИЕ
Компания X6 управляет тысячами магазинов по всей стране. Перед ней стоит задача устанавливать цены товаров так, чтобы получать стабильную прибыль, при этом удерживая покупателей. Вы разработаете алгоритм, которые максимизирует выручку для целевой маржи.
#optimization #python #oop #matrix_algebra
ПРОГНОЗ ОТТОКА
Karpov.Courses хочет понимать, какие студенты стали реже заходить в Симулятор. Решите задачу-квест разработки модели оттока, пройдя несколько этапов: от пошагового написания SQL-запроса с оконными функциями для построения датасета — до постройте доверительных интервалов для предсказаний модели и её деплоя.
#sql #linear_models #python #etl #stats #ab_testing #math
УВЕРЕННОСТЬ МОДЕЛИ
Мы прогнозируем объемы продаж маркетплейса для миллионов товаров с помощью градиентного бустинга. Стейкхолдеры обращаются с вопросом: насколько мы уверены в предсказаниях модели? Ваша задача оценить надежность её предсказаний для данных в будущем.
#tree_based_models #sql #stats #time_series #etl
ЭМБЕДДИНГИ ТОВАРОВ
ML-команде маркетплейса потребовались векторные представления товаров, чтобы находить похожие товары. Постройте эмбеддинги товаров на основе паттернов поведения покупателей, используя методы коллаборативной фильтрации.
#matrix_factorization #sql #embeddings #recsys #knn #matching
ПАРАЛЛЕЛЬНАЯ ОБРАБОТКА ДАННЫХ
Ваш коллега занимается обработкой естественного языка. Однако алгоритм в текущей реализации работает медленно. Вооружившись новыми знаниями о параллельных вычислениях, любезно согласились ему помочь.
#optimization #python
UPLIFT-ДЕРЕВО
Отдел маркетинга запускает SMS-рассылки, чтобы привлечь внимание клиентов компании. Вам предстоит оценить их эффективность, решая задачу Uplift моделирования. Вы поймете как работать с этой задачей изнутри, написав свою версию uplift-дерева с нуля.
#oop #python #tree_based_models #metrics #math
На симуляторе вы получите доступ к инфраструктуре и задачам разного уровня, которые подготовили ML-инженеры с опытом работы в ритейле, e-commerce и BigTech-компаниях.
Здесь вас ждёт практика на задачах, максимально приближенных к реальным, и в окружении, максимально похожем на рабочее. Вы сможете начать с комфортного для вас уровня сложности и повышать его по мере развития ваших навыков. Закрепив знания на кейсах из индустрии, вы подготовите себя к решению аналогичных задач на работе.