О курсе
На курсе, последовательно пройдем все этапы работы с данными: от видов задач и их постановки до работы с моделями машинного обучения для минимизации предсказательной ошибки. Дополнительно рассмотрим фундаментальные основы построения моделей машинного обучения, базовые метрики и наиболее простые модели — линейную и логистическую регрессии.
Также, рассмотрим базовые линейные модели и все практические аспекты применения линейной регрессии для предсказания числовых показателей энергопотребления ASHRAE.
Разберем метрики и модели классификации, а затем отработаем прикладные подходы к классификации данных с помощью моделей и ансамблей машинного обучения для страхового скоринга Prudential.
Разберем сегментацию и классификацию изображений облаков с помощью сверточных, пирамидальных, остаточных и полносвязных нейронных сетей.
Содержание курса
Часть 1. Процесс машинного обучения
-
Задачи машинного обучения
-
Задачи машинного обучения
-
Модель и процесс машинного обучения
-
Что такое ETL
-
Процесс машинного обучения
-
Что такое EDA
-
Подготовка данных
-
Подготовка данных
-
Разбиение выборки
-
Оптимизация гиперпараметров
-
Латинский квадрат (гиперкуб)
-
Оптимизация гиперпараметров через Парзеновские деревья
-
Недообучение и переобучение
-
Смещение, разброс и ошибка данных
-
Обучение модели
-
Использование HDF