Машинное обучение: регрессия и предсказание данных на Python

Выигрываем соревнование на Kaggle по предсказанию данных с ансамблем линейной регрессии
Udemy логоUdemy
Открытый набор
Онлайн
от 1 290 ₽

Чему вы научитесь

  • Процесс ETL: загрузка, очистка, объединение данных
  • Построение и оценка качества модели линейной регрессии
  • EDA: исследовательский анализ данных
  • Обогащение данных для извлечение смысла
  • Оптимизация потребления памяти набором данных
  • Иерархия моделей линейной регрессии
  • Ансамбль моделей линейной регрессии
  • Экспорт и импорт данных в CSV и HDF5
  • Участие в соревнование Kaggle

Требования

  • Продвинутый Python
  • Основы математической статистики

Описание

Мы рассмотрим все теоретические и практические аспекты применения линейной регрессии для предсказания числовых показателей энергопотребления ASHRAE в соревновании на Kaggle вплоть до формирования конечного результата.

Курс разбит на 2 части. В первой части мы последовательно пройдем все этапы работы с данными: от видов задач и их постановки до работы с моделями машинного обучения для минимизации предсказательной ошибки. Дополнительно рассмотрим фундаментальные основы построения моделей машинного обучения, базовые метрики и наиболее простые модели - линейную, полиномиальную и линеаризуемую регрессии.

Во второй части разберем на практикуме:

  • Особенности процесса анализа данных (ETL): загрузка, очистка, объединение наборов данных с pandas.

  • Проведение исследовательского анализа данных для поиска зависимостей: EDA.

  • Использование sklearn для линейной регрессии.

  • Интерполяция и экстраполяция данных.

  • Расчет метрики качества RMSLE для моделей линейной регрессии.

  • Оптимизация линейной регрессии: выбор наилучших параметров и гиперпараметров.

  • Оптимизация потребления памяти при работе с большими данными.

  • Запасные модели линейной регрессии.

  • Ансамбли линейной регрессии для уточнения предсказания.

  • Экспорт и импорт данных, включая промежуточные.

  • Выгрузка результата для соревнования на Kaggle.

Для кого этот курс

  • Аналитики Python, изучающие машинное обучение
  • Программисты больших данных
  • Исследователи больших данных
Программа
Часть 1. Процесс машинного обучения
Линейные модели
Часть 2. Практикум: Предсказание энергопотребления зданий
Практикум: Оптимизация памяти и обогащение данных
Модели линейной регрессии
Практикум: Конкурентные модели регрессии
Ансамбли машинного обучения
Практикум: Ансамбль линейной регрессии
Записаться на курс
Текущая цена
1 290
9 990
Заполните контактные данные
Оставьте заявку, чтобы забронировать себе место.
Наш менеджер свяжется с вами и ответит на любые ваши вопросы.
Открытый набор
Онлайн
от 1 290 ₽