Data Science: Курсы

Data Science (наука о данных)  – один из самых мощных инструментов анализа, который позволяет из самых неочевидных чисел сложить новую картину мира. Сейчас под этим термином подразумевают методы работы с данными ("большими данными", или Big Data), позволяющими распределенно обрабатывать...
IT: Для программистов и IT-специалистовIT: Для программистов и IT-специалистов / Информационные системы и технологии
IT-Академия Алексея Сухорукова логоIT-Академия Алексея Сухорукова
Открытый набор
60 часов
Новосибирск
IT-Академия Алексея Сухорукова
от 27 000 ₽

Анонс программы

Data Science (наука о данных) – один из самых мощных инструментов анализа, который позволяет из самых неочевидных чисел сложить новую картину мира. Сейчас под этим термином подразумевают методы работы с данными ("большими данными", или Big Data), позволяющими распределенно обрабатывать информацию. На нашем курсе по Data Science вы научитесь анализировать на огромные цифры и видеть в них закономерности, делать правильные выводы из статистических данных, освоите новые методы обработки информации и сможете применить полученные знания на практике.

Целевая аудитория

Для тех, кто: хочет освоить новую профессию аналитика данных (Data Scientist); планирует освоить новые инструменты анализа данных в рамках текущей работы; слышал о Big Data, но боялся спросить и заинтересован в более глубоком погружении в эту сферу; любит анализировать, искать причины, следствия и делать выводы.

Преподаватель

Евгений Сальский - Аналитик, занимается разработкой и сопровождением системы кредитного скоринга. Из технологий владеет - Excel, Power Pivot, SQL Server, Python (XGBoost, Flask + стандартные библиотеки). Считает, что деятельность преподавателя - интересна и она увлекает его больше всего. Говорит, что обучая других, сам повышает свою компетентность в преподаваемом предмете. Знает, как применить математические методы и Data Science, чтобы посмотреть на данные по-новому.

Описание Программы

  1. Общий инструментарий SQL, Python, Pandas: Познакомимся с самыми основами инструментария, а также узнает общий уровень подготовки группы.
  2. Линейная регрессия: Задачи регрессии и классификации. Метрики качества регрессии MSE, MAE, критерии выбора метрики. Линейная регрессия.
  3. Переобучение: Переобучение, способы борьбы с ним.
  4. Категориальные признаки: Работа с категориальными признаками: label encoding, one hot encoding, average encoding.
  5. Регуляризация: Регуляризация на примере линейной регрессии. Ridge, Lasso. Bias vs variance.
  6. Задача классификации: Логистическая регрессия. Метрики качества классификации: accuracy, precision, recall, roc auc, gini.
  7. Деревья, ансамбли деревьев: Decision Tree. Методы комбинирования алгоритмов: bagging, boosting. Случайный лес, градиентный бустинг.
  8. Задачи снижения размерности, кластеризации: Метод главных компонент, PCA. EM-алгоритмы. K-Means.
  9. Нейронные сети: Основы нейронных сетей. Их "настройка", подбор параметров, борьба с переобучением. Решения задач распознавания изображений.
  10. Ограничения машинного обучения: Области применимости пройденных алгоритмов.

Data Scientist — это специалист по обработке, анализу и хранению больших массивов данных, которые называют "Big Data". Его главная задача — извлекать необходимую информацию из разнообразных источников, используя информационные потоки в режиме реального времени и устанавливать скрытые закономерности в массивах данных, статистически анализировать их для принятия грамотных бизнес-решений.

Эти технологии востребованы в компаниях различного профиля: телеком, финтех, ритейл, e-commerce. Среди них и крупнейшие российские компании, такие как Сбербанк, Альфа Банк, Mail.ru.

На основании больших массивов информации компании выстраивают маркетинговые стратегии и прогнозируют глобальные изменения на рынке и в мире. Специалисты по сбору и анализу больших данных – пока штучный товар, а популярность этой профессии все больше набирает обороты.

Требования:

Для успешного прохождения курса вы должны иметь базовый уровень программирования на любом языке. Например, уметь написать функцию, которая считает сумму квадратов первых n натуральных чисел.

Преимущества курса:

  1. Вы получите редкую, востребованную и одну из самых высокооплачиваемых профессий в мире
  2. Освоите эффективные инструменты анализа данных
  3. Сможете применить знания в текущем проекте или на на практике в рамках курса
  4. Получите отличные перспективы трудоустройства

Что получите по итогам курса:

  1. Практические и теоретические знания о Big Data и Data Science
  2. Освоите новые аналитические инструменты
  3. Научитесь анализировать большие массивы информации
  4. Получите рекомендации по трудоустройству
Записаться на курс
Data Science: Курсы
27 000
Заполните контактные данные
Оставьте заявку, чтобы забронировать себе место.
Наш менеджер свяжется с вами и ответит на любые ваши вопросы.
Открытый набор
60 часов
Новосибирск
IT-Академия Алексея Сухорукова
от 27 000 ₽
Как добраться?
Новосибирск, IT-Академия Алексея Сухорукова