BIG DATA с нуля

Научитесь работать с «зоопарком» Hadoop, собирать и обрабатывать данные и размещать вычисления в облачных сервисах.
IT: Для программистов и IT-специалистов / Аналитика
Образовательная платформа Нетология логоОбразовательная платформа Нетология
Дата уточняется
6 недель
Онлайн
от 23 030 ₽
Зарегистрироваться
Целевая аудитория
Все, кто готов повышать свою грамотность в IT-технологиях

Аналитика BIG DATA с нуля

Научитесь работать с большими данными

Расширьте знания в аналитике

Перейдите на новый уровень в профессии

~120 000 ₽ средняя зарплата аналитика big data в Московском регионе (по данным hh.ru)

Big data — инструменты, подходы и методы обработки огромных объёмов данных. По сути это альтернатива традиционным системам обработки данных.

Если вам требуется общее расширение кругозора в теме технологий работы с данными и необходимость апгрейда на текущем месте работы, курс даст возможность расширить профессиональные навыки, работать с новыми задачами и быстро приносить результаты в проектах.

Зачем изучать Big Data

  • Up skill профессии
    Вас ждёт апгрейд навыков в аналитике данных и понимание, зачем и где нужна big data, новая траектория развития карьеры и более сложные рабочие проекты.
  • Расширение кругозора
    Вы расширите свой кругозор, освоите технологии для перехода на уровень middle и сможете быстрее выполнять свои рабочие задачи.
  • Переход в новую область
    Курс даёт ключевые технологии и навыки для старта погружения в самую горячую профессиональную область. Вы получите практику, достойную включения в резюме.

 

Что вы узнаете на курсе

Как собрать и управлять командой big data проекта
Освоите подход CRISP-DM: межотраслевой стандартный процесс для исследования данных. Определите компетенции и состав команды.
Как создать стратегию работы с большими данными
Определите, сколько данных вам нужно для нахождения инсайтов. Найдёте задачи под биг дату в своей компании.
Как улучшить результаты обработки данных
Поймёте, как и по каким правилам хранить данные. Сможете обосновывать влияние на сбор данных, мониторинг и отчётность.

Практика на курсе

8+ часов в неделю интенсивных уроков и практики с экспертами отрасли
 
9 изучаемых инструментов must-have для работы с большими данными
 
Домашние задания с проверкой и обратной связью от преподавателей курса
 
Лабораторная работа от загрузки данных до построения модели
 
Нетворкинг (работа в команде с экспертом) имитирует работу над проектом на удалёнке
 
Дипломный проект работающая модель классификации данных
Программа
Аналитика больших данных
Дипломная работа

Что вы получите в результате обучения

Аналитик больших данных

Реализованные проекты

  • Классификатор и оценка результатов его работы на отложенной (train_test_split) выборке
  • Коллаборативная фильтрация (прогнозы на основе данных) в MapReduce

Мои навыки

  • Сбор и подготовка данных для анализа
  • Понимание бизнес-требований заказчика и организация эффективной команды
  • Преобразование неструктурированных данных в простые для восприятия и ценные для бизнеса сведения
  • Построение моделей данных из разных неструктурированных источников: таблиц, сайтов и баз данных
  • Определение и выбор оптимальной архитектуры для Big Data проекта
  • Основы работы с Hadoop и MapReduce: фильтры, сортировки, поиск, группировки, определение мин-макс значений и частоты
  • Определение результатов обработки и инсайтов в данных и улучшение качества принятия решений на их основе

Инструменты, которые вы освоите

Hadoop MapReduceHadoop и MapReduce

Инструмент и фреймворк для вычисления распределённых задач с использованием большого количества компьютеров («ноды») в кластере.

NoSQL, MongoDBNoSQL, MongoDB
Нереляционные базы данных для работы с Big Data на примере MongoDB.

Apache SparkApache Spark

Фреймворк с открытым исходным кодом для реализации распределённой обработки неструктурированных и слабоструктурированных данных.

Google ColabGoogle Colab
Сервис, который позволяет запускать библиотеки Python «в облаке».

PySparkPySpark
Пакет распределённого управления данными и машинным обучением в Apache Spark.

PandasPandas

Продвинутая и быстроразвивающаяся библиотека для обработки и анализа данных в Python.

ExcelExcel
Программа для работы с электронными таблицами.

Как проходит обучение

Занятия
Вебинары дважды в неделю. Раз в три занятия - практика на отработку знаний.

Практика
После каждого занятия - тестирование или практическое домащнее задание с проверкой и обратной связью.

Сопровождение
Каждый студент может пообщаться с экспертами курса, получить помощь координаторов и наставников.

Трудоустройство
Центр развития карьеры поможет с составлением резюме, предложит вакансии и будет сопровождать на всех этапах поиска работы.

Что нужно знать и уметь для успешного обучения на программе

Не бояться осваивать базовые команды в Python / SQL

 

Развитие карьеры

Каждый выпускник получает помощь и поддержку Центра развития карьеры

  • Помощь в подготовке резюме и прохождении собеседования
  • Консультация с HR-специалистом по поиску работы и развитию карьеры
  • Возможность прохождения стажировки в проектах «Нетологии-групп»: в Фоксфорде, Нетологии, EdMarket
  • Регулярное информирование об открытых вакансиях в компаниях-партнёрах
  • Бесплатный доступ к подборке видеокурсов по поиску работы и soft skills для всех студентов
Записаться на курс
Аналитик Big Data
ПРИ ОПЛАТЕ ЧАСТЯМИ 2 325 ₽ / мес.
Вы можете вернуть 13% денег через налоговый вычет. Спросите об этом менеджера, когда запишетесь на курс
23 030