Экосистема Spark, Hadoop, Hive

Профессиональные онлайн курсы для разработчиков
IT: Для программистов и IT-специалистов
OTUS Онлайн-образование логоOTUS Онлайн-образование
Открытый набор
Онлайн
Зарегистрироваться

Что даст вам этот курс

Углубленный курс по самым мощным инструментам обработки больших данных.

Курс рассчитан на Data инженеров, желающих глубже изучить Spark, Hadoop, Hive

Вы изучите следующие основные темы:

- Hadoop (основные компоненты, дистрибутивы вендоров)
- Архитектура HDFS (HDFS, ZooKeeper)
- Архитектура YARN (YARN, MapReduce)
- Форматы данных (Parquet, Orc, Avro)
- Scala
- Spark
- Spark Streaming
- RDD/Dataframe/Dataset
- GraphX, GeoSpark
- Hive
- Мониторинг и CI/CD

Научитесь применять все это на практике и закрепите с помощью интересных и сложных домашних заданий и выпускного проекта.

После прохождения курса вы сможете:

- Писать распределенные приложения на Apache Spark
- Работать с данными в HDFS и потоками данных в Kafka
- Обрабатывать большие объемы данных
- Оптимизировать приложения на Apache Spark

Программа курса в разработке и будет расширяться. Пожалуйста, пройдите опрос, чтобы помочь нам сделать курс максимально интересным для вас.
Часто задаваемые вопросы
Можно ли начать обучение позже даты старта курса?
Да, можно. Доступ к материалам курса будет доступен в личном кабинете. Если вы будете сильно отставать от общей группы, то можно будет перевестись на следующий поток бесплатно.
Открытый набор
Онлайн
Зарегистрироваться