HIVE: Hadoop SQL Hive администратор: Курсы

. Рассматриваются методы доступа к данным с использованием HiveQL, загрузка и выгрузка данных в Hive, HDFS, реляционные БД  и NoSQL, организация и оптимизация хранения данных с использованием Hive на HDFS, вопросы интеграции с другими инструментами экосистемы Hadoop.  Практические занятия...
IT: Для программистов и IT-специалистовIT: Для программистов и IT-специалистов / Информационные системы и технологии
Коммерсант логоКоммерсант
8 июня 2022
8 часов
Онлайн
от 20 000 ₽

Анонс программы

. Рассматриваются методы доступа к данным с использованием HiveQL, загрузка и выгрузка данных в Hive, HDFS, реляционные БД и NoSQL, организация и оптимизация хранения данных с использованием Hive на HDFS, вопросы интеграции с другими инструментами экосистемы Hadoop. Практические занятия выполняются в AWS и локальной кластерной системе с использованием дистрибутивов Cloudera Hadoop, HortonWorks, Arenadata.

Целевая аудитория

Cпециалисты SQL имеющие и желающие применить опыт работы с реляционными базами данных для организации хранения, настройке импорта и экспорта данных с использованием Apache Hive в кластере Hadoop. Для администраторов и разработчиков для Apache Hive.

Преподаватель

Михаил Королев

Описание Программы

1. Основные концепции Apache Hive

  • Архитектура Hive.
  • Инструменты администирования и исполнения запросов: beeline/Hive shell & HUE Query Editor.
  • Схема чтения и записи в Hive.
  • Структура и формат хранения файлов HIVE.
  • Синтаксис HiveQL. Hive DDL и DML операции.

2. Импорт и экспорт в Apache Hive

  • Загрузка данных в таблицы Hive.
  • Внешние и управляемые таблицы в HiveQL.
  • Оптимизации производительности с использование Partition, Buckets.
  • Импорт/экспорт данных БД.
  • Форматы хранения данных и применение компрессии.

3. Реализация JOIN в Hive

  • Map JOIN.
  • Comon JOIN.
  • Skewed JOIN.
  • Collocated JOIN.

4. Advanced HiveQL и Hadoop SQL

  • Интеграция Hive с Pig, Impala, Hbase, Spark, Sqoop.
  • Thrift сервер
  • User Defined Functions
  • Hive на Spark.
  • Hive на Tez

5.Сценарии применения Hive

Курс содержит практические лабораторные работы на кластере в Amazon Web Services по настройке партиционирования больших данных на файловой системе HDFS, оптимизация исполнения запросов и интеграция с существующими решениями Cloudera Impala, HBase , Spark SQL и Sqoop.

Соотношение теории к практике 40/60

Записаться на курс
HIVE: Hadoop SQL Hive администратор: Курсы
20 000
Заполните контактные данные
Оставьте заявку, чтобы забронировать себе место.
Наш менеджер свяжется с вами и ответит на любые ваши вопросы.
8 июня 2022
8 часов
Онлайн
от 20 000 ₽