Звезды и С - Главная Звезды и С - Citrix Звезды и С - Microsoft Звезды и С - О нас

Спец. предложения|Обучение|Вебинары|Сертификация|Тестирование|О нас|Работа с сайтом|Новости|Поиск
Обучение

Специальные предложения
Software Assurance - Бесплатные курсы обучения по ваучерам
CITRIX
MICROSOFT
Авторские курсы Microsoft
Microsoft Windows Server 2012 R2 / 2016
Microsoft Windows 10 / 8.1
Облачные технологии: Microsoft Windows Azure, Private Cloud, Office 365
Microsoft Exchange Server 2013 / 2016
Microsoft System Center
Microsoft Lync Server 2013 / Skype for business 2015
Microsoft SQL Server 2014 / 2016
Microsoft SharePoint 2013 / 2016
Microsoft Visual Studio 2013 / 2016
Microsoft On-Demand
Расписание курсов Microsoft и Citrix в графическом формате
Корпоративное обучение пользователей Microsoft Office
Более ранние версии программных продуктов Microsoft
Cisco, VMware, Red Hat, ITIL, ets
Вечернее обучение
Условия обучения

Курс M20775: Обработка Данных с Microsoft HDInsight

Цена для физических лиц, р.: 29900
Цена для юридических лиц, р.: 30900
Цена вебинара для физических лиц, р.: 28900
Цена вебинара для юридических лиц, р.: 28900

Продолжительность курса (дней): 5

Даты (день):

Даты (вечер):

Курс готовит к тестам:

Цель: Предоставить слушателям знания и навыки, необходимые для работы с массивами больших данных, планирования и внедрения рабочих потоков с помощью HDInsight.

Необходимая подготовка:

Предварительный тест:

Результат:

План курса:

20775A

Модуль 1: Начало работы с HDInsight

  • Большие данные
  • Hadoop
  • MapReduce
  • HDInsight
  • Лабораторная работа: Запросы к большим данным
    • Запросы к данным с Hive
    • Запросы к данным с Excel

Модуль 2: Развертывание кластеров HDInsight

  • Типы кластеров HDInsight
  • Управление кластерами HDInsight
  • Управление кластерами HDInsight с помощью PowerShell
  • Лабораторная работа: Управление кластерами HDInsight в Azure
    • Создать кластер Hadoop в HDInsight
    • Настроить HDInsight с помощью скрипта
    • Настроить HDInsight с помощью Bootstrap
    • Удалить кластер HDInsight

Модуль 3: Авторизация пользователей для доступа к ресурсам

  • Недоменные кластеры
  • Настройка кластера HDInsight, подключенного к домену
  • Управление подключенным к домену кластером HDInsight
  • Лабораторная работа: Авторизация пользователей для доступа к ресурсам
    • Настройка кластера HDInsight, подключенного к домену
    • Настроить политики Hive

Модуль 4: Загрузка данных в HDInsight

  • Хранилище HDInsigh
  • Средства загрузки данных
  • Производительность и надёжность
  • Лабораторная работа: Загрузка данных в HDInsight
    • Загрузка данных с помощью Sqoop
    • С помощью загрузка данных в AZcopy
    • Загрузка данных с помощью ADLcopy
    • Использовать HDInsight для сжатия данных

Модуль 5: Поиск и устранение неисправностей в HDInsight

  • Анализ журналов
  • Журналы YARN
  • Дампы кучи (Heap)
  • Operations management suite
  • Лабораторная работа: Поиск и устранение неисправностей в HDInsight
    • Анализ журналов HDInsight
    • Анализ журналов YARN
    • Мониторинг ресурсов с Operations management suite

Модуль 6: Внедрение пакетных решений

  • Хранилище Apache Hive
  • Запросы с Hive и Pig
  • Подключение HDInsight
  • Лабораторная работа: Резервное копирование баз данных SQL Server
    • Загрузка данных в таблицу Hive
    • Запрос данных в Hive и Pig

Модуль 7: Проектирование пакетных решений ETL для больших данных с помощью Spark

  • Что такое Spark?
  • ETL и Spark
  • Производительность Spark
  • Лабораторная работа: Проектирование пакетных решений ETL для больших данных с помощью Spark
    • Создание кластера HDInsight с доступом к хранилищу Data Lake
    • Использование кластера Spark в HDInsight для анализа данных в хранилище Data Lake
    • Анализ журналов сайта с помощью настраиваемой библиотеки кластера Apache Spark в HDInsight
    • Управление ресурсами кластера Apache Spark в Azure HDInsight

Модуль 8: Анализ данных со Spark SQL

  • Внедрение интерактивных запросов
  • Проведение исследовательского анализа данных
  • Лабораторная работа: Анализ данных со Spark SQL
    • Внедрение интерактивных запросов
    • Проведение исследовательского анализа данных

Модуль 9: Анализ данных с помощью Hive и Phoenix

  • Внедрение интерактивных запросов для больших данных с помощью Hive
  • Проведение исследовательского анализа данных с помощью Hive
  • Выполнение интерактивной обработки данных с помощью Apache Phoenix
  • Лабораторная работа: Анализ данных с помощью Hive и Phoenix
    • Внедрение интерактивных запросов для больших данных с помощью Hive
    • Проведение исследовательского анализа данных с помощью Hive
    • Выполнение интерактивной обработки данных с помощью Apache Phoenix

Модуль 10: Потоковая аналитика

  • Потоковая аналитика
  • Обработка потоковых данных из потоковой аналитики
  • Управление задачами потоковой аналитики
  • Лабораторная работа: Внедрение потоковой аналитики
    • Обработка потоковых данных из потоковой аналитики
    • Управление задачами потоковой аналитики

Mодуль 11: Spark Streaming using the DStream API

  • Dstream
  • Создание приложений для обработки структурированных потоков в Spark
  • Стабильность и визуализация
  • Лабораторная работа: Использование DStream API для создания приложений Spark Streaming
    • Создание приложения Spark Streaming с помощью DStream API
    • Создание приложения для обработки структурированных потоков в Spark

Модуль 12: Разработка решений обработки больших данных в режиме реального времени с помощью Apache Storm

  • Долго хранимые данные
  • Потоковые данные в Storm
  • Создание топологии Storm
  • Настройка Apache Storm
  • Лабораторная работа: Разработка решений обработки больших данных в режиме реального времени с помощью Apache Storm
    • Потоковые данные в Storm
    • Создание топологии Storm

Модуль 13: Анализ данных с помощью Spark SQL

  • Внедрение интерактивных запросов
  • Проведение исследовательского анализа данных
  • Лабораторная работа: Анализ данных с помощью Spark SQL
    • Внедрение интерактивных запросов
    • Проведение исследовательского анализа данных


  Спец. предложения|Обучение|Вебинары|Сертификация|Тестирование|О нас|Работа с сайтом|Новости|Поиск

   Тел: +74953633686 email: info@stars-s.ru

   125040, Москва, Ленинградский проспект, д. 5, стр. 2, под. 5, офис "Звезды и С"

  © Учебный центр "Звезды и С", 1991-2019, Оферта