Yandex Cloud — надёжная инфраструктура и развитая экосистема для создания и совершенствования цифровых продуктов
Что будете изучать /?/
Основная цель курса — освоить сервис Yandex Data Processing, который позволяет разворачивать кластеры Apache Hadoop и Apache Spark в инфраструктуре Yandex Cloud
В частности, Hadoop предназначен для сбора, хранения и распределенной обработки сотен терабайт информации, которая поступает непрерывным потоком. Именно на его основе строятся объемные хранилища неструктурированной информации для последующей аналитики
Чему научитесь //
Создавать и удалять Hadoop-кластеры для экономии ресурсов и оптимизации затрат
Интегрировать Yandex Cloud с другими облачными сервисами
Обеспечивать безопасность кластеров
Выбирать оптимальные компоненты для создания кластеров
Настраивать виртуальные машины
Какие инструменты освоите:
Ключевые компоненты кластера Hadoop, обеспечивающие распределенное хранение и эффективное управление ресурсами
DFS и YARN
Платформа для обработки больших данных, поддерживающая обработку в памяти
Spark
Программная модель для обработки больших объемов данных
MapReduce
Фундаментальная структура данных в Spark для хранения данных в распределенной форме
RDD (Resilient Distributed Dataset)
После завершения обучения вы сможете самостоятельно работать с большими данными на базе Yandex Cloud и продолжать осваивать новые инструменты
Кому подойдёт обучение /?/
Отметьте энтузиазм сотрудников вкладом в их профессиональное развитие — адресат сможет выбрать любой курс или симулятор, а приобретенные навыки использовать в работе
Для тех, кто только начинает свой путь к карьере дата-инженера, или пока вообще не имеет представления о том, что такое инженерия данных
Бесплатный курс предназначен для новичков
Документы после выпуска//
> Упаковывайте полученный опыт в портфолио
> Получайте сертификаты на русском и английском языках
Эксперты курса >>
Антон Пилипенко
ETL Team lead в IPONWEB
Более 10 лет создаёт и развивает системы для работы с большими данными. На протяжении 6 лет занимается консалтингом и помогает разным продуктам решать задачи в области ML, анализа данных и проведения экспериментов
Пройдите бесплатный курс «Инженер данных в Yandex Cloud»