СТАРТ ПРОГРАММЫ
5 ОКТЯБРЯ 2022
ФОРМАТ ОБУЧЕНИЯ
ОНЛАЙН
Онлайн формат обучения инженеров данных
КОМУ ПОДОЙДЁТ
ДЛЯ JUNIOR/MIDDLE

Курс для junior и middle специалистов
ПОЭТАПНАЯ ОПЛАТА
НА 5 МЕСЯЦЕВ

Поэтапная оплата курса
ЕВГЕНИЙ ЕРМАКОВ
Инженерия данных от проектирования до нетривиальной обработки.

ИНЖЕНЕР ДАННЫХ.
ОБУЧЕНИЕ У НАС |

Преподаватель онлайн курса по обучению инженеров данных
Старт программы курса Инженер данных

НАУЧИТЕСЬ ПРАВИЛЬНО ГОТОВИТЬ ДАННЫЕ ЛЮБЫХ РАЗМЕРОВ И СЛОЖНОСТИ

Обучающие выборки для машинного обучения и красивые графики для отчётов не появляются сами собой: данные нужно собирать, хранить, валидировать и комбинировать между собой, быстро реагируя на изменения в их структуре.
Стандартный путь:
НАЧИНАЕШЬ РАБОТАТЬ С ДАННЫМИ
ПЫТАЕШЬСЯ СДЕЛАТЬ СИСТЕМНО И РАСШИРЯЕМО
ПОНИМАЕШЬ, ЧТО НЕ ХВАТАЕТ ЗНАНИЙ, ЧТОБЫ ОХВАТИТЬ ВСЮ АРХИТЕКТУРУ DWH ЦЕЛИКОМ
×
Для работы с данными недостаточно знать один инструмент — необходимо учитывать весь спектр взаимосвязей большого хранилища, понимать потребности заказчика и воспринимать данные как конечный продукт.
Сильный инженер данных за счёт широты знаний может выбрать правильный инструмент под любые задачи, охватить всю архитектуру DWH целиком и донести результат до потребителей данных.
Для эффективной работы с данными одного инструмента недостаточно — необходимо учитывать все взаимосвязи большого хранилища, понимать потребности заказчика и воспринимать данные как конечный продукт.
Сильный инженер данных за счёт широты знаний и понимания архитектуры DWH способен подобрать правильные инструменты под любые задачи и донести результат до потребителей данных.

ВАШЕ РЕЗЮМЕ == ЧЕРЕЗ 5 МЕСЯЦЕВ

- Работаю с реляционными базами данных, в том числе MPP, понимаю особенности работы распределенных систем на базе Greenplum

- Умею строить и автоматизировать ETL\ELT-пайплайны на базе Apache Airflow

- Имею опыт работы с большими данными в Hadoop и Spark, умею составлять сложные SQL запросы в Apache Hive

- Разбираюсь в архитектуре хранилищ данных (DWH), владею методами многомерного моделирования, якорного моделирования и Data Vault

- Имею практический опыт работы со Spark в Kubernetes, понимаю основные подходы к построению хранилищ данных в облаках

- Понимаю принципы работы и подготовки данных для BI-инструментов на базе Tableau

- Применяю ML-модели на больших данных, умею подготавливать данные для их обучения, понимаю подходы к версионированию датасетов с помощью Data Version Control

- Знаю основные подходы к управлению данными на базе DMBOK
ЖЕЛАЕМАЯ ЗАРПЛАТА ОТ
100 000 рублей
Инженер данных
ВИКТОР КУЗНЕЦОВ
- Работаю с реляционными базами данных, в том числе MPP, понимаю особенности работы распределенных систем на базе Greenplum
- Умею строить и автоматизировать ETL\ELT-пайплайны на базе Apache Airflow
- Имею опыт работы с большими данными в Hadoop и Spark, умею составлять сложные SQL запросы в Apache Hive
- Разбираюсь в архитектуре хранилищ данных (DWH), владею методами многомерного моделирования, якорного моделирования и Data Vault
- Имею практический опыт работы со Spark в Kubernetes, понимаю основные подходы к построению хранилищ данных в облаках
- Понимаю принципы работы и подготовки данных для BI-инструментов на базе Tableau
- Применяю ML-модели на больших данных, умею подготавливать данные для их обучения, понимаю подходы к версионированию датасетов с помощью Data Version Control
- Знаю основные подходы к управлению данными на базе DMBOK
Инженер данных
ВИКТОР КУЗНЕЦОВ
ЖЕЛАЕМАЯ ЗАРПЛАТА ОТ
100 000 рублей

КАК ПРОХОДИТ ОБУЧЕНИЕ

О курсе
Формат обучения
Системы для работы
Инфраструктура
Поддержка студентов
Поиск работы

ПОДРОБНЕЕ О КУРСЕ

Преподаватели расскажут о курсе и его содержании. Вы узнаете, в чём ценность каждого модуля и как полученные знания помогут в дальнейшей работе.

ФОРМАТ ОБУЧЕНИЯ

Обучение проходит в интенсивном формате по 3 занятия в неделю
Домашние задания выполняются на настоящей инфраструктуре
Все лекции и дополнительные материалы доступны на образовательной платформе и остаются у вас после окончания курса
На учёбу наши студенты тратят в среднем 10 часов в неделю

РАБОТАЙТЕ С ДАННЫМИ В ЛЮБЫХ СИСТЕМАХ

Изучайте архитектуру хранилищ данных и подходы к их проектированию
Сравнивайте на практике Big Data решения на базе Hadoop и реляционные MPP СУБД
Учитесь работать с облаками и автоматизировать ETL-процессы с помощью Airflow

ИСПОЛЬЗУЙТЕ НАШУ ИНФРАСТРУКТУРУ

— Работайте со всеми необходимыми инструментами на выделенном сервере
— Совершенствуйте навыки работы с Hadoop, Greenplum, PostgreSQL, Airflow, Spark, Hive и Kubernetes

ЗАДАВАЙТЕ ЛЮБЫЕ ВОПРОСЫ В ПОДДЕРЖКУ

— Обсуждайте задачи и проекты с экспертами рынка
— Вашими менторами будут инженеры данных из ведущих российских компаний
— Консультируйтесь с HR специалистами
— Учитесь правильно презентовать свои навыки
— Откликайтесь на вакансии компаний-партнёров
— Проходите собеседования и устраивайтесь на работу

УСТРАИВАЙТЕСЬ НА РАБОТУ

РАБОТАЙТЕ С ДАННЫМИ В ЛЮБЫХ СИСТЕМАХ
— Изучайте архитектуру хранилищ данных и подходы к их проектированию
— Сравнивайте на практике Big Data решения на базе Hadoop и реляционные MPP СУБД
— Учитесь работать с облаками и автоматизировать ETL-процессы с помощью Airflow
ИСПОЛЬЗУЙТЕ НАШУ ИНФРАСТРУКТУРУ
— Работайте со всеми необходимыми инструментами на выделенном сервере
— Совершенствуйте навыки работы с Hadoop, Greenplum, PostgreSQL, Airflow, Spark, Hive и Kubernetes
ЗАДАВАЙТЕ ЛЮБЫЕ ВОПРОСЫ В ПОДДЕРЖКУ
—Обсуждайте задачи и проекты с экспертами рынка
— Вашими менторами будут инженеры данных из ведущих российских компаний
108
Уже работаете с хранилищами данных, но хотите систематизировать знания и глубже погрузиться в актуальные технологии.
ИНЖЕНЕР ДАННЫХ
Постоянно взаимодействуете с базами данных, но хотите лучше разобраться в ETL-процессах и выйти на качественно новый уровень в аналитике.
АНАЛИТИК ДАННЫХ

ДЛЯ КОГО ЭТОТ КУРС:

BI-РАЗРАБОТЧИК
Занимаетесь развитием систем бизнес-аналитики, хотите освоить архитектуру современных хранилищ данных и научиться их проектировать.
BACKEND-РАЗРАБОТЧИК
Имеете опыт бэкенд-разработки и хотите применить его для решения задач, связанных с хранением и обработкой больших данных.

РЕКОМЕНДУЕМЫЙ УРОВЕНЬ:

PYTHON

> Знание синтаксиса языка

> Понимание базовых структур данных (список, словарь, кортеж)

> Владение основами ООП (класс, объект)
> Знание базового синтаксиса (SELECT, WHERE, GROUP BY, HAVING)

> Умение составлять подзапросы и делать все виды JOIN

> Навык работы с оконными функциями

SQL

> Умение работать с командной строкой

> Знание базовых команд Linux

> Опыт работы с Git

ИНФРА-СТРУКТУРА

ИНФРАСТРУКТУРА

Зарегистрируйтесь на нашей образовательной платформе и пройдите тестирование →
не уверены хватает ли вам знаний для курса?

ЕСЛИ ЭТОТ КУРС КАЖЕТСЯ ВАМ СЛОЖНЫМ

НА КУРСЕ ИСПОЛЬЗУЕМ >>>

ПРОГРАММА КУРСА ://

1. РЕЛЯЦИОННЫЕ И MPP СУБД
Начнём погружение в инженерию данных со знакомства с реляционными и MPP базами данных. Рассмотрим их архитектуру, обсудим популярные решения и узнаем, в каких случаях MPP СУБД оказываются лучше традиционных. Научимся готовить PostgreSQL и MPP базы данных на примере Greenplum.
2. АВТОМАТИЗАЦИЯ ETL-ПРОЦЕССОВ
ETL — ключевой процесс в управлении хранилищами данных. Рассмотрим принципы и основные этапы его построения. Познакомимся с популярным инструментом Airflow, подробно разберём его основные компоненты и научимся с его помощью автоматизировать ETL-пайплайны.
3. BIG DATA
Познакомимся с механизмами распределённого хранения больших данных на базе Hadoop, разберём основные паттерны реализации их распределённой обработки. Рассмотрим вопросы отказоустойчивости и восстановления после сбоев. Поговорим о потоковой обработке данных, методах и средствах мониторинга и профилирования заданий Spark.
4. ПРОЕКТИРОВАНИЕ DWH
Data Warehouse — централизованное хранилище данных из разных источников. Познакомимся с его верхнеуровневой логической архитектурой, рассмотрим её основные компоненты и разберём на практике разные подходы к проектированию детального слоя DWH.
5. ОБЛАЧНОЕ ХРАНИЛИЩЕ
Рассмотрим облачные решения и инструменты для построения DWH и Data Lake. Познакомимся с Kubernetes и научимся применять его для работы с данными. Поработаем с облаком на практике, рассмотрим процесс установки и настройки JupyterHub и Spark в Kubernetes.
6. ВИЗУАЛИЗАЦИЯ ДАННЫХ
Рассмотрим основные принципы работы с данными с точки зрения их визуализации и научимся смотреть на данные глазами их потребителя. Познакомимся с Tableau — гибким и мощным BI-инструментом. Узнаем, как он взаимодействует с базами данных, и построим с его помощью интерактивный дашборд для мониторинга DWH платформы.
7. BIG ML
Познакомимся с теорией распределённого машинного обучения. Научимся работать с популярным модулем Spark ML и рассмотрим подходы к обучению и применению моделей на больших данных.
8. УПРАВЛЕНИЕ МОДЕЛЯМИ
В работе инженеры часто сталкиваются с подготовкой данных для обучения ML-моделей. Рассмотрим инструменты для построения ML-пайплайнов, версионирования датасетов, организации учёта и трекинга моделей.
9. УПРАВЛЕНИЕ ДАННЫМИ
На практике часто приходится иметь дело с разными данными и огромным числом интеграций и процессов, выполняющих над ними те или иные преобразования. Познакомимся с популярными подходами к управлению данными, обсудим инструменты для контроля качества данных и отслеживания их происхождения.
1. РЕЛЯЦИОННЫЕ И MPP СУБД
Начнём погружение в инженерию данных со знакомства с реляционными и MPP базами данных. Рассмотрим их архитектуру, обсудим популярные решения и узнаем, в каких случаях MPP СУБД оказываются лучше традиционных. Научимся готовить PostgreSQL и MPP базы данных на примере Greenplum.
2. АВТОМАТИЗАЦИЯ ETL-ПРОЦЕССОВ
ETL — ключевой процесс в управлении хранилищами данных. Рассмотрим принципы и основные этапы его построения. Познакомимся с популярным инструментом Airflow, подробно разберём его основные компоненты и научимся с его помощью автоматизировать ETL-пайплайны.
3. BIG DATA
Познакомимся с механизмами распределённого хранения больших данных на базе Hadoop, разберём основные паттерны реализации их распределённой обработки. Рассмотрим вопросы отказоустойчивости и восстановления после сбоев. Поговорим о потоковой обработке данных, методах и средствах мониторинга и профилирования заданий Spark.
4. ПРОЕКТИРОВАНИЕ DWH
Data Warehouse — централизованное хранилище данных из разных источников. Познакомимся с его верхнеуровневой логической архитектурой, рассмотрим её основные компоненты и разберём на практике разные подходы к проектированию детального слоя DWH.
5. ОБЛАЧНОЕ ХРАНИЛИЩЕ
Рассмотрим облачные решения и инструменты для построения DWH и Data Lake. Познакомимся с Kubernetes и научимся применять его для работы с данными. Поработаем с облаком на практике, рассмотрим процесс установки и настройки JupyterHub и Spark в Kubernetes.
6. ВИЗУАЛИЗАЦИЯ ДАННЫХ
Рассмотрим основные принципы работы с данными с точки зрения их визуализации и научимся смотреть на данные глазами их потребителя. Познакомимся с Tableau — гибким и мощным BI-инструментом. Узнаем, как он взаимодействует с базами данных, и построим с его помощью интерактивный дашборд для мониторинга DWH платформы.
7. BIG ML
Познакомимся с теорией распределённого машинного обучения. Научимся работать с популярным модулем Spark ML и рассмотрим подходы к обучению и применению моделей на больших данных.
8. УПРАВЛЕНИЕ МОДЕЛЯМИ
В работе инженеры часто сталкиваются с подготовкой данных для обучения ML-моделей. Рассмотрим инструменты для построения ML-пайплайнов, версионирования датасетов, организации учёта и трекинга моделей.
9. УПРАВЛЕНИЕ ДАННЫМИ
На практике часто приходится иметь дело с разными данными и огромным числом интеграций и процессов, выполняющих над ними те или иные преобразования. Познакомимся с популярными подходами к управлению данными, обсудим инструменты для контроля качества данных и отслеживания их происхождения.
Руководитель DWH в Яндекс Go, куратор курса
ЕВГЕНИЙ ЕРМАКОВ
Преподаватель курса "Инженер данных" Евгений Ермаков
Залог успешной работы — данные, которые нужно собирать, хранить и комбинировать между собой, быстро реагируя на изменения в их структуре.

Наш курс даст универсальные знания в области инженерии данных, которые вы сможете применить для проектирования систем хранения и обработки данных, автоматизации их работы и экономии ресурсов кластера.

ПРОГРАММА ТРУДОУСТРОЙСТВА>>>

ТРУДОУСТРОЙСТВО
Вместе достигнем желаемой цели
ПОДГОТОВКА
Поможем составить сильное резюме

РЕКОМЕНДАЦИИ
Расскажем о вас компаниям-партнёрам
СОБЕСЕДОВАНИЕ
Организуем интервью с работодателем
90%
Трудоустроенных выпускников
Рассчитано на основе данных о количестве выпускников, обратившихся за помощью в поиске работы и трудоустроенных за 3 месяца. Как мы это считали
Будем поддерживать вас в течение всего процесса трудоустройства.
Наша цель — довести вас до оффера.
ПОДРОБНЕЕ
САМОПРЕЗЕНТАЦИЯ
Чтобы получить сильное резюме и навыки самопрезентации вы пройдете:
- Лекции и вебинары по составлению резюме от HR-эксперта Яндекс
- Тест-драйв собеседования
- Консультацию, на которой определите стратегию поиска работы и пропишете карьерные цели
79
ОТСЛЕЖИВАНИЕ ПРОГРЕССА
Свой прогресс в трудоустройстве вы будете отслеживать с помощью специальных дневников. Работать над ошибками мы будем вместе с вами: мы подскажем, что нужно подтянуть и в каком направлении лучше мыслить, чтобы эффективнее справляться с задачами на собеседованиях.
90
РАБОТА МЕЧТЫ
Наша цель — довести вас до оффера. Среднее время трудоустройства с сопровождением составляет 1-1,5 месяца.
108
САМОПРЕЗЕНТАЦИЯ
Чтобы получить сильное резюме и навыки самопрезентации вы пройдете:
- Лекции и вебинары по составлению резюме от HR-эксперта Яндекс
- Тест-драйв собеседования
- Консультацию, на которой определите стратегию поиска работы и пропишете карьерные цели
ВЫБОР ВАКАНСИЙ
После подготовки всех необходимых материалов вы получите доступ к Telegram-каналам, где ежедневно обновляются вакансии от наших партнёров. На заинтересовавшие вас вакансии HR отправят ваше резюме с рекомендациями и организуют собеседование.
ОТСЛЕЖИВАНИЕ ПРОГРЕССА
Свой прогресс в трудоустройстве вы будете отслеживать с помощью специальных дневников. Работать над ошибками мы будем вместе с вами: мы подскажем, что нужно подтянуть и в каком направлении лучше мыслить, чтобы эффективнее справляться с задачами на собеседованиях.
РАБОТА МЕЧТЫ
Наша цель — довести вас до оффера. Среднее время трудоустройства с сопровождением составляет 1-1,5 месяца.

ВЫПУСКНИКИ НАШЕЙ ШКОЛЫ РАБОТАЮТ >>>

У НАС ПРЕПОДАЮТ:

УЧИТЕСЬ У >ЛУЧШИХ>

ЕВГЕНИЙ ЕРМАКОВ
Более 10 лет опыта работы с данными. Архитектор DWH и систем анализа данных в VK и Яндекс.Такси. Кандидат технических наук, автор более 10 работ в области анализа данных. Соавтор монографии по теории и практике анализа параллельных баз данных.
Руководитель DWH в Яндекс Go
Модули >>>
Преподаватель курса Евгений Ермаков
ДИНА САФИНА
Соосновательница русскоязычного сообщества Airflow. Более 6 лет работала в VK и собирала игровые данные в Data Lake на Hadoop с помощью Airflow.
Руководитель группы дата-инженеров в Ozon
Модули >>>
ETL
Преподаватель курса и ведущий разработчик Дина Сафина
ПОДРОБНЕЕ
АНТОН ПИЛИПЕНКО
Более 8 лет создаёт и развивает системы для работы с большими данными. На протяжении 5 лет занимается консалтингом и помогает разным продуктам решать задачи в области ML, анализа данных и проведения экспериментов.
Руководитель Big Data в СберМаркет
Модули >>>
Преподаватель курса Инженер данных Антон Пилипенко
ВАЛЕРИЙ СОКОЛОВ
Аналитик с опытом работы 17 лет. Последние 3 года развивает инфраструктуру DWH в Яндекс.Такси. Ранее работал с базами данных в Cбербанке и BSGV.
Старший администратор баз данных в Mars
Модули >>>
Преподаватель курса Инженер данных Валерий Соколов
АЛЕКСАНДР ВОЛЫНСКИЙ
Специалист по Big Data и AI, занимается внедрением сложных кастомных проектов. Участвовал в создании хранилищ данных в компаниях Платформа ОФД, X5 и VK.
Технический менеджер продукта ML Platform в VK Cloud Solutions
Модули >>>
Преподаватель курса Инженер данных Александр Волынский
Преподаватель курса Инженер данных Роман Бунин
РОМАН БУНИН
Руководитель группы развития BI-систем в Яндекс Go
Более 6 лет занимается визуализацией данных. Руководил разработкой SaaS BI сервиса в качестве операционного директора. Сертифицированный Tableau специалист, кандидат технических наук, автор блога и Telegram-канала о визуализации данных Reveal the Data.
Модули >>>
Преподаватель курса Инженер данных Александр Савченко
АЛЕКСАНДР САВЧЕНКО
Руководитель R&D в Сбер
Более 8 лет занимается распределёнными системами для обработки больших данных, облачными решениями и внедрением алгоритмов машинного обучения. Участвовал в разработке платформ для работы с данными в компаниях Amazon, Сбер, Дом.рф, Novartis, Kohl's.
Модули >>>

ОТЗЫВЫ ВЫПУСКНИКОВ /

скоро следующее видео
Я остался доволен курсом: и технологии новые освоил (причём в прикладном, а не обзорном формате), и пробелы в фундаментальном понимании закрыл. И самое главное — загорелся идеей развернуть своё дата-решение в облаке. В результате я взял сервер на DigitalOcean и сделал там своё рабочее пространство: прямо по всем рекомендациям с уроков развернул в нём кластеры, Jupyter, Superset для визуализации, Airflow для автоматизации, а также Spark и ClickHouse. Остался весьма доволен.

Сейчас я перестраиваю свой пет-проект и переношу на этот сервер — с построением процессов, как разбирали на курсе. У меня, конечно, не BigData, всё куда прозаичнее и меньше, но зато теперь есть реальный опыт ;)
Ярослав
Я работал с машинным обучением и аналитикой, делал скоринговые и рекомендательные модели. На прошлом месте работы я руководил командой, в которой были инженеры данных. И я хотел подтянуть свои компетенции. Сейчас я поменял работу из-за переезда. Компания меньше, поэтому где-то я делаю аналитику, где-то выполняю функции инженера, а где-то разрабатываю.

Сначала я проходил курсы на Stepik, оттуда узнал про курс Hard ML в Karpov.Courses. К собственным конспектам Hard ML регулярно возвращаюсь, чтобы лучше решать задачи по работе. Сомнений при покупке курса по инженерии данных не было, хотя после курса Hard ML ожидания были высокие. По результатам: в целом всё то, что хотел узнать, я узнал. Теоретические видео были интересными и содержательными. Понравился блок по облачным хранилищам, сразу есть возможность развернуть что-то своё. Бывает, пересматриваю блок по ETL — знания оттуда помогают решать рабочие задачи. Немного не хватило практики. Хотелось бы больше заданий на написание кода. С точки зрения формата — хорошо, что все лекции записаны заранее. Я думаю, что это правильно — преподаватели не устают и не выдыхаются. Приятно, что вокруг курсов сформировалось комьюнити, и в чатах помогают как студенты, так и преподаватели.
Николай
Я остался доволен курсом: и технологии новые освоил (причём в прикладном, а не обзорном формате), и пробелы в фундаментальном понимании закрыл. И самое главное — загорелся идеей развернуть своё дата-решение в облаке. В результате я взял сервер на DigitalOcean и сделал там своё рабочее пространство: прямо по всем рекомендациям с уроков развернул в нём кластеры, Jupyter, Superset для визуализации, Airflow для автоматизации, а также Spark и ClickHouse. Остался весьма доволен.

Сейчас я перестраиваю свой пет-проект и переношу на этот сервер — с построением процессов, как разбирали на курсе. У меня, конечно, не BigData, всё куда прозаичнее и меньше, но зато теперь есть реальный опыт ;)
Ярослав
Я работал с машинным обучением и аналитикой, делал скоринговые и рекомендательные модели. На прошлом месте работы я руководил командой, в которой были инженеры данных. И я хотел подтянуть свои компетенции. Сейчас я поменял работу из-за переезда. Компания меньше, поэтому где-то я делаю аналитику, где-то выполняю функции инженера, а где-то разрабатываю.

Сначала я проходил курсы на Stepik, оттуда узнал про курс Hard ML в Karpov.Courses. К собственным конспектам Hard ML регулярно возвращаюсь, чтобы лучше решать задачи по работе. Сомнений при покупке курса по инженерии данных не было, хотя после курса Hard ML ожидания были высокие. По результатам: в целом всё то, что хотел узнать, я узнал. Теоретические видео были интересными и содержательными. Понравился блок по облачным хранилищам, сразу есть возможность развернуть что-то своё. Бывает, пересматриваю блок по ETL — знания оттуда помогают решать рабочие задачи. Немного не хватило практики. Хотелось бы больше заданий на написание кода. С точки зрения формата — хорошо, что все лекции записаны заранее. Я думаю, что это правильно — преподаватели не устают и не выдыхаются. Приятно, что вокруг курсов сформировалось комьюнити, и в чатах помогают как студенты, так и преподаватели.
Николай
ДЕМОВЕРСИЯ
Попробуйте себя в роли инженера данных, познакомьтесь с образовательной платформой и решите, подходит ли вам формат обучения.
ПОЛНАЯ ВЕРСИЯ
+ Реляционные и MPP СУБД
+ Автоматизация ETL-процессов
+ Big Data
+ Проектирование DWH
+ Облачное хранилище
+ Визуализация данных
+ Big ML
+ Управление моделями
+ Управление данными
+ Поддержка от преподавателей
+ Работа на удалённом сервере
Начните осваивать профессию инженера данных, получите доступ к работе на удалённом сервере и поддержке от наших преподавателей.
+ Три урока по проектированию DWH
+ Конспекты лекций
+ Практические задания с разбором
20 000 ₽
90 000 ₽
0 ₽
Регистрация на курсе открывается сразу после нажатия на кнопку ниже.
ПОМЕСЯЧНО:
ПОЛНАЯ ОПЛАТА:
Оплата в течение
5 месяцев
Скидка 10 000 ₽
при полной оплате
100 000 ₽
Доступ к демоверсии откроется после регистрации на образовательной платформе.
+ Big ML
+ Управление моделями
+ Управление данными
+ Поддержка от преподавателей
+ Работа на удалённом сервере
+ Реляционные и MPP СУБД
+ Автоматизация ETL-процессов
+ Big Data
+ Проектирование DWH
+ Облачное хранилище
+ Визуализация данных
Начните учиться сейчас, оформите налоговый вычет и верните до 13% стоимости обучения. Подробнее здесь.
налоговый вычет
гарантия возврата
Если в течение двух недель решите, что курс вам не подходит — вернём деньги.

FAQ

Есть ли у вас образовательная лицензия? 
Да, мы осуществляем образовательную деятельность на основании государственной лицензии № 042 048 от 11 апреля 2022 года, выданной Департаментом образования и науки города Москвы.
Смогу ли я оформить налоговый вычет за обучение?
Да. Если вы оплатили обучение на курсе после 23 мая 2022 года, являетесь налоговым резидентом России и уплачиваете подоходный налог, вы можете оформить вычет. Однако подать документы можно только в году, следующем за годом оплаты обучения. 
Налоговый вычет за обучение — это часть расходов на образование, которую государство может вам компенсировать. С подробной информацией об условиях получения налогового вычета, порядком его расчёта и списком необходимых документов можно ознакомиться на сайте ФНС.
Какими знаниями нужно обладать для прохождения курса?
Для комфортного обучения на курсе необходимо уметь писать код на Python и составлять SQL запросы к базам данных. Специализированные знания в области инженерии данных вам не потребуются.
Какие программы и оборудование нужны для обучения?
Лекции вы сможете смотреть с любого устройства, но для написания кода вам потребуется компьютер или ноутбук. Требований к конфигурации и мощности нет — мы предоставим всю необходимую инфраструктуру для работы на удалённом сервере. На старте обучения специальные программы устанавливать не обязательно — будут нужны только браузер и стандартные приложения для общения: Telegram, Zoom и Slack.
Как много времени нужно будет уделять обучению?
В среднем наши студенты занимаются по 10 часов в неделю. Этого времени хватает, чтобы успевать смотреть лекции и вовремя выполнять домашние задания.
Смогу ли я совмещать обучение с работой?
Мы организовали обучение таким образом, чтобы вы могли совмещать его с работой, учёбой и личной жизнью. Заниматься вы сможете в любое время и в удобном для вас темпе — все лекции записаны заранее и разбиты на короткие видео по 15−30 минут, а для домашних заданий установлены мягкие двухнедельные дедлайны.
Как будет проходить обучение?
Обучение длится 5 месяцев. Каждую неделю будет проходить по три урока, доступ к которым будет открываться постепенно. Уроки состоят из видеолекций, конспектов и практических заданий, на выполнение которых отводится две недели. По истечении двухнедельного дедлайна будет открываться доступ к разборам заданий. Если во время обучения возникнут сложности, вы сможете обратиться за помощью к менторам.
Что если у меня возникнут сложности с выполнением заданий?
Во время обучения вполне нормально «застрять» на каком-то задании. На этот случай у нас работает команда поддержки, которая поможет разобраться со сложной задачей.
Что если я начну отставать от программы курса?
Если вдруг что-то пойдёт не по плану, и вы почувствуете, что отстаёте от программы, сообщите об этом кураторам курса. Вместе мы придумаем, как сделать ваше обучение более удобным.
Почему в качестве основной базы данных на курсе используется Greenplum, а не ClickHouse, HP Vertica, Teradata или другая колоночная база данных?
Все MPP РСУБД основаны на базовых принципах распределения данных по узлам и генерации параллельного плана запроса на основе последовательного. Освоив эти принципы на примере Greenplum, вы сможете уверенно пользоваться любыми другими базами данных — в том числе HP Vertica и Teradata.
ClickHouse — специализированная база данных с рядом известных ограничений: например, в ней нельзя объединять более двух таблиц в рамках одного запроса. У Greenplum таких недостатков нет, поэтому мы выбрали именно её.
Будет ли мне полезен этот курс, если в моей компании используется не Greenplum, а другая база данных?
У любой MPP РСУБД базовые принципы работы такие же, как и у Greenplum. Если в вашей компании используется любая MPP РСУБД (например, Vertica или Teradata), для работы с ней вы сможете без каких-либо ограничений применить все полученные на курсе знания. Если же в вашей компании MPP РСУБД не используется, тогда после прохождения обучения вы либо сможете выступить с предложением по её внедрению, либо поймёте, что необходимости в ней нет.
Будет ли в модуле визуализации раскрыто, как Tableau работает под капотом, как настраивать коннекторы к разным источникам, как Tableau шлёт запросы к базам данных и как кэширует результаты?
Да. В этом модуле мы расскажем вам, как Tableau устроен внутри, объясним, как происходит кэширование результатов запросов, и научим настраивать коннекторы к разным источникам. Также мы поговорим про экстракты и разные архитектуры работы Tableau с базами данных, обсудим, как объединять данные на стороне инструмента (и стоит ли это делать), и разберёмся, когда в Tableau лучше использовать длинные источники, а когда — широкие.
Научат ли меня на курсе собирать витрины данных из множества разрозненных источников: Hadoop, MySQL, PostgreSQL?
Создание витрины данных из множества источников — довольно сложный процесс. Мы не сможем дать вам универсальное руководство, но подробно объясним все этапы: проектирование витрины, работу с Hadoop стеком, взаимодействие с аналитическими СУБД и code-driven ETL-платформами. Разобравшись в этом, вы сможете решить поставленную задачу.
СМОТРЕТЬ ЕЩЁ
Я смогу общаться с преподавателями и другими студентами?

Конечно, сможете. Всё общение с преподавателями и однокурсниками будет проходить в Slack. В чате можно будет задать любые вопросы по обучению.

Кто будет меня учить?
Вашими наставниками будут инженеры данных из ведущих российских компаний, таких как VK, Яндекс Go, СберМаркет и Mars. В этот курс они вложили все свои знания и опыт, полученные за многие годы работы. Во время обучения они будут рядом и помогут справиться с трудностями.
Получу ли я документ, подтверждающий прохождение курса?
Да, мы выдаём именной сертификат с подписями преподавателей курса. Чтобы его получить, необходимо набрать суммарно не менее половины баллов за домашние задания.
Останется ли у меня доступ к учебным материалам после окончания курса?
Да, останется. Лекции, конспекты и домашние задания будут доступны вам всегда, даже после окончания обучения. Единственное, к чему пропадёт доступ, это удалённый сервер. Но не волнуйтесь — мы заранее вас предупредим и дадим возможность сохранить все необходимые файлы.
Смогу ли я найти работу после обучения?
Сейчас на рынке труда нехватка инженеров данных. Если после обучения вы будете откликаться на вакансии и работать над тестовыми заданиями, то у вас обязательно получится найти хорошую работу. На курсе мы дадим все необходимые знания и научим применять их на практике. Именно на это работодатели обращают внимание в первую очередь.

Кроме того, мы сами активно помогаем студентам искать работу — посмотрите нашу программу трудоустройства.
Помогаете ли вы с трудоустройством?
Да, у нас работает программа трудоустройства, благодаря которой работу находят 90% наших выпускников. Сначала мы расскажем, как правильно составлять резюме и сопроводительное письмо, проведём пробное собеседование и научим правильно презентовать свои навыки. Затем мы направим ваше резюме компаниям-партнёрам, среди которых Озон, Яндекс, Авито и многие другие. Всё это время вас будет сопровождать наш менеджер по трудоустройству. В среднем от подачи резюме до получения оффера проходит 1–1,5 месяца.
У меня есть свои рабочие задачи, которые я хочу научиться решать. Поможет ли мне ваш курс?
Практические задачи, которые вы будете решать, регулярно встречаются в повседневной работе инженера данных. Поэтому вы сможете применить полученный опыт для решения большинства стоящих перед вами задач. Если ваша задача специфическая и требует нестандартного подхода к решению, вы сможете посоветоваться в чате с командой поддержки и преподавателями — вам обязательно помогут.
Что произойдёт после оплаты?
После подачи заявки и оплаты обучения вы присоединитесь к ближайшему учебному потоку. Обучение на потоках начинается 5-го числа каждого месяца — к этому времени вас зарегистрируют во всех необходимых системах. В день старта вам придёт письмо с логином и паролем, а также ссылками на чаты в Slack и Telegram.
Как я могу оплатить обучение?
Вы можете оплатить обучение банковской картой. Доступны два варианта: заплатить всю сумму сразу или платить ежемесячно равными платежами. При полной оплате обучение будет стоить меньше.
Могу ли я платить за обучение частями?
Да, мы предоставляем возможность поэтапной оплаты обучения. Поэтапная оплата происходит равными платежами раз в месяц. Для выбора поэтапной оплаты перейдите по соответствующей ссылке на странице оплаты.
Смогу ли я вернуть деньги, если курс мне не понравится?
Да, сможете. В течение первых двух недель можно вернуть оплату за весь курс. Если проучитесь дольше, то сможете вернуть оплату за вычетом стоимости уже открытых уроков.
СТАРТ КАЖДЫЙ МЕСЯЦ
НАЧАЛО КУРСА
5 ОКТЯБРЯ

Остались вопросы?

Заполните форму, мы свяжемся с вами, ответим на все ваши вопросы и подробнее расскажем о курсе.