ИНЖЕНЕР ДАННЫХ. ОБУЧЕНИЕ У НАС |

Инженерия данных от проектирования до нетривиальной обработки
СТАРТ ПРОГРАММЫ
7 МАРТА
КОМУ ПОДОЙДЁТ
JUNIOR+/MIDDLE
ПОЭТАПНАЯ ОПЛАТА
НА 5 МЕСЯЦЕВ

записаться на курс

Мы свяжемся с вами и ответим на все ваши вопросы по курсу.

НАУЧИТЕСЬ ПРАВИЛЬНО ГОТОВИТЬ ДАННЫЕ ЛЮБЫХ РАЗМЕРОВ И СЛОЖНОСТИ

Обучающие выборки для машинного обучения и красивые графики для отчётов не появляются сами собой: данные нужно собирать, хранить, валидировать и комбинировать между собой, быстро реагируя на изменения в их структуре.
Стандартный путь:
1/ НАЧИНАЕШЬ РАБОТАТЬ С ДАННЫМИ
2/ ПЫТАЕШЬСЯ СДЕЛАТЬ СИСТЕМНО И РАСШИРЯЕМО
3/ ПОНИМАЕШЬ, ЧТО НЕ ХВАТАЕТ ЗНАНИЙ, ЧТОБЫ ОХВАТИТЬ ВСЮ АРХИТЕКТУРУ DWH ЦЕЛИКОМ
Для работы с данными недостаточно знать один инструмент — необходимо учитывать весь спектр взаимосвязей большого хранилища, понимать потребности заказчика и воспринимать данные как конечный продукт.
Сильный инженер данных за счёт широты знаний может выбрать правильный инструмент под любые задачи, охватить всю архитектуру DWH целиком и донести результат до потребителей данных.
Сильный инженер данных за счёт широты знаний и понимания архитектуры DWH способен подобрать правильные инструменты под любые задачи и донести результат до потребителей данных.
Для эффективной работы с данными одного инструмента недостаточно — необходимо учитывать все взаимосвязи большого хранилища, понимать потребности заказчика и воспринимать данные как конечный продукт.

КОМУ ПОДОЙДЁТ ЭТОТ КУРС:

Постоянно взаимодействуете с базами данных, но хотите лучше разобраться в ETL-процессах и выйти на качественно новый уровень в аналитике.
АНАЛИТИК ДАННЫХ
Уже работаете с хранилищами данных, но хотите систематизировать знания и глубже погрузиться в актуальные технологии.
ИНЖЕНЕР ДАННЫХ
Имеете опыт бэкенд-разработки и хотите применить его для решения задач, связанных с хранением и обработкой больших данных.
BACKEND-РАЗРАБОТЧИК
Занимаетесь развитием систем бизнес-аналитики, хотите освоить архитектуру современных хранилищ данных и научиться их проектировать.
BI-РАЗРАБОТЧИК

какие инструменты освоите >

PostgreSQL
Hadoop
S3
Greenplum
Python
SQL
Hive
Spark
Kafka
хранение
обработка
ML Flow
Spark ML
SuperSet
Tableu
DataLens
Airflow
машинное обучение
визуализация
Оркестраторы
Для эффективной отработки навыков в курсе «Инженер данных» есть промежуточный практический проект, который воссоздает etl-процессы (airflow) крупной двухуровневой платформы данных. Проект максимально приближен по сути к рабочим задачам дата-инженера. В процессе работы над ним вы закрепите понимание инструментов airflow, spark + s3 и greenplum и поймете, как использовать их в связке друг с другом.

Проект доступен тем, кто прошел модуль Big data, на его выполнение дается две недели — в этот период не будут открываться другие уроки, чтобы вы не отвлекались.
Максимальное погружение

ЧТО НЕОБХОДИМО ДЛЯ КУРСА [?]

Оставьте заявку на консультацию: наш специалист задаст вам нужные вопросы и вышлет бесплатный тест, чтобы лучше подобрать курс, который максимально подойдет для вашей цели.
Не уверены, хватит ли знаний для курса?

ПРОГРАММА КУРСА ://

КАК ПРОХОДИТ ОБУЧЕНИЕ >

ПОДРОБНЕЕ О КУРСЕ

Преподаватели расскажут о курсе и его содержании. Вы узнаете, в чём ценность каждого модуля и как полученные знания помогут в дальнейшей работе.

Формат и нагрузка

 Обучение проходит в интенсивном формате по 3 занятия в неделю. Для каждого домашнего задания установлены мягкие двухнедельные дедлайны.
 На учёбу наши студенты тратят в среднем 10−15 часов в неделю
 Если у вас возникнут сложности с выполнением заданий, вы сможете обратиться к команде сопровождения — эксперты помогут разобраться с любой задачей из курса.

Инфраструктура

 Работайте со всеми необходимыми инструментами на выделенном сервере

 Совершенствуйте навыки работы с Hadoop, Greenplum, PostgreSQL, Airflow, Spark, Hive и Kubernetes

ПРОМЕЖУТОЧНЫЙ ПРОЕКТ

— В рамках проекта поработаете с etl-процессами (airflow) крупной двухуровневой платформы данных, закрепите понимание инструментов airflow, spark + s3 и greenplum и поймёте, как использовать их в связке друг с другом
Формат и нагрузка
⦁Обучение проходит в⦁интенсивном формате по⦁3 занятия в⦁неделю. Для⦁каждого домашнего задания установлены мягкие двухнедельные дедлайны.
⦁На⦁учёбу наши студенты тратят в⦁среднем 10−15 часов в⦁неделю
⦁Если у⦁вас возникнут сложности с⦁выполнением заданий, вы⦁сможете обратиться к⦁команде сопровождения⦁— эксперты помогут разобраться с⦁любой задачей из⦁курса.
Инфраструктура
 Работайте со всеми необходимыми инструментами на выделенном сервере
 Совершенствуйте навыки работы с Hadoop, Greenplum, PostgreSQL, Airflow, Spark, Hive и Kubernetes
ПРОМЕЖУТОЧНЫЙ ПРОЕКТ
— В рамках проекта поработаете с etl-процессами (airflow) крупной двухуровневой платформы данных, закрепите понимание инструментов airflow, spark + s3 и greenplum и поймёте, как использовать их в связке друг с другом

Этот курс кажется вам сложным?

Оставьте заявку, наш консультант свяжется с вами и поможет подобрать курс, который будет полностью соответствовать вашим целям.

ВАШЕ РЕЗЮМЕ ЧЕРЕЗ == 5 МЕСЯЦЕВ

ВИКТОР КУЗНЕЦОВ
Инженер данных
от 100 000 ₽
ЖЕЛАЕМАЯ ЗАРПЛАТА
Работаю с реляционными базами данных, в том числе MPP, понимаю особенности работы распределенных систем на базе Greenplum

Умею строить и автоматизировать ETL\ELT-пайплайны на базе Apache Airflow

Имею опыт работы с большими данными в Hadoop и Spark, умею составлять сложные SQL запросы в Apache Hive

Разбираюсь в архитектуре хранилищ данных (DWH), владею методами многомерного моделирования, якорного моделирования и Data Vault
Greenplum
Airflow
Hadoop
Spark
Apache Hive
DWH
Сплитуйте оплату на части
Подробности акции на сайте

Стоимость обучения

> Реляционные и MPP СУБД
> Автоматизация ETL-процессов
> Big Data
> Проектирование DWH
> Облачное хранилище
> Визуализация данных
Начните осваивать профессию инженера данных, получите доступ к работе на удалённом сервере и поддержке от наших преподавателей.
92 000 ₽
ПОЛНАЯ ОПЛАТА:
> Big ML
> Управление моделями
> Управление данными
> Поддержка от преподавателей
> Работа на удалённом сервере
8 667 ₽ / мес. *
Поэтапная оплата или рассрочка от партнёра:
* При рассрочке на 12 месяцев
104 000 ₽
Срок рассрочки можно выбрать на этапе оплаты. Доступны опции от 10 до 24 мес.
-23%
-8%
Скидка 12 000 ₽ при полной оплате или через Яндекс Сплит
УДОБНЫЙ ЕЖЕМЕСЯЧНЫЙ ПЛАТЕЖ С БЕСПРОЦЕНТНОЙ РАССРОЧКОЙ ОТ НАШИХ ПАРТНЁРОВ

записаться на курс или задать вопрос

Мы свяжемся с вами и ответим на все ваши вопросы по курсу.

записаться на курс или задать вопрос

Мы свяжемся с вами и ответим на все ваши вопросы по курсу.

записаться на курс или задать вопрос

Мы свяжемся с вами и ответим на все ваши вопросы по курсу.
Обучение может оплатить ваш работодатель
налоговый вычет
Начните учиться сейчас, оформите налоговый вычет и верните до 13% стоимости обучения.
гарантия возврата
Если в течение двух недель решите, что курс вам не подходит — вернём деньги.
Международная оплата
Если вы хотите оплатить обучение из-за рубежа, оставьте заявку — мы с вами свяжемся и подскажем, как это сделать.

Авторы курса >

ЕВГЕНИЙ ЕРМАКОВ
Руководитель платформы данных toloka.ai
НЕРСЕС БАГИЯН
Head of DS в Raiffeisen CIB
Читать подробнее →
Работа с командой DWH и обработка больших данных
Модуль:
Валерий Соколов
Старший администратор баз данных в Яндекс Go
РОМАН БУНИН
BI-evangelist Yandex DataLens, ex-Head of BI Yandex Go
Дина Сафина
Руководитель инженеров данных в Ozon.Fintech
АЛЕКСАНДР ВОЛЫНСКИЙ
Технический менеджер продукта ML Platform в VK Cloud Solutions
Антон Пилипенко
ETL team lead в IPONWEB
Александр Савченко
Руководитель R&D в Сбер

ОТЗЫВЫ ВЫПУСКНИКОВ /

скоро следующее видео
  • Я остался доволен курсом: и технологии новые освоил (причём в прикладном, а не обзорном формате), и пробелы в фундаментальном понимании закрыл. И самое главное — загорелся идеей развернуть своё дата-решение в облаке. В результате я взял сервер на DigitalOcean и сделал там своё рабочее пространство: прямо по всем рекомендациям с уроков развернул в нём кластеры, Jupyter, Superset для визуализации, Airflow для автоматизации, а также Spark и ClickHouse. Остался весьма доволен.

    Сейчас я перестраиваю свой пет-проект и переношу на этот сервер — с построением процессов, как разбирали на курсе. У меня, конечно, не BigData, всё куда прозаичнее и меньше, но зато теперь есть реальный опыт ;)
    Ярослав
  • Я работал с машинным обучением и аналитикой, делал скоринговые и рекомендательные модели. На прошлом месте работы я руководил командой, в которой были инженеры данных. И я хотел подтянуть свои компетенции. Сейчас я поменял работу из-за переезда. Компания меньше, поэтому где-то я делаю аналитику, где-то выполняю функции инженера, а где-то разрабатываю.

    Сначала я проходил курсы на Stepik, оттуда узнал про курс Hard ML в Karpov.Courses. К собственным конспектам Hard ML регулярно возвращаюсь, чтобы лучше решать задачи по работе. Сомнений при покупке курса по инженерии данных не было, хотя после курса Hard ML ожидания были высокие. По результатам: в целом всё то, что хотел узнать, я узнал. Теоретические видео были интересными и содержательными. Понравился блок по облачным хранилищам, сразу есть возможность развернуть что-то своё. Бывает, пересматриваю блок по ETL — знания оттуда помогают решать рабочие задачи. Немного не хватило практики. Хотелось бы больше заданий на написание кода. С точки зрения формата — хорошо, что все лекции записаны заранее. Я думаю, что это правильно — преподаватели не устают и не выдыхаются. Приятно, что вокруг курсов сформировалось комьюнити, и в чатах помогают как студенты, так и преподаватели.
    Николай