ХАРДКОРНЫЙ MACHINE LEARNING. ОБУЧЕНИЕ У НАС |
Не просто обучаем модельки, а решаем сложные и нужные для бизнеса ML-задачи.
СТАРТ ПРОГРАММЫ
1 АВГУСТА 2021
ФОРМАТ ОБУЧЕНИЯ
ОНЛАЙН
КОМУ ПОДОЙДЁТ
MIDDLE/SENIOR
ПОЭТАПНАЯ ОПЛАТА
НА 5 МЕСЯЦЕВ
ВАЛЕРИЙ БАБУШКИН
НА КУРСЕ ПРОЙДЁМ ПОЛНЫЙ ЦИКЛ РАЗРАБОТКИ ML-ПРИЛОЖЕНИЯ
За последние два года я провёл собеседования у нескольких сотен кандидатов на позиции от стажёра до руководителя команды в тридцать человек. Многие из них проходили и проходят обучающие курсы чтобы войти в новую профессию, получить специальные знания или просто для поддержания себя в хорошей форме.

Когда Анатолий с командой предложили мне создать курс по машинному обучению, я решил, что он должен преследовать две основные цели:
1. Показывать, как решать нестандартные для обучающих курсов по ML задачи, которые тем не менее регулярно встречаются на практике.
2. Давать максимально глубокое погружение, не ограниченное одним лишь созданием моделей, и рассказывать про все этапы работы инженера по машинному обучению: от сбора и разметки данных с построением пайплайнов их поставки до обучения и деплоя моделей с мониторингом и оценкой эффективности алгоритмов.
ОБУЧЕНИЕ ПРОХОДИТ В ИНТЕНСИВНОМ ФОРМАТЕ ПО 3 ЗАНЯТИЯ В НЕДЕЛЮ
Все лекции доступны в записи
ДОМАШНИЕ ЗАДАНИЯ ВЫ РЕШАЕТЕ НА НАШЕЙ ИНФРАСТРУКТУРЕ
На учёбу наши студенты тратят в среднем 10 часов в неделю
ЗДЕСЬ >>> НАЧИНАЕТСЯ ТВОЙ ПУТЬ В МИР HARDCORE ML!
Вашими наставниками будут ведущие Data Scientists из Facebook, Yandex, Mail.ru, X5 Retail Group ///
КАК ПРОХОДИТ ОБУЧЕНИЕ
Первый этап →
Второй этап →
Третий этап →
РЕШАЙТЕ РЕАЛЬНЫЕ ЗАДАЧИ
— Учитесь решать сложные и нестандартные ML-задачи
— Постройте своё приложение с применением всех полученных знаний
— Не просто обучайте модели, а изучайте их и настраивайте всё необходимое для их работы
ИСПОЛЬЗУЙТЕ НАШУ ИНФРАСТРУКТУРУ
— Работайте на выделенном сервере
— Практикуйтесь на данных из реальных задач
— Изучайте решения преподавателей и других студентов
ЗАДАВАЙТЕ ЛЮБЫЕ ВОПРОСЫ В ПОДДЕРЖКУ
— Обсуждайте задачи и проекты с преподавателями и менторами
— Вашими наставниками будут ML-инженеры из ведущих компаний России
ДЛЯ КОГО ЭТА ПРОГРАММА:
ML-РАЗРАБОТЧИК
Вы уже имеете опыт работы в областях, связанных с машинным обучением, и хотите понять, как решать специфические и нестандартные задачи.
ТИМЛИД
Программа поможет вам создать сервис, который будет решать сложные бизнес-задачи с использованием машинного обучения. Вы пройдете весь путь от момента постановки задачи до запуска в работу приложения, основанного на ML-алгоритмах.
ПРОГРАММА КУРСА ://
|
Матчинг позволяет решать некоторые важные проблемы, с которыми сталкиваются все компании. Научимся выявлять товары-дубли по их названиям. Попрактикуемся сопоставлять покупателей в онлайне, офлайне и в приложении. Узнаем, как мониторить цены в реальном времени.
Матчинг позволяет решать некоторые важные проблемы,
с которыми сталкиваются все компании. Научимся выявлять товары-дубли по их названиям. Попрактикуемся сопоставлять покупателей в онлайне, офлайне и в приложении. Узнаем, как мониторить цены в реальном времени.
Открыть программу
1. Вводная лекция: ранжирование, матчинг, архитектурные особенности
На вводной лекции познакомимся с постановкой задачи ранжирования с точки зрения машинного обучения. Разберёмся в тонкостях матчинга, верхнеуровнево познакомимся с архитектурой решения.
2. Метрики в задаче ранжирования. Особенности матчинга как подзадачи ранжирования
Рассмотрим различные метрики ранжирования: от самых базовых до актуальных и часто используемых. Обсудим аспекты их использования в разных ситуациях. Углубимся в задачу матчинга и рассмотрим особенности оценки результатов.
3. Функции потерь и базовые подходы к обучению моделей ранжирования
Продолжим углубляться в тему ранжирования и рассмотрим методы обучения моделей ранжирования. Узнаем, какие существуют функции потерь и в каких случаях они используются.
4. Особенности работы с деревянными моделями. YetiRank
Перейдём к следующему этапу развития ранжирующих систем и познакомимся с популярными алгоритмами и их внутренним устройством.
5. Передовые подходы к ранжированию: обзор ушедшего десятилетия
Разберёмся, какие за последнее время были придуманы трюки и приемы, повышающие качество и стабильность моделей. Проследим за развитием идей и концепций.
6. Приближённый поиск ближайших соседей
Ранжирование и поиск в данных могут стать проблемой при росте количества данных. Рассмотрим алгоритмы, позволяющие быстро и эффективно искать схожие объекты в огромной базе.
7. Модели для работы с текстом, введение в эмбеддинги. FastText, DSSM
Познакомимся с языковыми моделями для извлечения информации из текстов в векторном виде для последующей утилизации моделями. Разберём принципы работы и обучения моделей FastText. Обсудим, чем они отличаются от Word2Vec. Перейдём к структурированным синтаксическим моделям - DSSM.
8. Сложные языковые модели для высокоточной работы: BERT и трансформеры
Продолжим знакомство с текстовыми моделями. Разберём передовые архитектуры. Посмотрим, в какой задаче матчинга трансформер может «выстрелить».
9. Парсинг данных из Интернета, сбор датасетов
Научимся выживать в ситуациях, когда данных нет, но они очень нужны. Разберём основы парсинга web-страниц и сбора сырых данных.
10. Толока как инструмент для оценки моделей и обновления датасетов
Познакомимся с инструментом ручной разметки данных от компании Яндекс. Разберёмся, какую пользу он может принести в работе.
Финальный проект блока
Используем полученные знания для разработки сервиса на основе моделей ранжирования. В качестве бонуса обсудим задачи, которые можно решить с минимальными изменениями текущего пайплайна.
|
Научимся делать динамическое ценообразование на основе машинного обучения, что позволит вам максимизировать прибыль компании, в которой вы работаете, и поможет найти баланс между трафиком, выручкой и маржой.
Открыть программу
1. Постановка задачи ценообразования
Начнём с основ экономической теории: узнаем, из чего складывается цена, каковы её основные компоненты, от каких факторов она зависит и многое другое. Также на первом занятии познакомимся с понятием волатильности.
2. Построение модели предсказания цены в зависимости от факторов
Закрепим теорию практикой: научимся грамотно просматривать и анализировать данные рынка и с их помощью выявим реальные факторы, влияющие на цену продукта. Порешаем задачи предсказания цен на уже существующих данных.
3. Постановка задачи динамического ценообразования
Теперь более внимательно рассмотрим, чем постановка задачи динамического ценообразования отличается от предыдущей задачи и какие факторы могут влиять на цену в данном случае. Обсудим зависимость динамического ценообразования от групп покупателей, времени, рыночных условий, спроса и задач проникновения.
4. Первое знакомство с динамическим ценообразованием

Проанализируем практическую применимость концепции «‎цена как функция, зависящая от факторов», а также построим первые простейшие модели динамического ценообразования.
5. Предсказание диапазонов цен
Поговорим о том, как работают алгоритмы предсказания диапазонов цен. Познакомимся с понятием квантильной регрессии и затронем проблему выбора лучшей цены.
6. Скрещивание динамического и классического ценообразования
Поговорим о построении прогнозов диапазонов цен и корректировке цены в зависимости от факторов. Обсудим различные подходы к построению прогнозов. Узнаем, как работает просмотр временных рядов цен: как цена меняется во времени, как изменяется диапазон цен и как происходит корректировка цен на основе этих данных.
7. Метрики и тесты для определения лучшей цены
Подробно разберём, на какие метрики нужно смотреть для определения лучшей цены. Узнаем, как применить A/B-тестирование для решения этой задачи.
8. Многорукие бандиты и обучение с подкреплением
Узнаем, как использовать обратный сигнал для корректировки и задания диапазонов цен. Познакомимся с понятием многоруких бандитов и теорией, которая лежит в их основе. Рассмотрим, как они позволяют ускорить A/B-тесты для прода.
9. Практическое применение многоруких бандитов

Рассмотрим реализацию многоруких бандитов и получение обратной связи для корректировки цены в коде.
Финальный проект блока
На основе пройденного материала создадим собственный сервис по предсказанию цен для 1000 товаров. Построим для него несколько моделей и постараемся решить задачу максимальных продаж без провисания маржи.
|
Научимся делать uplift-моделирование. Рассмотрим всё от постановки задачи до её реализации. Данный тип моделирования позволит учесть изменения в поведении клиентов, которые, например, могли быть вызваны рекламной акцией — реализация модели next best action/offer. На основании данной модели вы сможете планировать и своевременно предлагать определённым клиентам специальные акции и особые цены.

Открыть программу
1. Введение в uplift-моделирование
Обоснуем мотивацию использования uplift и научимся правильно ставить задачу для эффективного моделирования. Рассмотрим популярные решения и метрики качества uplift-моделирования.
2. Разбор методов построения uplift-моделей
Обсудим как можно проводить EDA (exploratory data analysis) при прогнозирования. Разберем много подходов к построению uplift-деревьев: meta-learners, uplift trees.
3. Uplift сложных метрик. Expected value framework
Узнаем, что такое декомпозиция бизнес-эффекта (expected value decomposition) и как с ее помощью продумывать изменение интересующей метрики и схемы прогноза. Рассмотрим сложный кейс из offline ритейла.
4. Как спроектировать свою библиотеку факторов
Для построения любой модели необходимы данные — информация об объектах, с которыми мы работаем. Например, важно понимать, откуда к нам пришёл тот или иной клиент и какие у него предпочтения. На занятии узнаем, как проводить эксперименты с разными наборами предикторов и как понять, какой набор является оптимальным для решения задачи. Лишний раз убедимся в том, что оформление кода расчёта предикторов в библиотеку — это самый быстрый путь вывода модели в продакшн.
5. Workshop: пишем приложение с применением модели
Теперь собственными руками построим приложение с применением uplift. Сначала продумаем последовательность действий (pipeline) для подготовки данных и применения модели и организуем репозитории с исходным кодом. Настроим логирование и уведомления. Также обсудим механику сохранения промежуточных результатов и подъема приложения при его падении.
Финальный проект блока

Напишем своё приложение/веб-сервис для запуска uplift-модели.
|
Научимся использовать ML-алгоритмы для ускорения A/B-тестов. В результате тесты станут намного более чувствительными, а плохо показывающие себя тесты можно будет быстро выявить и отключить.
Открыть программу
1. Введение: основы статистики
Вспомним основные моменты из теории вероятностей и математической статистики, которые понадобятся в курсе. Научимся строить точечные оценки и доверительные интервалы.
2. Основы статистики и статистические критерии
Поговорим о том, что такое АБ-тестирование и чем оно отличается от других способов принятия решений. Узнаем какие статистические критерии применяются в АБ-тестировании и как можно построить доверительный интервал с помощью бутстрепа.
3. Метрики в А/B-тестировании
Рассмотрим различные метрики А/B-тестирования и их классификацию. Выделим среди них те, которые используются чаще всего. Разберём наиболее удачные комбинации метрик.
4. MDE, sample size
Научимся рассчитывать минимальный детектируемый эффект и подбирать необходимый размер групп для проведения эксперимента. Познакомимся с идеями повышения чувствительности тестов.
5. Стратификация
Обсудим, в чём опасность экспериментов на малом количестве данных. Узнаем, как дополнительные знания о наблюдаемых объектах помогают снижать дисперсию данных. Научимся сокращать дисперсию с помощью стратификации.
6. CUPED. Гильбертово пространство случайных величин
Проанализируем общие черты гильбертового пространства и CUPED. Научимся снижать дисперсию данных и повышать чувствительность теста за счёт использования исторических данных.
7. Линеаризация. Многопараметрический дельта метод
Познакомимся с особенностями тестирования ratio метрик. Узнаем, какие есть общие черты у многопараметрического дельта-метода и линеаризации. Поговорим о том, как они связаны между собой.
8. Множественное тестирование, 2 + 2= -2
Рассмотрим ситуацию, когда два улучшения могут привести к ухудшению ситуации, а также научимся справляться с этой проблемой: узнаем, как организовать проведение большого количества экспериментов параллельно и как проводить эксперименты с несколькими вариантами изменений.
9. Peeking problem, последовательное тестирование
Поговорим о том, что происходит с корректностью теста, если оценивать эксперименты до их окончания. Научимся динамически определять момент завершения пилота.
10. Auto-ML, полный пайплайн
На заключительном занятии модуля узнаем, как выглядит полный пайплайн, и рассмотрим применение ML-алгоритмов для повышения чувствительности тестов.
|
ML-модели со временем умирают. Чтобы этого не происходило, их необходимо периодически дообучать. Научимся делать это правильно.
Открыть программу
1. Вводная лекция
В этой лекции мы пройдемся по некоторым паттернам микросервисной архитектуры, процессам разработки и развертки.
2. ML serving сервис
На занятии мы поговорим, как конструировать эндпоинты по принципу REST, изучим архитектуру приложения и ее layout, поговорим про работу с коннектами и другими разделяемыми объектами, обсудим балансировку на клиенте и миграции.

3. Процессы. Веб-серверы
В этой лекции сфокусируемся на процессах-демонах, так как развертка приложений происходит в виде процессов-демонов. Поразмышляем, какие модели веб-сервисов пригодны для ML и поймем, зачем приложению нужны веб-сервера.
4. Docker
Погрузимся в функции и особенности докера, докер-компоуза и докер-сворма.

5. Gitlab CI/CD
Научимся настраивать CI/CD для сборки, тестирования и выкатки.
6. Сценарии развертки
Обсудим и продемонстрируем разные сценарии развертки.
ЕСЛИ ЭТОТ КУРС КАЖЕТСЯ ВАМ СЛОЖНЫМ
ЗАПИСАТЬСЯ
НА SOFT ML
Если текущая программа кажется вам сложной, оставьте заявку на более лёгкий курс по ML. Мы оповестим вас о выходе программы.
ПРОГРАММА ТРУДОУСТРОЙСТВА>>>
Помощь с резюме и сопроводительным письмом, отработка навыков самопрезентации
Рекомендации компаниям - партнерам, среди которых Озон, Яндекс, Авито и др.
Сопровождение наших выпускников в трудоустройстве до момента оффера
ПОЛНАЯ "УПАКОВКА"
РЕКОМЕНДАЦИЯ КОМПАНИЯМ
СОПРОВОЖДЕНИЕ
— Как только вы будете готовы, наши HR отправят ваше резюме с рекомендациями компаниям-партнёрам
— Свой прогресс в трудоустройстве вы будете отслеживать с помощью специальных дневников
— Работать над ошибками мы будем вместе с вами: мы подскажем, что нужно подтянуть и в каком направлении лучше мыслить, чтобы эффективнее справляться с задачами на собеседованиях.
— Наша цель ­ — довести вас до оффера.
ПОМОЖЕМ С ПОИСКОМ РАБОТЫ, УСИЛИМ ВАШЕ РЕЗЮМЕ И НАУЧИМ ПРАВИЛЬНО ПРЕЗЕНТОВАТЬ СВОИ НАВЫКИ
У НАС ПРЕПОДАЮТ:
УЧИТЕСЬ У >ЛУЧШИХ>
ВАЛЕРИЙ БАБУШКИН
Kaggle Competitions Grandmaster, 23-е место из более чем 120 тысяч специалистов
Facebook, работал в Яндекс, X5 Retail Group и Alibaba
До перехода в Facebook был Director of Data Science and Engineering в X5 Retail Group
Преподаватель курса Data Science в Высшей Школе Экономики
Консультирует центральный банк Казахстана по вопросам анализа данных
ВАГЕ БРСОЯН
2 года опыта работы ML-инженером в Яндексе. Ментор программы «Школа будущих CTO».
Тимлид в X5 Retail Group более двух лет
Модули >>>
СТАНИСЛАВ ГАФАРОВ
Сейчас - тимлид в X5 Retail Group, ранее - тимлид в Uma.Tech. Работал Data Scientist в Сбербанке.
Тимлид команды Data Science более двух лет
Модули >>>
ИГОРЬ КОТЕНКОВ
Работал 1.5 года в X5, до этого - в Сбербанк-Технологиях. Ведёт стажировки, готовит разборы передовых статей для команды. В 2019 получил звание мастера на международной платформе анализа данных Kaggle: 1 золотая медаль и 2 серебряных.
Аналитик-разработчик машинного обучения в Яндексе
Модули >>>
АЛЕКСАНДР САХНОВ
За время работы увеличил чувствительность анализа и A/B-экспериментов более чем в 100 раз. Ведёт курсы «Основы стохастики. Стохастические модели» и «Прикладная математическая статистика в машинном обучении» в Школе анализа данных Яндекса.
Руководитель отдела мультивариативного анализа в X5 Retail Group более двух лет
Модули >>>
ВЛАДИСЛАВ ЛАДЕНКОВ
Тимлид разработки в небольшом стартапе. Преподает в Х5 Академии.
Занимается инфраструктурой в команде речевых технологий Х5
Модули >>>
ОТЗЫВЫ СТУДЕНТОВ /
О БЛОКЕ ДИНАМИЧЕСКОЕ ЦЕНООБРАЗОВАНИЕ

Проект интересный, с первого раза выполнить не просто. Материалы полезные, направленные на бизнес. преподаватель и менторы всегда готовы ответить на вопросы. блок отличный, но есть куда развиваться
Студент первого потока
О БЛОКЕ РАНЖИРОВАНИЕ И МАТЧИНГ

Очень интересная тема, прекрасная подача. Игорь был очень активен на всем протяжении курса, отвечал на все вопросы, помогал с домашками Большое спасибо преподавателям, в частности Игорю за увлекательную подачу материала, интересные задания и проявленную активность!
Студент первого потока
О БЛОКЕ РАНЖИРОВАНИЕ И МАТЧИНГ

Изначально, данный модуль казался мне наименее интересным из все программы. Но уровень подачи и дз изменили моё мнение. Я реально ощутил прирост в навыках и знаниях всего за месяц.
Студент первого потока
О БЛОКЕ РАНЖИРОВАНИЕ И МАТЧИНГ

Непростой, насыщенный блок. С заданиями иногда приходилось повозиться, но пользу это приносило пропорционально затраченному времени. Спасибо преподавателю за оперативные и полезные ответы на вопросы как по заданиям, так и вне рамок курса! Преподаватель практически все время в сети, оперативно и исчерпывающе отвечал на вопросы, своевременно вносил корректировки в формулировки заданий и делился дополнительными материалами.
Студент первого потока
ДЕМО-ВЕРСИЯ
Лекции, конспекты, задания и разборы этих заданий от наших преподавателей.
ПОЛНАЯ ВЕРСИЯ
+ Модуль «Ранжирование и матчинг»
+ Модуль «Динамическое ценообразование»
+ Модуль «Uplift-моделирование»
+ Модуль «A/B-тестирование при помощи ML»
+ Модуль «Поддержание жизни ML-модели»
Все модули курса. Доступ к поддержке от наших преподавателей, готовых ответить на любые вопросы. Возможность работы на удалённом сервере.
+ 3 лекции модуля «Ранжирование и матчинг»
— Модуль «Uplift-моделирование»
— Модуль «динамическое ценообразование»
— Модуль «A/B тестирование при помощи ML»
— Модуль «Поддержание жизни ML модели»
0 ₽
Доступ к курсу открывается сразу после нажатия на кнопку ниже.
180 000 ₽
Скидка 30 000 ₽
при полной оплате
ПОЛНАЯ ОПЛАТА:
150 000 ₽
Оплата в течение
5 месяцев
ПОМЕСЯЧНО:
36 000 ₽
УЗНАТЬ БОЛЬШЕ
Мы свяжемся с вами и ответим на все ваши вопросы по курсу. Если вы хотите оплатить курс, перейдите по этой ссылке.
Удобный способ связи
FAQ
Какой уровень требуется для прохождения курса?
Этот курс будет полезен как тем, кто уже обладает знаниями в машинном обучении и хочет узнать, как решать специфичные проблемы, так и тем, кто хочет с нуля научиться выстраивать сервисы с использованием ML.
Можно ли посмотреть отзывы уже прошедших курс студентов?
Это первый запуск курса. Как студенты первого потока вы получите доступ ко всем обновлениям в течение года, если курс будет обновляться.
Как оформить поэтапную оплату?
Поэтапная оплата происходит равными платежами раз в месяц. Для оплаты поэтапно просто перейдите по ссылке на странице оплаты.
Как проходит обучение?
Вы смотрите лекции, выполняете домашние задания на удалённом сервере. А если у вас появляются вопросы, вы можете задавать их менторам или преподавателям в Slack.
Если я пропущу лекцию, смогу ли я посмотреть её потом?
Да, конечно. Записи лекций будут вам всегда доступны.
Какой язык программирования мы будем использовать?
Мы будем использовать Python, потому что он является удобным и популярным языком, что делает его стандартом мира Data Science.
Какие технологии будут использоваться на курсе?
На курсе будут использоваться все самые популярные технологии, которые являются стандартом качества для ML-инженеров в компаниях по всему миру.
Могу ли я получить помощь в перерывах между занятиями?
Конечно. Все студенты курса общаются с преподавателями и между собой в Slack. В чате можно задать любые вопросы по обучению,  наши преподаватели обязательно ответят вам.
Зачем платить деньги, если я могу пройти ваши бесплатные курсы?
Справедливое замечание. В открытых источниках есть много бесплатной информации, например, курсы на Stepik.

Однако не всем подходит формат самостоятельного обучения. Обучаясь в компании  опытных наставников и других студентов, вы получите ощутимые результаты значительно быстрее.
Я начал курс, но мне не понравилось. Вы вернёте деньги?
Да. В течение двух недель после начала курса вы можете вернуть оплату за весь курс. Также в течение месяца мы готовы вернуть вам сумму за вычетом уже пройденного материала.
Получу ли я сертификат?

Конечно! После успешного завершения курса вы получите электронный сертификат, подтверждающий его прохождение.


Для этого необходимо выполнить два условия:

1. Сделать не менее половины домашних заданий курса.

2. Выполнить финальный проект и получить на него рецензию.


Однако важно помнить, что как при приёме на работу, так и непосредственно в работе главное — это полученные Hard и Soft Skills.

Есть ли у вас образовательная лицензия?
Нет. Мы оказываем информационно-консультационные услуги.
У меня есть свои задачи по работе с данными, которые я хочу научиться решать. Поможет ли мне ваш курс?
Уверены, что поможет. Вы всегда можете посоветоваться в чате с кураторами или другими студентами.
ПОДРОБНЕЕ О КУРСЕ
Каждый преподаватель расскажет о своём модуле и его технических аспектах. Вы узнаете, в чём уникальность каждого модуля, сколько вам понадобится времени на его освоение и как всё это применяется в ведущих IT-компаниях.
ПО ЛЮБЫМ ВОПРОСАМ ОБРАЩАЙТЕСЬ ЧЕРЕЗ ФОРМУ НА САЙТЕ ИЛИ НА НАШУ ПОЧТУ
ПО ЛЮБЫМ ВОПРОСАМ ОБРАЩАЙТЕСЬ 
НА НАШУ ПОЧТУ
УЗНАТЬ БОЛЬШЕ
Мы свяжемся с вами и ответим на все ваши вопросы по найму учеников.