MACHINE LEARNING ДЛЯ НАЧИНАЮЩИХ. ОБУЧЕНИЕ У НАС |
Статистика, математика и Python. Всё, что нужно для сильного старта в ML.
СТАРТ ПРОГРАММЫ
11 МАЯ 2021
ФОРМАТ ОБУЧЕНИЯ
ОНЛАЙН
КОМУ ПОДОЙДЁТ
С НУЛЯ
ПОЭТАПНАЯ ОПЛАТА
НА 6 МЕСЯЦЕВ
ЯН ПИЛЕ
ПОЛУЧИТЕ НЕОБХОДИМУЮ
БАЗУ ДЛЯ РАБОТЫ В СФЕРЕ
|
Стремительный рост корпораций и интернет-бизнеса дал толчок в развитии таким направлениям, как прикладная статистика и машинное обучение. С каждым годом всё больше специалистов желают перейти в эти «горячие» сферы, а значит растёт и количество образовательных курсов. Однако найти среди них программу, которая давала бы как фундаментальные, так и прикладные знания, довольно тяжело. Поэтому мы решили взять дело в свои руки!

На этом курсе мы дадим вам всю необходимую базу для освоения ML и научим решать классические задачи, востребованные бизнесом. С полученными знаниями вы сможете самостоятельно углубиться в интересующую вас область машинного обучения и освоить самые продвинутые алгоритмы.
ОБУЧЕНИЕ ПРОХОДИТ В ИНТЕНСИВНОМ ФОРМАТЕ ПО 3 ЗАНЯТИЯ В НЕДЕЛЮ
Все лекции курса доступны в записи
ДОМАШНИЕ ЗАДАНИЯ ВЫ РЕШАЕТЕ НА НАШЕЙ ИНФРАСТРУКТУРЕ
На учёбу наши студенты тратят в среднем 10 часов в неделю
ЯН ПИЛЕ
Руководитель группы аналитики поиска Mail.ru
КАК ПРОХОДИТ ОБУЧЕНИЕ
Первый этап →
Второй этап →
Третий этап →
ПОГРУЖАЙТЕСЬ В ML C НУЛЯ
— Изучайте необходимую базу Machine Learning
— Решайте задачи, приближенные к реальным
— Занимайтесь в любое удобное время
ИСПОЛЬЗУЙТЕ НАШУ ИНФРАСТРУКТУРУ
— Работайте на выделенном сервере
— Практикуйтесь на данных из реальных задач
— Изучайте решения преподавателей и других студентов
ЗАДАВАЙТЕ ЛЮБЫЕ ВОПРОСЫ В ПОДДЕРЖКУ
— Обсуждайте задачи и проекты с преподавателями и менторами
— Вашими наставниками будут ML-инженеры из ведущих компаний России
ДЛЯ КОГО ЭТА ПРОГРАММА:
СТАРТ КАРЬЕРЫ
Курс подойдет тем, кто хочет изучить машинное обучение, но не знает, с чего начать. Погрузиться в ML сможет каждый – как начинающий специалист, так и энтузиаст. Однако будьте готовы к тому, что вам придется освоить необходимую математическую базу и усердно потрудиться.

УЖЕ РАБОТАЕТЕ В IT
Если вы уже работаете в сфере IT, данный курс поможет вам расширить свои знания и применить их в различных областях машинного обучения. Сейчас ML-инженеры с широким списком Hard skills крайне востребованы на рынке труда.
ПРОГРАММА КУРСА ://
|
Язык программирования Python является одним из самых популярных инструментов для анализа данных, так как позволяет не только использовать наиболее распространённые статистические методы и алгоритмы машинного обучения, но и даёт возможность работать с базами данных и разрабатывать бэкенд приложений. В данном блоке мы рассмотрим базовые возможности языка, которые могут пригодиться специалисту по анализу данных и машинному обучению.
Открыть программу
1. Типы и структуры данных
Устроим экскурс в простые типы данных и операции над ними. Также рассмотрим коллекции: списки, кортежи, словари и генераторы.
2. Логические выражения и циклы
Расскажем про построение логических выражений в языке Python, а также про конструкции для написания циклов.
3. Пользовательские функции
Обсудим написание собственных функций и работу с аргументами.
4. Сложность вычислений
Поговорим о том, как понять, что написанный код эффективен и можно ли сделать его лучше.
5. Классы
Проведем небольшой экскурс в объектно-ориентированное программирование с характерными для Python особенностями.
6. Импорт библиотек. Numpy, Pandas, Matplotlib, Seaborn
Продемонстрируем работу импорта библиотек на примере одних из самых популярных для анализа данных.
7. PyTorch
Установим PyTorch и проверим его работоспособность.
|
Хорошие знания математического анализа и алгебры являются залогом успешной работы в области машинного обучения. Понимание этих дисциплин позволит вам не просто бездумно использовать большинство алгоритмов машинного обучения, а делать это осмысленно, правильно подготавливая и настраивая данные.
Открыть программу
1. Основы линейной алгебры, векторы, векторное пространство
Проведем экскурс в основные определения линейной алгебры и главные математические операции с векторами. Поработаем с векторным пространством.
2. Матрицы
Поговорим про основные операции над матрицами. Рассмотрим определители матрицы и их типы. Поработаем с матрицами на языке Python.
3. Методы решения систем линейных алгебраических уравнений
Обсудим, где встречаются системы линейных уравнений и для чего их нужно уметь решать. Расскажем про метод Гаусса и LU-разложение.
4. Понятие функции действительного аргумента. Предел функции, непрерывность и производная.
Поговорим про понятие предела функции, рассмотрим определение непрерывности функции и классификацию точек разрыва. Расскажем про производную и ее геометрический смысл.
5. Функции многих переменных. Частная производная и градиент
Обсудим понятие функции многих переменных. Рассмотрим частные производные, градиент функции многих переменных, а также производную по направлению.
6. Интегральное исчисление и приближенное вычисление интегралов
Разберём понятие интеграла и правила вычисления интегралов с помощью ручки и бумаги. Рассмотрим приближённые методы их расчёта на Python и поймём, для чего все это нужно.
7. Матричная факторизация
Обсудим сингулярное разложение матриц и некоторые другие полезные в хозяйстве матричные разложения.
|
Cтатистика является неотъемлемой частью любого анализа данных, в том числе и машинного обучения. В этом модуле мы расскажем, как формируется выборка (ведь в машинном обучении мы тоже работаем с выборками), как описывать данные и как сравнивать между собой две выборки. Также мы объясним, что делать, если необходимо сравнить несколько выборок, и как найти взаимосвязь между разными показателями в датасете.
Блок проводится совместно с партнёром
Открыть программу
1. Основные понятия теории вероятностей
Вспомним понятие вероятности и некоторые ее свойства, рассмотрим условную вероятность и теорему Байеса.
2. Основные понятия статистики. Меры разброса и меры центральной тенденции
Рассмотрим такие понятия, как выборка, генеральная совокупность, среднее, мода, медиана и квантили. Поймём, что с помощью этих понятий можно описывать.
3. Распределения и ЦПТ
Рассмотрим некоторые полезные виды распределений и обсудим применение Центральной Предельной Теоремы.
4. Распределения, производные от нормального, и доверительные интервалы
Посмотрим на важные распределения, которые получаются из нормального. Поговорим об интервальной оценке параметров распределений.
5. Параметрические критерии
Обсудим критерии, использующие какое-то конкретное семейство распределений: критерии долей, Z-тесты. Поговорим про проверку на нормальность, тест хи-квадрат и QQ-график.
6. Непараметрические критерии
Рассмотрим методы анализа статистических тестов, не использующие предположения о характере распределений. Поговорим про критерии знаков и критерий Манна-Уитни.
7. Корреляция. Множественная проверка гипотез
Рассмотрим корреляцию как простейший способ анализа взаимосвязи между переменными. Обсудим проблему множественного сравнения при тестировании гипотез. Поговорим про различные поправки на множественное сравнение в разных тестах.
8. Дисперсионный анализ (ANOVA)
Рассмотрим дисперсионный анализ как метод сравнения нескольких выборок. Поговорим про однофакторный и многофакторный дисперсионный анализ.
9. Введение в проблематику A/B-тестов
Поговорим про современные подходы к экспериментам и обсудим, почему так важна статистика, как работают команды экспериментов в разных компаниях и почему им уделяется столько внимания.
10. Bootstrap
Bootstrap — это мощный набор инструментов, который позволяет рассчитывать крайне сложные метрики и проводить эксперименты при помощи ресэмплинга. На лекции разберём его теоретические и практические допущения.
11. A/A-тесты
A/A-тесты — необходимый и полезный этап эксперимента, который позволяет убедиться, что наша система сплитования трафика не сломана. Нарушения в её работе могут привести к тому, что результат эксперимента будет объясняться не качеством гипотезы, а техническими проблемами.
12. Тестирование на примере метрик-отношений
Рассмотрим применение различных статистических методов к анализу метрик-отношений, например, CTR, и сделаем общий пайплайн для проверки работоспособности методов для разных видов распределений.
13. Понижение дисперсии с использованием предэкспериментальных данных
Разберемся, как стратификация и CUPED (Controlled-experiment Using Pre-Experiment Data) могут помочь понизить дисперсию вашей метрики.
14. Многорукие бандиты

Разберёмся, как можно менять размер групп в А/B-тестах в зависимости от того, какие результаты мы наблюдаем. Рассмотрим, как в данном случае необходимо использовать известную до эксперимента информацию и причём здесь бандиты.
|
Чтобы разделить объекты по признакам или предсказать, как изменится определенная величина в зависимости от изменения ряда факторов, не обязательно писать сложные нейронные сети и разрабатывать алгоритмы. В данном блоке мы рассмотрим классические алгоритмы машинного обучения, которые применяются для решения большого количества задач в топовых компаниях.
Открыть программу
1. Вводная лекция: что такое машинное обучение и с чем его едят
Проведем краткий обзор основных методик, используемых в машинном обучении. Рассмотрим, какие задачи можно решать с помощью методов машинного обучения.
2. Линейные модели регрессии
Подробно рассмотрим линейные модели регрессии. Узнаем, в каких областях их можно применять и какие в их отношении существуют ограничения. Кроме того, научимся правильно подготавливать данные для анализа.
3. Линейные модели классификации
Разберём применение линейных моделей к задачам классификации. Рассмотрим преобразование признаков и функцию ошибки.
4. Деревья решений
Научимся использовать один из самых популярных и простых алгоритмов машинного обучения, а также узнаем, как правильно подобрать параметры.
5. Случайные леса
Усилим предсказательную силу нашего дерева решений, объединив результаты нескольких алгоритмов.
6. Uplift моделирование
Часто приходится иметь дело с ситуациями, когда моделируются отток пользователя или вероятность возврата кредита после телефонного звонка-напоминания из банка.

В таких случаях возникают справедливые вопросы:
1. Допустим, вероятность оттока равна 20%. Что делать дальше? Ведь мы не обсуждали то, как изменится вероятность, если клиенту, например, предложить новый выгодный тариф. Может быть, он все равно уйдет?
2. Допустим, вероятность, что человек вернёт кредит после звонка равна 90%. Но человек, возможно, и так вернул бы кредит. Может быть, мы зря потратили деньги на звонок?

Именно на такие вопросы и пытается ответить Uplift моделирование.
7. Методы отбора признаков
Обсудим частый вопрос, который встает перед специалистом – какие именно признаки наиболее существенны и какие из них следует брать в анализ.
8. Градиентный бустинг
Рассмотрим, пожалуй, самый используемый классический метод машинного обучения, применим его на практике и поймем, чем же он так хорош.
9. Различные градиентные методы оптимизации
Ранее мы использовали метод градиентного спуска для минимизации функции ошибки, однако во многих случаях его можно модифицировать для получения лучших результатов. Посмотрим, как это сделать и для чего это нужно.
10. Методы кластеризации
В данной лекции мы рассмотрим основные алгоритмы кластеризации, а также подходы к выбору алгоритма в зависимости от особенностей данных.
11. Модели предсказания временных рядов
Временные ряды встречаются в огромном количестве приложений: от динамики бизнес-показателей до электромагнитных сигналов и аудиозаписей. Мы разберём авторегрессионные методы их прогнозирования, способы проверки стационарности и варианты декомпозиции.
|
Каждый хоть раз в жизни слышал о таком понятии, как «искусственный интеллект на нейросетях». В этом блоке мы поймем, что такое нейросети и с чем связан взрывной рост интереса к ним в последние годы. На лекциях разберём «кирпичики», из которых состоят современные нейросети, поговорим о применении нейросетей к картинкам и текстам, обсудим создание векторных представлений объектов (эмбеддингов) и научимся дообучать уже подготовленные нейросети для решения ваших собственных задач.
Открыть программу
1. Вводная лекция: что такое нейронные сети и с чем их едят
Рассмотрим основные типы нейронных сетей и поймём, для каких задач их можно использовать.
2. Полносвязные нейросети. Метод обратного распространения ошибки
Обсудим полносвязные нейросети и подробно разберём способ обновления весов при признаках.
3. Свёрточные сети. Виды слоёв в свёрточных сетях
Поговорим о том, из каких составных частей состоят свёрточные сети и для чего вообще придумали свёртки.
4. Свёрточные сети для изображений
Анализ изображений является одной из основных задач, для решения которых используются нейронные сети. Расскажем о том, как обучить нейронную сеть распознавать, что изображено на картинке, и классифицировать изображения.
5. Примеры архитектур сетей + ссылки на статьи (примеры для картинок)
Разберём, какие виды сетей применялись и применяются для анализа изображений. Решим важнейшую с прикладной точки зрения задачу – дообучение предобученной нейросети для решения собственных задач, связанных с анализом изображений.
6. Свёрточные сети для текстов, построение эмбеддингов: Word2Vec, GloVe и Fasttext
Второй важнейшей сферой применения нейросетей является анализ текстов. Разберём, какие задачи здесь решаются и чего нам не хватало до сих пор. Также начнём разговор о векторном представлении текстов.
7. Рекуррентные нейросети, GRU и LSTM
Наши сети до сих пор работали по принципу feed forward (когда каждый слой связан только со смежными). Теперь посмотрим, что получится, если добавить связи между несоседними слоями, а также поймём, ради чего нужно было городить огород.
8. Сиамские нейросети, DSSM и определение семантической близости
Часто необходимо научиться сопоставлять близость запроса и ответа (как в задачах поиска) или находить фразы, имеющие один и тот же смысл, но выраженный разными словами (например, однотипные вопросы в чате службы поддержки). Посмотрим, с помощью какого типа моделей решаются такие задачи.
9. Трансформеры и BERT
Перейдём к рассмотрению передовых типов технологий в области языковых моделей. Поговорим про модель BERT и посмотрим, что же в ней такого хорошего. Также дадим ссылки на ряд BERT-подобных архитектур.
10. Дообучение BERT под вашу задачу
Разберём применение предобученного трансформера для решения конкретной задачи и предложим вам сделать что-то подобное, но вовсе не обязательно на основе BERT. Так что приготовьтесь экспериментировать.
|
На рынке труда грамотная презентация своих навыков порой так же важна, как и сами навыки, а неумение правильно вести коммуникацию может помешать устроиться на работу даже опытному аналитику. В этом блоке мы обсудим базовые вопросы, касающиеся поиска работы в области анализа данных, на примерах рассмотрим разные этапы поиска работы и зададим вопросы профессиональному рекрутеру одной из крупнейших IT-компаний России.
Открыть программу
1. Разные роли аналитика в бизнесе
Обсудим, какие бывают аналитики, чем аналитик в стартапе отличается от аналитика в корпорации и какие типовые задачи решает аналитик в продуктовой команде. Поговорим о том, как индустрия, организационная структура и зрелость компании влияют на задачи аналитика. Также затронем тему ценности аналитики для бизнеса.
2. Собеседование и резюме
Поговорим о том, что тимлиды ищут в Junior-аналитиках. Рассмотрим, как правильно представлять свои достижения и завершённые проекты, подготовимся к типичным задачам на собеседованиях.
3. Интерактивное занятие
Обсудим, уточним и дополним присланные студентами резюме. После внесения изменений проведём отбор резюме и поговорим о требованиях к кандидатам. Проведём онлайн-скрининг с одним из студентов.
ПОЛНАЯ ВЕРСИЯ
+ Модуль «Python»
+ Модуль «Математика»
+ Модуль «Статистика»
+ Модуль «Классические ML-алгоритмы»
+ Модуль «Введение в нейронные сети»
+ Модуль «Как искать работу»
+ Поддержка от преподавателей
+ Работа на удалённом сервере
Все модули курса. Доступ к поддержке от наших преподавателей, готовых ответить на любые вопросы. Возможность работы на удалённом сервере.
20 000 ₽
100 000 ₽
ПОМЕСЯЧНО:
ПОЛНАЯ ОПЛАТА:
Оплата в течение
6 месяцев
Скидка 20 000 ₽
при полной оплате
120 000 ₽
ЕСЛИ ЭТОТ КУРС КАЖЕТСЯ ВАМ ЛЕГКИМ
ЗАПИСАТЬСЯ
НА SOFT ML
Если текущая программа кажется вам сложной, оставьте заявку на более лёгкий курс по ML. Мы оповестим вас о выходе программы.
У НАС ПРЕПОДАЮТ:
УЧИТЕСЬ У >ЛУЧШИХ>
ЯН ПИЛЕ
Преподаватель Python и прикладной статистики на программах профессиональной переподготовки ФКН ВШЭ. Опыт работы более 6 лет в ML и анализе данных.
Руководитель группы аналитики поиска Mail.ru
Модули >>>
СЕРГЕЙ ДРОЖЖИН
Более 5 лет опыта работы аналитиком. Работал в Tinkoff, UniCredit.
Senior Data Scientist в ОТП Банк
Модули >>>
АЛЕКСАНДРА ОВСЯННИКОВА
Работает в направлении анализа данных коммерческой недвижимости. Ранее занималась поиском фрода в Citibank и Mail.ru.
Аналитик данных в Циане
Модули >>>
ЛАВРЕНТИЙ ДАНИЛОВ
Выпускник СПбГУ, аспирант кафедры Генетики и Биотехнологии СПбГУ, аналитик в компании EPAM.
Аналитик в компании EPAM
Модули >>>
ИСКАНДЕР МИРМАХМАДОВ
Сооснователь EXPF
Главный аналитик AIC. Более 5 лет опыта работы в аналитике данных. Работал с МВидео, CityMobil, Аэрофлот, Райффайзен Банком.
Модули >>>
ВИТАЛИЙ ЧЕРЕМИСИНОВ
Сооснователь EXPF
Последние 5 лет занимается консалтингом и помогает разным продуктам решать задачи по анализу данных, экспериментам и ML.
Модули >>>
АЛИНА ДУБОДЕЛОВА
HR в Яндекс.Маркет
Модули >>>
Работала в страховой компании Гелиос, сейчас HR в Яндекс.Маркет
УЗНАТЬ БОЛЬШЕ
Мы свяжемся с вами и ответим на все ваши вопросы по курсу. Если вы хотите оплатить курс, перейдите по этой ссылке.
Удобный способ связи
FAQ
Какой уровень требуется для прохождения курса?
Этот курс будет полезен как тем, кто уже обладает знаниями в области машинного обучения и хочет узнать, как решать специфичные проблемы, так и тем, кто хочет с нуля научиться строить сервисы с использованием машинного обучения.
Можно ли посмотреть отзывы уже прошедших курс студентов?
Это первый запуск курса. Как студенты первого потока вы получите доступ ко всем обновлениям в течение года, если курс будет обновляться.
Как оформить поэтапную оплату?
Поэтапная оплата происходит равными платежами раз в месяц. Для оплаты поэтапно просто перейдите по ссылке на странице оплаты.
Как проходит обучение?
Вы смотрите лекции, выполняете домашние задания на удалённом сервере. А если у вас появляются вопросы, вы можете задавать их менторам или преподавателям в Slack.
Если я пропущу лекцию, смогу ли я посмотреть её потом?
Да, конечно. Записи лекций будут вам всегда доступны.
Какой язык программирования мы будем использовать?
Мы будем использовать Python, потому что он является удобным и популярным языком, что делает его стандартом мира Data Science.
Какие технологии будут использоваться на курсе?
На курсе будут использоваться все самые популярные технологии, которые являются стандартом качества для ML-инженеров в компаниях по всему миру.
Могу ли я получить помощь в перерывах между занятиями?
Конечно. Все студенты курса общаются с преподавателями и между собой в Slack. В чате можно задать любые вопросы по обучению, наши преподаватели обязательно ответят вам.
Зачем платить деньги, если я могу пройти ваши бесплатные курсы?
Справедливое замечание. В открытых источниках есть множество бесплатной информации, например, курсы на Stepik.

Однако не всем подходит формат самостоятельного обучения. Обучаясь в компании опытных наставников и других студентов, вы получите ощутимые результаты значительно быстрее.
Я начал курс, но мне не понравилось. Вы вернете деньги?
Да. В течение двух недель после начала курса вы можете вернуть оплату за весь курс. Также в течение месяца мы готовы вернуть вам сумму за вычетом уже пройденного материала.
Получу ли я сертификат?

Конечно! После успешного завершения курса вы получите электронный сертификат, подтверждающий его прохождение.


Для этого необходимо выполнить два условия:

1. Сделать не менее половины домашних заданий курса.

2. Выполнить финальный проект и получить на него рецензию.


Однако важно помнить, что как при приёме на работу, так и непосредственно в работе главное — это полученные Hard и Soft Skills.

Есть ли у вас образовательная лицензия?
Нет. Мы оказываем информационно-консультационные услуги.
У меня есть свои задачи по работе с данными, которые я хочу научиться решать. Поможет ли мне ваш курс?
Уверены, что поможет. Вы всегда можете посоветоваться в чате с кураторами или другими студентами.
ПО ЛЮБЫМ ВОПРОСАМ ОБРАЩАЙТЕСЬ НА НАШУ ПОЧТУ
ПО ЛЮБЫМ ВОПРОСАМ ОБРАЩАЙТЕСЬ 
НА НАШУ ПОЧТУ
ХОТИТЕ НАНЯТЬ НАШИХ СТУДЕНТОВ?
Каждый месяц у нас выпускаются новые ученики. Мы бесплатно поможем вам с наймом. Оставьте заявку, и мы с вами свяжемся.
УЗНАТЬ БОЛЬШЕ
Мы свяжемся с вами и ответим на все ваши вопросы по найму учеников.