Закончил бакалавриат Университета ИТМО по направлению «Физика наноструктур». Удалось немного поработать исследователем, выпустить статью, но это продлилось около полугода. На первом курсе магистратуры начал понемногу втягиваться в область анализа данных.
До симулятора уже был опыт прохождения различных курсов по машинному и глубокому обучению.
На симулятор я решил пойти, поскольку на предыдущих курсах мне казалось, что все задачи как бы немного оторваны от реальной работы ML-инженера, а в симуляторе как раз должны были быть реальные кейсы, по сути, как стажировка. И это оказалось правдой :)
Но всё же основной мотивацией было желание пополнить своё портфолио интересными задачами и проектами, о которых было бы не стыдно говорить на собеседовании. Рад, что это удалось сделать :)
Симулятором остался очень доволен. Понравилось, что задачи разделены по уровням и ты сам выбираешь, какую задачу тебе решать. Больше всего понравились задачи уровня middle, так как это многосоставные задачи с некоторым сюжетом, которые приходилось делать несколько дней, а то и несколько недель. Например, задача предсказания оттока, где нужно не просто построить модель, но и провести целый ETL-пайплайн с дальнейшим feature-инжинирингом. Или взять задачу о неуверенности моделей (boosting uncertainty), где нужно прочитать статью и самому имплементировать виртуальный ансамбль, который позволяет оценивать уверенность предсказаний. От решения таких задач получаешь удовольствие :)
Но и из задач уровней intern и junior тоже получилось извлечь много полезного: это и построение асимметричных метрик, работа с SQL, обработка данных с помощью библиотеки pandas, работа с регулярными выражениями и т. д. В общем, я уверен, что каждый для себя сможет найти в симуляторе что-то полезное, будь он новичок или уже специалист.
Удалось пополнить своё портфолио интересными задачами. Наконец-то разобрался в бутстрапе, так как ему было уделено много задач. Сильно прокачал SQL, особенно оконные функции. Научился делать парсинг данных с помощью библиотек Python. В целом прокачались навыки написания кода на pandas и numpy, что позволяет уверенно выполнять тестовые задания.
Очень радует, что разработчики симулятора поддерживают связь со студентами и принимают во внимание их пожелания по задачам. Также выражаю большую благодарность преподавателям и кураторам, которые помогали, если задача ставила в тупик.