Язык: английский

Преподаватели: Алексей Драль (руководитель специализации), Эмели Драль, Павел Мезенцев, Илья Трофимоф, Павел Клеменков, Евгений Рябенко, Иван Пузыревский, Наташа Притыковская, Евгений Фролов, Владимир Лесниченко

Для кого: студенты и выпускники

Программа из четырёх курсов и проектов предназначена в первую очередь для людей, которые стремятся научиться работать с большими объёмами данных — хранить их и строить отказоустойчивые эффективные системы обработки. Однако специализация будет полезна и тем, кто занимается интеллектуальным анализом данных.

В процессе обучения вы приобретёте навыки использования современных платформ и инструментов — например, Hadoop, Spark, Hive. Вы выполните четыре проекта — каждый следующий сложнее предыдущего — и поймёте, как решать самые частые задачи, связанные с большими данными. Пройдя всю программу, научитесь обрабатывать данные разными способами, использовать на больших данных методы машинного обучения и внедрять эти методы в продукты.

Чтобы учиться, нужно иметь опыт программирования на Питоне и базовые знания об алгоритмах. Знать о машинном обучении необязательно, но это поможет проходить третий курс специализации.

Также в подготовке курсов принимали участие: проф. Михаил Абрамович Ройтберг, Антон Горохов, Олег Сухорослов, Олег Ивченко, Павел Ахтямов, Владимир Кузнецов, Ася Ройтберг, Евгений Баулин, Марина Сударикова.

Партнер курса:

BigDataTeam