Интенсив
по большим данным

Участники узнают как обрабатывать, анализировать и визуализировать массивы больших данных, чтобы решать прикладные задачи в современном датацентричном мире.

Посмотреть обращение команды интенсива к будущим участникам.

Чтобы принять участие в интенсиве, зарегистрируйтесь до 18 сентября и выполните отборочные задания. Они появятся на платформе LMS 9 сентября: ссылка придёт на почту после регистрации. 

регистрация завершена

Научим анализировать большие массивы данных

  • Для обучения необходимы

    — Знание языка Python: синтаксис, основные конструкции, встроенные типы данных

     

    — Знание базовых алгоритмов обработки списочных данных: фильтрация, сортировка и поиск

     

    — Знание словарей: группировка по ключу

     

    — Опыт работы с итераторами, навыки организации потокового ввода и вывода данных через stdin и stdout

  • Что будут знать и уметь выпускники

    — Понимать, как хранятся большие данные в распределенных файловых системах

     

    — Обрабатывать большие данные с использованием парадигмы MapReduce

     

    — Применять алгоритмы извлечения, фильтрации, преобразования, соединения и агрегирования больших данных

     

    — Делать разведочный анализ данных для понимания их внутренней структуры и взаимосвязей

     

    — Создавать витрины данных, визуализировать датасеты и строить дашборды

     

    — Извлекать из данных полезную информацию и делать обоснованные выводы

     

    — Создавать конвейеры для регулярной обработки больших данных

Что вас ждет в программе курса

регистрация завершена