Инструменты в помощь аналитику данных

«Коробочные» решения, библиотеки для глубинного обучения и сервисы для создания интерактивных графиков

Инструменты в помощь аналитику данных

Анализ данных

Подборка полезных библиотек и сервисов для тех, кто хочет работать аналитиком — или освоить анализ данных для себя.

Python для анализа данных

Знание языка программирования Python — одно из самых распространённых требований для вакансий аналитика. А чтобы упростить написание кода на нём, можно воспользоваться библиотеками: шаблонами решений для стандартных задач.

Jupyter

alt

Jupyter Notebook — бесплатная интерактивная оболочка для Python. Она позволяет объединить код, текст и диаграммы — и делиться результатом с другими пользователями.

Библиотеки

Pandas

Pandas пригодится для анализа неполных и неупорядоченных данных (в таком виде они чаще всего и встречаются в жизни). В этой библиотеке есть готовые методы для их фильтрации, группировки и объединения.

TensorFlow

TensorFlow — библиотека для глубинного обучения, разработанная в Google. Она нужна, чтобы тренировать нейронные сети для автоматического нахождения и классификации образов.

Она пригодится для:

  • Распознавания речи и изображений
  • Работы с текстом
  • Анализа временных рядов
  • Распознавания объектов на видео

NumPy и SciPy

NumPy упрощает работу с векторами и матрицами: от расчета определителей матриц до решения линейных уравнений. SciPy расширяет возможности первой библиотеки и позволяет работать с вероятностными распределениями и интегральным исчислением.

Matplotlib

alt

Matplotlib пригодится для создания графиков: от круговых диаграмм до контурных схем.

«Коробочные» решения

Готовые решения для анализа данных пригодятся тем, кто пока не умеет программировать — но уже хочет получить инсайты о продукте. Основной недостаток: платное использование.

Mixpanel

alt

С помощью сервиса можно увидеть, как клиенты взаимодействуют с вашим приложением или сайтом и найти закономерности в их поведении. Также сервис позволяет проводить A/B-тестирования — эксперименты, в ходе которых тестируется, как изменения в продукте влияют на пользовательский опыт.

Amplitude

alt

Amplitude помогает отследить, как меняются и от чего зависят продуктовые метрики (например, конверсия в платящих пользователей). Так, в сервисе можно задать долгосрочную цель вашего сервиса и проанализировать, что поможет её достижению.

Tableau

alt

Tableau — это корпоративная система бизнес-аналитики. С её помощью можно подготовить (упорядочить и промаркировать) данные для анализа, найти в них закономерности и визуализировать выводы.

Другое

Если вам не хватает стандартных инструментов, то вы можете воспользоваться сервисами для отдельных задач: например, для создания интерактивных графиков или работы с маркетинговыми данными.

Plotly

alt

Plotly нужен для создания сложной визуализации: например, интерактивных или 3D-графиков.

Improvado.io

alt

Improvado — сервис для маркетинговой аналитики. С его помощью можно агрегировать данные с разных платформ в один инструмент: например, Tableau, Excel или Looker.

Больше по теме

Анализ данных, Разработка, Дизайн

10 самых популярных видеокурсов от Computer Science Center

Посмотрите лекции по дискретной математике, программированию, анализу данных и на многие другие темы

Анализ данных, Дизайн, Разработка, Яндекс в вузах

Какие онлайн-курсы можно пройти за две недели

Если вы решили оставаться дома и заняться самообразованием

Анализ данных

Открыт набор в Computer Science Center

Вечерние курсы по математике и программированию от ШАДа и компании JetBrains в Санкт-Петербурге и в Новосибирске.

Анализ данных, Яндекс в вузах

Как устроена совместная программа ШАДа и РЭШ

Подружить экономику и data science

Анализ данных, Яндекс в вузах

Сотрудник лаборатории Яндекса и МФТИ рассказывает о своих исследованиях

«Чтобы чувствовать себя хорошо, я постоянно должен что-то изучать»

Анализ данных, Менеджмент

Как переводчики в Яндексе помогают улучшать машинный перевод?

Руководитель группы лингвистической экспертизы Эми Кришневски о том, как связаны машинный перевод и работа её команды

Менеджмент, Анализ данных

Санитары леса: как устроен антифрод в Яндекс.Дзене

Борьба с накрутчиками, любителями эротической живописи и комментаторами-ненавистниками