Чем занимаются стажёры-аналитики в Яндексе

«Могу попасть в любую команду, и у каждой — свои задачи»

Чем занимаются стажёры-аналитики в Яндексе

Анализ данных

Аналитик — это специалист, который помогает бизнесу решать задачи. Он собирает, обрабатывает, изучает и анализирует данные, чтобы предложить решение. Такие специалисты нужны везде — от стартапа, разрабатывающего своё первое мобильное приложение, до международной сети ресторанов, которая хочет выйти на новый рынок. Задачи аналитиков, работающих в одной команде или в одном отделе, могут различаться. В зависимости от направления можно почувствовать себя не просто математиком с навыками программиста, но и детективом или даже предсказателем. Мы поговорили с тремя стажёрами-аналитиками Яндекса, чтобы узнать, в какие команды они попали, какие задачи решают и что больше всего им нравится в работе.

Тимур Асылхузин

Студент четвёртого курса мехмата МГУ. С февраля 2020 года проходит стажировку в службе аналитики, метрик и экспериментов Поискового портала.

alt

В университете мы изучаем в основном фундаментальную математику. Она далеко не всегда как-то соотносится с задачами, с которыми сталкиваешься в реальном мире. Поэтому я хотел понять, как обстоят дела в индустрии. К зиме четвёртого курса занятий в МГУ стало меньше, близилась сессия, и я подал несколько заявок на стажировки в разные компании, в том числе и в Яндекс.

Тестовое задание состояло из нескольких задач по программированию на Python. Дальше шли три очных собеседования. После второго вы формально уже приняты, остаётся только выбрать команду. Мне понравились ребята из группы анализа экспериментов, и я пошёл к ним.

Я понимал, что могу попасть в любую команду и что у каждой команды свои задачи. В этом одна из особенностей работы аналитика: задачи у всех разные, сферы тоже

Я попал в службу аналитики Поиска. У каждой команды в Яндексе есть свои метрики. На их основе принимаются решения, например, запускать ли сервис или обновления к нему. Мы занимаемся разработкой метрик для других сервисов Яндекса. У меня нет какой-то одной большой задачи, чаще это постоянный поток небольших заданий. Например, для Яндекс.Толоки. Это наша краудсорсинговая платформа, на которой можно выполнять небольшие задания в интернете и зарабатывать. При выполнении этих заданий у исполнителя растет тот или иной навык — так мы оцениваем умение выполнять задачи определенного типа.  

Я работаю над созданием таких навыков, инструкций и экзаменов, а также анализирую результаты экспериментов и автоматизирую небольшие процессы в рассылках. Для некоторых задач пришлось освоить пару новых библиотек Python.

Любой аналитик в Яндексе должен иметь математический склад ума и обладать базовым математическим аппаратом, чтобы разговаривать с командой на одном языке. Конечно, необходимо знать Python хотя бы на начальном уровне. Всё остальное просто подтянуть в процессе.

Как мне кажется, аналитик — это человек, который стремится к порядку, улучшению процессов вокруг. Он должен уметь видеть взаимосвязи между явлениями и строить логические цепочки

Моя стажировка длится всего полгода. В зависимости от количества часов в неделю, которые каждый стажёр может уделять работе, она может быть короче или длиннее. Мне очень повезло, что я успел поработать в офисе, сделать несколько задач и пообщаться с командой до режима самоизоляции. Так что переход на удалёнку прошёл безболезненно. 

Сложновато было вначале, когда я только пришёл. В Яндексе много внутренних сервисов, я не сразу понимал, о чём говорят коллеги. Но это нормальный процесс, через него проходят все сотрудники, нужно время, чтобы разобраться. Мне очень помогал куратор: рассказывал про всё и отвечал на вопросы. Это такой коллега из команды, который помогает новичку освоиться. До середины марта я приезжал на работу утром или вечером, пар было много. Сейчас часть занятий отменилась, я спокойно работаю утром, а вечером — учусь.

Мой руководитель отвечает за работу нескольких сервисов, общаемся мы нечасто. Больше коммуникации с аналитиком из команды, он-то и назначает мне задачи. Сначала мы обсуждаем вопрос устно, затем оформляем задачу в Трекере. Встреч у стажёров немного: ежедневные с командой и еженедельные с аналитиками. Приятно наблюдать, как ребята быстро решают задачи, задают правильные вопросы.  

Мне особенно нравится применять на практике то, что я узнал в университете. И приятно ощущать, что я приношу пользу.

Анна Першина

Студентка третьего курса факультета компьютерных наук Высшей школы экономики. С января 2020 года проходит стажировку в службе аналитики, метрик и экспериментов Поискового портала.

alt

В ноябре 2019 года в Вышке проходили пробные собеседования в Яндекс. Успешное прохождение засчитывалось за один из этапов отбора на стажировку. Я записалась, но ни на что не рассчитывала. Собеседование прошло хорошо, мне предложили сразу идти на следующий этап или перенести его на лето. Я решила не ждать. Уже четыре месяца тружусь в службе аналитики, метрик и экспериментов. За это время научилась работать с запросами для баз данных, большими данными, освоила Python, а также начала читать чужой код.

Понять, чем занимается группа анализа краудсорсинговых сигналов, в которой я работаю, довольно сложно. Объясню на примере. Я тоже работаю с сервисом Яндекс.Толока. Моя задача — находить и исследовать проблемные задания, разрабатывать навыки и задания для новых исполнителей так, чтобы снизить потерю качества и разумно сэкономить. Например, есть задания с уже известными ответами. Чтобы понять, насколько хорошо человек выполняет работу и определить его навык, нужно сравнить ответы с правильными.

Для каждого задания есть инструкция, но добросовестность её выполнения важно уметь измерять и контролировать. Если постоянно не оценивать качество данных крауда, которые Поиск и другие сервисы Яндекса используют для улучшения своих алгоритмов, вскоре это может привести к убыткам. Метрики, которые разрабатывает наша группа, основаны на понимании природы данных, с которыми мы работаем.

Я начинала с небольших задач, например, искала подход для анализа больших таблиц с помощью MapReduce. Исследовала, как и кому начисляются навыки, в каких задачах страдает качество. Сейчас учусь достраивать графики и процессы. Вникаю во внутренние сервисы и механизмы и изучаю, как их можно автоматизировать, вношу свою лепту в общий проект. Иногда пишу простые вспомогательные скрипты на Python, чтобы не делать расчёты вручную. 

Для стажировки можно выбрать 40-часовую, 30-часовую или 20-часовую рабочую неделю. Из-за учебы мне подходит только 20-часовая неделя. В понедельник я не работаю, но могу проверять почту и чаты команды. В остальные дни совмещаю работу и учёбу. До того, как мы перешли на удалёнку, я ходила на утренние пары с другой группой, чтобы всё успеть.

Важно понимать, что в Яндексе дело не в часах, а в задачах. Просто отсиживаться в офисе не принято

Аналитик — довольно широкое понятие. Никто не знает на собеседовании, в какую команду попадёт и чем будет заниматься. Не думаю, что к собеседованию есть смысл учить что-то конкретное, например осваивает новую библиотеку Python. Во всё это можно вникнуть в процессе, мой опыт это подтверждает. Важно не заучивать формулы, а понимать, что происходит. Полезно повторить теорию вероятностей и математическую статистику.

Ксения Кригер

Студентка четвёртого курса факультета вычислительной математики и кибернетики в МГУ. Работает в службе аналитики антифрода Яндекс.Такси.

alt

О стажировке в Яндексе я узнала от однокурсников. В прошлом году дошла только до второго собеседования, в этом — решила попробовать снова. В результате мне предложили пройти третье, финальное, собеседование — в команду Такси. Вот уже два месяца я работаю в службе аналитики антифрода. Наша команда занимается выявлением, анализом и предотвращением мошенничества, связанного с платежами и другими данными. 

Мне повезло, что первые три недели я успела поработать в офисе, общалась с командой. Ребята классные, все помогают, подсказывают. Раз в неделю мы встречаемся и обсуждаем, как сделать те или иные проекты лучше. Раз в две недели проходят встречи отдела, на них коллеги рассказывают о кейсах, очень интересные встречи получаются. 

Не могу сказать, что моя работа состоит в основном из написания кода, скорее, это анализ больших данных, SQL-запросы. Задачи мне ставит куратор (это мой коллега, который отвечает за группу безопасности), а не непосредственный руководитель. Сначала я вижу задачу в Трекере, где кратко описано, что нужно сделать, затем мы обсуждаем это устно, я задаю вопросы. С куратором я общаюсь раз в две недели, с руководителем — раз в месяц. 

Работа аналитика немного похожа на работу детектива

Необязательно превосходно знать Python или понимать, как работает ядро компьютера, достаточно быть в курсе основных деталей. Всё остальное приходит с опытом. До Яндекса я работала тестировщиком компилятора, мне эта работа не нравилась. Перед стажировкой я опасалась, что работа аналитика тоже не понравится. Но всё совсем наоборот: я понимаю, что это то, чем мне бы хотелось заниматься.

В работе мне больше всего нравятся люди. Смотрю на свою команду: профессионалы, все как на подбор. Занимаются интересными проектами, стараются решать задачи максимально хорошо.

Больше по теме

Разработка, Яндекс в вузах, Анализ данных

Как посмотреть мир, справиться со стрессом и научиться проходить собеседования

Рассказывают участники олимпиады «Я — профессионал»

Менеджмент, Разработка, Анализ данных

Как взять максимум от стажировки

Опыт стажёра и советы сотрудников Яндекса

Анализ данных

Что было, что будет. Как предсказывать погоду и поведение человека

Ира Руденко о магистратуре в МФТИ, Яндекс.Погоде и автономных автомобилях

Анализ данных, Яндекс в вузах

Проекты на удалёнке: как прошла студенческая смена в «Сириусе»

«Нетипичные» аптеки, определение правдивых ответов и рецепты по фотографии

Анализ данных

ML-разработчик о том, зачем он пошел учиться краудсорсингу

«Для новых, прорывных задач данных нет вообще!»

Анализ данных, Яндекс в вузах

Каково получать магистерское образование онлайн?

Борьба с прокрастинацией, дружба через Slack и поиск мотивации

Анализ данных

Простой гид по байесовскому А/B-тестированию на Python

Перевод материала из блога Towards Data Science