Финалисты олимпиады IDAO-2019 о своих впечатлениях

«У нас было много безумных идей!»

Финалисты олимпиады IDAO-2019 о своих впечатлениях

Анализ данных

С 4 по 6 апреля в офисе Яндекса прошел финал олимпиады по анализу данных IDAO-2019, которую организуют факультет компьютерных наук НИУ ВШЭ и Яндекс при поддержке Сбербанка. До заключительного этапа добралась 31 команда, больше тысячи не смогли преодолеть отборочный этап, в котором была задача от исследовательской группы коллаборации LHCb Большого адронного коллайдера. 36-часовой финал, как и в прошлом году, был полон неожиданностей. Безумные идеи срабатывали, команды оказывались без капитана и всё равно двигались вперед, а победителем вообще оказался одиночка! 

О задаче, которая была в финале, рассказывает разработчик машинного обучения Яндекс.Такси Эмиль Каюмов:

Это одна из наших реальных задач — уметь предсказывать время ожидания следующего заказа для таксиста в аэропорту, чтобы водители лучше понимали, сколько им предстоит ждать клиента. Специфика в том, что мы расставляем заказы в порядке прибытия таксистов в аэропорт, так как, в отличие от города, здесь у пассажиров только одна точка, куда можно вызвать такси.

В целом, участники IDAO решали эту задачу примерно тем же образом, что и мы, но можно было увидеть какие-то хорошие идеи, до которых мы не додумались. Например, кто-то в своем решении учитывал влияние разных дней недели и праздников на количество водителей и пассажиров.

Это не совсем бизнес-задача, она не поможет компании заработать больше денег, но зато сделает жизнь водителей удобнее  

Unnamed:0 из Университета Иннополис — 9-е место

Дламини Гсинизве Сифетфо и Руфина Галиева:

Мы увидели плакат в университете и решили: почему бы не попробовать, мы же датасаентисты! И зарегистрировались в последний день. Мы не так уж и готовились, если признаться. Подумали, что увидим задачу и попробуем ее решить, так, как это и происходит в реальной жизни.

Команда сложилась стихийно: мы друзья, вместе учимся на магистерской программе Data science в Иннополисе. Нас должно было быть трое, полная команда, но капитан недавно перенес операцию и не смог приехать. Пришлось справляться вдвоем.

Во время финала у нас было много безумных идей, применяли всё, что приходило в голову. Иногда это работало, иногда нет.  

BarelyBears из Токийского университета — 4–5-е место (совместно с командой shadd из Белорусского государственного университета)

Хироси Йосихара, Косаку Оно, Наоки Маэда:

Большим испытанием для нас стал онлайн-этап с задачей про мюоны от исследовательской группы коллаборации LHCb. Описание задачи на сайте было просто огромным, сложно было даже начать. Хорошо, что Оно учил физику в университете, это помогло с пониманием проблематики элементарных частиц. 

Финальный раунд тоже удивил. Мы работали все 36 часов, сабмитили много моделей и довольно быстро заняли высокое место в рейтинге. Российские команды начали активно сабмитить только к концу 36-часового испытания. 

Мы с ужасом наблюдали, как сразу много команд внезапно стали резко набирать очки. Это было очень неожиданно и страшно для нас!

Команда Zvezdochka* из Университета Иннополис — 2-е место

Эрнест Глухов, Дарья Запекина, Вячеслав Карпов:

Мы все втроем учимся в Иннополисе на программе Data science. Команду сформировали еще в первом семестре, делали вместе домашние задания и маленькие проекты. Так что нам комфортно работать вместе, каждый понимает, на что способны остальные, и на соревнованиях мы умеем действовать сообща.

У нас нет четкого разделения ролей: Эрик молодец, мы тоже молодцы. Мы все генерим идеи и пытаемся их сообща имплементировать  

В офлайн-этапе было тяжело. Он короткий, задача интересная, и много чего хотелось попробовать. Ты имплементируешь что-то новое, оцениваешь, улучшаешь результаты, но тут уже четыре часа утра, и уже очень хочется отдохнуть. 

Мы стали постепенно улучшать наш результат: то есть у нас есть baseline, добавляем функцию, если она что-то улучшает, то оставляем. И мы довольно рано поняли, что мы оказались в лидерах. Мы только волновались о том, какие данные будут использоваться для финальных результатов, потому что если эти данные не похожи на те, на которых мы валидировались прежде, то мы делали какую-то бесполезную ерунду, которую нельзя использовать. Но мы увидели, что данные похожи на те, которые мы использовали, и наконец выдохнули. 

Команда Mylene Farmer ФКН ВШЭ и Авито — 1-е место

Илья Иваницкий:

Так получилось, что я человек-команда. Мой друг неожиданно бросил меня и стал участвовать с другой командой, причем он так ничего не засабмитил за весь конкурс.

Я решил: какого черта! Выступлю в одиночку и сделаю это хорошо

С одной стороны, одиночество помогало, так как я понимал, что всё, что я хочу делать, я буду делать сам, у меня нет возможности скинуть задачу на другого человека, который, может, ничего и не сделает. Была такая предсказуемость и эффективность. 

С другой стороны, было довольно грустно и скучно, особенно когда сидишь 36 часов на хакатоне один, постоянно кодишь и что-то запускаешь на сервере. В общем, это выглядело аутично, да и было аутично. 

В следующий раз буду стараться участвовать командой, потому что это, по крайней, мере веселее и приятнее 

Больше по теме

Анализ данных

Machine Learning Summer School

Международная школа по машинному обучению от Института им. Макса Планка в Сколтехе.

Анализ данных

Школа анализа данных Яндекса

Стань продвинутым датасаентистом

Анализ данных

Резидентская программа Яндекса по ML

Отличная возможность для опытных бэкенд разработчиков заняться прикладными исследованиями под руководством наших менторов — даже если вы новичок в этой области.

Анализ данных

Бери и делай: советы блогера, который смог поступить в ШАД

Несмотря на гуманитарное образование, выпускник МГИМО, бизнесмен Виктор Рогуленко решил поступить в ШАД, чтобы разобраться в анализе данных на высоком уровне

Анализ данных

Нейросети перешли с фотографий котиков на субъядерную физику

Руководитель лаборатории LAMBDA Андрей Устюжанин рассказал, как соревнующиеся нейросети, которые раньше использовали для создания песен и правдоподобных фотографий, научили предсказывать поведение элементарных частиц

Анализ данных

Набор в Computer Science Center

Анализ данных

Четыре пути из Школы анализа данных Яндекса

Ученые и разработчики рассказывают о своем образовании и карьере