Авторы: Зайцев Константин, Кузнецова Дарья, ПИ-17-2
Тема проекта: Предсказание количества людей, которые придут на митап
Почему для нас это важно: Недавно мы хотели сходить на митап. Из-за того, что заявок потенциальными участниками было оставлено слишком много, организаторам пришлось отклонить часть заявок, в т.ч. и наши. Нас это расстроило. Но через некоторое время у компании-организатора вышла статья о том, как происходила организация этого митапа, и там было написано следующее: “В итоге на 120 оффлайн-мест было около 300 регистраций и практически половине желающих пришлось отказать. В качестве спойлера могу сказать, что в день митапа резко похолодало и оказалось, что в городе проходит техномитап по разработке, поэтому к нам пришло 70% от общего числа подтвердивших участие”. Соответственно, после этого мы расстроились ещё больше, ведь у нас всё-таки был шанс попасть на этот митап.
Почему это может быть важно для организаторов: На организацию подобных мероприятий необходимо закладывать бюджет. Часть бюджета может идти на то, чтобы купить продукты для кофе-брейков. Соответственно могут произойти следующие ситуации:
- Приходит ожидаемое количество людей. Организаторы уложились в бюджет, лишних продуктов не осталось.
- Приходит меньше людей, чем ожидалось. Остаются продукты, соответственно, это потраченные зря деньги.
- Приходит больше людей, чем ожидалось. Продуктов не хватает, приходится докупать “на ходу” в розницу, что дороже, чем оптом.
Таким образом, если мы будем предсказывать ожидаемое количество участников с учётом различных обстоятельств (дата, время, категория события и т.д.), организаторам митапов это может помочь при определении предварительного количества участников и, соответственно, планировании части бюджета, выделяемой на организацию кофе-брейков.
Какие данные у нас есть: Мы нашли американский дата-сет, в котором есть информация о различных митапах. Контингент России и США разный, а мы бы хотели всё-таки предсказывать предварительное количество участников именно для местных мероприятий.
Как мы будем оценивать успешность решения: у нас есть реальное и ожидаемое количество людей. В обоих случаях мы устанавливаем теоретическую стоимость на каждого участника митапа (поскольку у нас нет реальных данных, мы хотим вывести формулу для вычисления экономической выгоды, для примера подставить в неё конкретные значения, допустим, 5$ организаторы тратят на человека при покупке продуктов оптом, и 8$ на человека при покупке продуктов в розницу). Потом высчитываем уже разницу между реальным и ожидаемым и смотрим, насколько хорошо модель работает (обозначения в формулах: О - ожидаемое количество участников, Р - реальное количество участников, Опт - стоимость покупки продуктов на одного участника оптом, Розн - стоимость покупки продуктов на одного участника в розницу):
- Если ожидаемое и реальное количество людей совпадает, то организаторы не тратят лишние деньги.
- Если приходит меньше людей, чем ожидалось, то смотрим, сколько денег было потрачено “впустую”. Формула: ((О - Р) * Опт)
- Если приходит больше людей, то смотрим, сколько можно было бы сэкономить на покупке большего количества продуктов оптом нежели в розницу. Формула: ((Р - О) * (Розн - Опт))