Ритейл продолжает оставаться одной из самых технологичных отраслей экономики. В списке приоритетов современного торгового предприятия не просто снижение затрат, но и борьба за каждого клиента. О том, какие решения для этого можно использовать, говорили участники организованной CNews Conferences конференции «ИТ в ритейле 2019».
Евгений Максимча: Мы позволяем не потерять деньги как минимум в 3 случаях из 10
О том, как надо работать с имеющимися у телеком-операторов геоданными для того, чтобы результат приносил реальный эффект, рассказал Евгений Максимча, руководитель продуктового направления «Ритейл&Гео-аналитика», «Мегафон».
CNews: Какие сервисы на основе больших данных «Мегафон» предлагает ритейлерам?
Евгений Максимча: Последние 2-3 года в СМИ практически каждую неделю выходит статья о том, как данные операторов могут перевернуть ритейл-отрасль и создать существенное конкурентное преимущество для любой компании. Но очень мало статей посвящено конкретным механикам и ответу на вопрос «А как именно это будет работать»?
Наиболее распространенным ответом является «Данные операторов могут быть использованы для поиска оптимальных локаций». Но как искать оптимальные локации? Что вообще считается «оптимальной» локацией? Очень интересные вопросы.
На сегодняшний день большинство операторов в мире предлагают ритейлерам отчеты в виде «тепловой карты», разделенной на квадраты 500 на 500 м. Каждому из этих квадратов соответствует число, отражающее какой-либо показатель: трафик в квадрате, количество проживающего населения в квадрате, количество мужчин, работающих в квадрате и т. д.
Вроде бы, звучит разумно, но возникает 2 вопроса. Почему квадраты только 500 на 500 м? Мы же ищем локацию, а не зону. Как вообще все эти отчеты связаны с «оптимальной» локацией?
CNews: Почему квадраты 500 на 500м?
Евгений Максимча: Исходными данными любой «тепловой карты» являются регистрации абонентов на базовых станциях (сотовых вышках), которые охватывают своим сигналом достаточно обширную территорию вокруг. Когда телефон подключился к вышке – вышка не знает, где именно находится абонент. Все, что получает оператор в данный момент – информация, что абонент находится в зоне охвата вышки, иначе бы он не подключился.
Самый простой способ снизить неточность подобных данных – агрегировать их до больших квадратов 500 на 500 метров, чтобы с приемлемым уровнем вероятности гарантировать, что абонент будет находиться в квадрате. Если же снизить гранулярность такого отчета до 100 м или даже конкретного здания – точность геоданных будет довольно сомнительной.
Но, как показывают наши исследования, – даже в случае квадратов 500x500 метров до 33% абонентов, которые по данным базовой станции находятся внутри квадрата, фактически в нем не находятся. Проблема особенно актуальна, если мы хотим построить отчет по динамическому трафику, а не статичному населению.
Мы в «Мегафоне» давно осознали эту проблему, и потому продажа сырых «тепловых карт» не является нашей целевой бизнес-моделью. Последние 5 лет мы разрабатываем и постоянно улучшаем алгоритм уточнения «сырых» геоданных, используя методы машинного обучения на базе платформы oneFactor, позволяющие достигать точности до 50 м. Имея более точные исходные данные, мы можем использовать их в своих прогнозных моделях, улучшая качество итогового прогноза.
CNews: Как вообще эти отчеты связаны с «оптимальными» локациями?
Евгений Максимча: Кажется очевидным ответ: «оптимальные локации – это те, где бывает наша целевая аудитория». Следовательно, для поиска «оптимальных» локаций достаточно выгрузить «тепловую карту» скопления целевой аудитории (отчет по трафику) и просто открываться в наиболее «горячих» точках карты. Но так ли это? Как показывает наш опыт – нет.
По той причине, что единственным объективным критерием «оптимальности» является выручка локации после открытия. Вполне вероятен следующий сценарий: открылись в «горячей» точке отчета по трафику, где значительное скопление людей, но выручка не достигает целевых показателей. Причин может быть бесконечного много, например, в отчете по трафику содержится «проживающее» население, а основным паттерном покупки у вашей компании является «покупка у работы». Или в «горячей» точке живут абоненты, у которых по пути с работы уже есть локация вашей сети, т.е. новой точкой вы фактически «съели» продажи существующих локаций. Тем самым суммарный CAPEX по сети вырос, а выручки не добавилось.
Подобных причин может быть бесконечно много, т.к. на выручку торговой точки влияет огромное количество факторов. Таким образом, при продаже «тепловой» карты, основанной только на показателях трафика, ответственность за полезность и применимость этих данных ложится на заказчика.
Мы в «Мегафоне» смотрим на поиск оптимальных локаций с иного ракурса и предлагаем своим заказчикам услугу прогноза выручки локаций при помощи машинного обучения. Идея очень проста. Мы обогащаем данные о существующих торговых точках заказчика различными признаками (1000+ факторов: трафик, население конкуренция и т. д.). Искусственный интеллект ищет зависимости между внешними признаками и итоговой выручкой существующих локаций. Когда зависимости найдены на существующих точках – мы уже знаем, какие именно данные о новой локации необходимо собрать и что с ними сделать, чтобы получить итоговый прогноз по выручке.
Сбор данных и их обработка происходят в полностью автоматическом режиме на базе платформы машинного обучения oneFactor – заказчику необходимо просто передать нам координаты интересующей локации и через 48 часов он уже получит прогноз по выручке в рублях или количеству чеков, что является наиболее объективным показателем для принятия решения.
Касаемо точности прогноза – качество любой модели машинного обучения определяется количеством и разнообразием данных, которые используются при построении модели. Аналогично ученику в школе – чем больше разных примеров он решил перед контрольной работой, тем с большей вероятностью в контрольной будут уже знакомые задачи.
Для нас показателем точности прогноза является доля локаций, для которых прогноз отклонился не более, чем на 10% от фактического. Обычно мы достигаем такой точности в 8 локациях из 10, в то время как при ручном подходе это в среднем 5 из 10 локаций. Тем самым, мы позволяем не потерять деньги как минимум в 3 случаях из 10, что при стоимости открытия локации в 5 млн рублей означает 15 млн экономии, не говоря уже об альтернативных издержках и снижении трудозатрат на сам процесс оценки.
Так как же это связано с поиском? Очень просто. Если мы имеем достаточно точную модель, которая прогнозирует выручку для конкретной локации, то ее можно применить для каждого здания в городе, отранжировать все адреса по прогнозу и выбрать действительно оптимальные точки для открытия.