Кейс по выявлению товаров KVI с помощью машинного обучения
В сегменте FMCG цена остается определяющим фактором для принятия решения о покупке. Поэтому ритейлеры ведут постоянную работу по выявлению товаров, по которым покупатели сравнивают уровень цен в магазине. Как сделать этот процесс более системным с помощью машинного обучения? Разбираем подробный кейс.

Ольга Артюшкина,
руководитель Центра Корпоративных Инноваций в компании «Первый Бит» рассказывает, как это работает.
КАК ЭТО РАБОТАЕТ
на примере кейса с сетью из
50 гипермаркетов с собственным интернет-магазином и доставкой
Работа по кластеризации товаров в ритейле в основном цифровизирована только в части сбора информации о ценах конкурентов. Наша сеть внедрила сервис с алгоритмами машинного обучения для выявления KVI-товаров.

О кластеризации товаров и зачем это нужно
KVI (Key value indicator) – товары-индикаторы, формирующие ценовой имидж магазина.
По данным исследования PwC 75% опрошенных назвали цену ключевым фактором в принятии решения о покупке. Но помнить стоимость всех товаров невозможно. Поэтому ритейлеры ведут постоянную работу по выявлению товаров, по которым покупатели сравнивают уровень цен в магазине. Это и есть кластеризация.
Трафик магазина и возвращаемость клиентов напрямую зависят от цен на KVI. Распространенным примером товара индикатора являются бананы. Вы наверняка слышали, что именно по ним люди сравнивают цены в супермаркетах.

Кроме KVI ещё выделяют товары Back Basket, Long Tail и Товары первой цены:
Back Basket
товары с пониженной чувствительностью к цене и широкими возможностями увеличения их маржинальности. В большинстве случаев к этой группе можно отнести самоклеющиеся бумажные блоки для записей. Помните, сколько они стоят? Наверняка какая-то цена у вас в голове всплыла.
Их реальная цена: блок из 25 листов можно купить за 50 рублей по акции, без неё за 105 в супермаркете, а в магазине канцтоваров за 25 рублей.
Long Tail
нишевые товары и товары с длинным циклом между покупками, с низкой ценовой чувствительностью и высокой маржинальностью. Выделение этой группы произошло после широкого распространения интернет-торговли. Онлайн-покупки позволили покупателям находить уникальные для себя товары. На Амазоне продажа нишевых товаров занимает больше половины от всего оборота. 20% фильмов, которые покупают на Netflix, не выходили в широкий прокат.
ТПЦ
социальная продуктовая корзина. В моменты, когда цена на гречку была высокой, некоторые ритейлеры стали продавать её за цену, ниже себестоимости. Это позволило привлечь внимание к магазину и показать социальную ориентированность. К ТПЦ относятся продуктовые наборы, которые отражают стоимость приготовления сезонных блюд: «индекс борща», «индекс окрошки», «индекс оливье» и т.п. Если ритейлер придерживается стратегии ценового лидерства, то работа по отслеживанию и своевременной коррекции цен на эти товары является ключевым элементом успеха.

Для кластеризации товаров по ценовой чувствительности чаще всего прибегают к ABC-анализу. Аналитики или категорийные менеджеры сортируют товары по продажам: в рублях, штуках, валовой прибыли. Может добавляться показатель пенетрации. Некоторые ритейлеры относят к KVI товары-лидеры продаж в своей категории по штукам и транснациональные бренды с низкой маржинальностью.
Как алгоритмы машинного обучения выявляют KVI
Алгоритмы машинного обучения лучше людей.
Кластеризация товаров с помощью машинного обучения происходит на основании анализа данных из всех доступных чеков сразу по всем SKU. Товары анализируются на уровне региона или кластера, магазинов. Человеку не под силу обработать такой объем информации за то же время.
Упрощая детали можно сказать, что показателем чувствительности к цене для алгоритма является то, насколько хорошо покупатели помнят стоимость товара. KVI-товарами считаются те, которые покупаются почти ежедневно и в определенной продуктовой корзине. Товар, который периодически встречается в повторяющемся продуктовом наборе с высокой вероятностью относится к группе KVI. На него нужно держать рыночную цену или даже ниже, чтобы сохранять и увеличивать трафик магазина. Back Basket и Long Tail – товары, на которых можно больше зарабатывать за счет увеличения цен.
Как происходит кластеризация
1
Группировка товаров
на основании анализа каждого доступного чека и позиций в них. Сервис интегрируется с учетной системой ритейлера или онлайн-кассами и загружает чеки. Важным входным параметром является средняя наполняемость чека, в разных направлениях ритейла она сильно различается. Этот параметр задается специалистом розничной сети. Весь анализ происходит автоматически. Алгоритмы собирают и обрабатывают данные из каждого конкретного чека.
2
Сервис выявляет пересечения:
то, как часто встречаются одни и те же товары. Отдельно выделяется длина последовательности – какое количество одних и тех же товаров повторяется из чека в чек.
3
Запуск алгоритма
В 20 чеках из 10 позиций повторяются три товара: хлеб, молоко и яйца. При сравнении миллионов чеков магазина можно увидеть повторение уже 4 и 6 товарных позиций. Алгоритм считает, что товары, которые повторяются в 6 последовательностях, более чувствительны к изменению цены, чем в 3 и т.д.
Кластеризация с помощью АВС-анализа не позволяет выявить длину последовательности повторения товаров в чеках. Значит при таком способе можно пропустить чувствительные к цене товары.
Привязка ценовой чувствительности товара к количеству повторений позиций в чеке основана на суждении, что ежедневно человек покупает примерно одинаковый набор продуктов и помнит цену на них. Стоимость редко приобретаемых товаров наоборот незначима для покупателей.
Параметры кластеризации
1. В результате кластеризации с помощью алгоритмов машинного обучения формируется список с классами товаров. Место товара определяется с помощью алгоритма спектральной кластеризации.
Basket weight и Prod weight – показатели повторяемости товаров в чеках. Basket weight – частотность товара среди повторяющихся позиций в чеках. Prod weight – длина последовательности повторяющихся позиций, среди которых встречается товар.
2. Машинное обучение также учитывает:
● как товар покупается при его наличии – Saleability, где единица означает продажу каждый день;
● прогноз продаж в будущем;
● пенетрация или конверсионность товара (частотность его попадания в чек в сравнении с другими) – Occupancy;
● себестоимость – Cost;
● и другие. Сравнение сразу всех выявленных параметров позволяет присвоить товару класс: Hard KVI, Soft KVI, Back Basket и Long Tail. Разберем на примере как это работает.
3. Сравнение сразу всех выявленных параметров позволяет присвоить товару класс: Hard KVI, Soft KVI, Back Basket и Long Tail.
Разберем на примере как это работает. У Чупа-Чупса высокие показатели пенетрации, но его всегда покупают вместе с разными товарами. У него нет четкого прослеживаемого паттерна покупки вместе с какими-то часто повторяющимися наборами. Поэтому он относится к BackBasket так же, как и жевательная резинка. Чупа-Чупс, скорее всего, покупается по дороге на кассу для ребенка, но делается это не в каждый поход в магазин. Жевательная резинка в похожей ситуации – её тоже не покупают при каждом посещении магазина. Значит, цену на эти товары покупатели, скорее всего, хорошо не помнят.
4. Но может быть и обратная ситуация. Корм для кошек покупают редко, в среднем 6 товаров в день, когда он есть в наличии. В сравнении с бананами это очень низкое число. Но товар почти всегда входит в чеки с повторяющимися наборами. Корм для кошек берут каждый день при его наличии вместе с молоком яйцами и хлебом. Очевидно, что покупателей, у которых есть кошка, меньше чем остальных. Отсюда и невысокая пенетрация товара в чеки магазина. Но человек, у которого есть кошка покупает корм каждый раз, когда собирает для себя стандартную продуктовую корзину. Значит он помнит и отслеживает цену на все товары этой корзины. Алгоритм видит ценность кошачьего корма и то, почему количество его продаж небольшое, поэтому относит его к Soft KVI.
Сравнение работы машинного обучения с АВС-анализом ассортимента
Машинное обучение не учитывает прибыль, размер продаж в рублях, на которую смотрят аналитики. Клиентам всё равно какие объемы продаж у ритейлера. Им важно, чтобы в магазине можно было купить стандартный набор примерно по той же цене, что и вчера. Корм для кошек из примера выше с высокой вероятностью никогда бы не попал в список KVI при кластеризации с помощью АВС-анализа. Значит магазин терял бы лояльных потребителей и деньги. Среди покупателей могут быть приверженцы здорового питания, которые часто покупают авокадо, холостяки покупающие сосиски и т.д. У разных магазинов одной сети разные группы потребителей. С помощью машинного обучения категорийные менеджеры без труда пересматривают список KVI-товаров раз в три месяца и принимают нужные меры по управлению ценами на них.
Машинное обучение позволяет выявлять товары, которые важны конкретным группам покупателей конкретных магазинов: на уровне кластера, формата или региона.
Что происходит после кластеризации
Для каждой категории можно задать свои правила автоматизированного ценообразования. По товарам Hard и Soft KVI стоит проводить конкурентное ценообразование. Сервис, который используется для кластеризации позволяет автоматически парсить данные конкурентов и выставлять нужную стоимость на них.
Рассмотрим такую работу на примере корма для кошек.
Парсинг показал, что 28 сентября в Ленте товар стоил 16,49 и алгоритм автоматически скорректировали цену в магазинах нашей сети. Если есть гипотеза, что при снижении цены увеличится трафик и количество покупок, в правило ценообразования закладывается цель: выявить максимально возможное уменьшение цены. Правильная работа с KVI приводит к увеличению лояльности покупателя и его возвращению в магазин. Это можно увидеть на примере с кассетами для бритья.
1
Кассеты Gillette стоили в сети 1299 рублей. В «Магните» и «Ленте» цена на них была меньше.
2
Алгоритм попробовал снизить цену до 1260, затем было увеличение.
3
Рост стоимости позволил увеличить валовую прибыль и объем продаж.
4
По высокой цене удалось продать больше товара, чем за весь год, больше чем в феврале.
Одна из причин роста продаж – планомерная работа с KVI, которая позволила привлечь новый поток покупателей.

Пример можно рассмотреть и с другой стороны. Низкая цена на этот же товар в «Ленте» может быть связана с тем, что у них он относится к другой группе. Покупатели могут специально ехать в «Ленту» для покупки именно кассет для бритья, так как они там дешевле. Поэтому стабильно низкую цену на эту позицию в «Ленте» едва ли можно назвать совпадением.

Вывод: использование алгоритмов машинного обучения для определения KVI-товаров позволяет получать точные и актуальные данные быстро и с необходимой периодичностью. Это требует минимальных ресурсов. Задача людей – передавать правильные данные в систему. В результате увеличивается поток клиентов и валовая прибыль.
SaaS-платформа для автоматизации ценообразования в онлайн- и офлайн-ритейле. Система работает на базе машинного обучения с использованием готовых методологий и сценариев.

международный интегратор IT-решений. С 1997 года занимается автоматизацией бизнеса и разработкой собственных продуктов. У компании более 5 000 сотрудников и 100 офисов в восьми странах: России, Украине, Казахстане, ОАЭ, США, Канаде, Испании, Чехии и Андорре.