Идею перенести опыт динамического ценообразования из другой отрасли мы наблюдали на примере компании ПИК в 2018г. Опыт в прайсинге на авиабилеты казался наиболее релевантным и были выходы на тех, кто такие системы создавал. Красивые картинки с ежедневно дорожающими лотами на квартиры (как билеты) частенько мелькали в нашем сознаниии, а вылет самолета был так похож на завершение строительства корпуса .
Увы ... квартиры слишком не похожи на билеты, существующие тогда модели не могли учесть. Мы поняли, что придется что-то изображать самим в роли первопроходцев.
В эти годы набирает обороты мода на машинное обучение. ПИК проводит чемпионат по машинному обучению Pik Digital Day, целью которого нащупать модели которые могли дать прорывную точность в предсказании объемов продаж. За приличный призовой фонд по тем временам (около 1 млн. рублей) боролось более 30 команд. Эта была хорошая попытка, результатом которой стала ясность что с наскока эта задача не решается - нужно несколько моделей, лучшее понимание что внутри них происходит, большая стабильность в данных...
Хорошо, засучили рукава и начали рассуждать своим мозгом. Возможно, сразу предсказать объем продаж - слишком сложная задача. Давайте научимся хотя бы предсказывать стоимость квартиры. Наконец, открылся простор для творчества наших аналитиков данных. Факторов которые могут повлиять на стоимость квартиры 100+, а собирать их по закоулкам СРМ и открытых источников это занятие достойное отдельной профессии - чем-то похоже на кладоискателя.
Мы ушли в перебор моделей и признаков на 2 месяца, результаты были хорошие, но явно не прорывные. Чутье подсказывала что выход возможен только при полном контакте с бизнесом. Наблюдение за оным принесло один горький инсайт - на цены слишком сильно влияет темпы с которыми девелопер хочет продавать квартиры.
Следом прозвучал еще более неудобный и невинный вопрос от аналитика - как будем считать темпы? Можно посчитать в целом по проекту, по комнатности, по этажу - какие из этих темпов учитывать? К таким поворотам судьбы нас явно не готовили, ведь машинное обучение тогда казалось всемогущим, а рецепт побольше напихать и потрясти оказался абсолютно не уместен.
Примерно в этот момент (2019г) ветка развития продукта раздвоилась. Первый путь был запущен как запасной - путь систематизации опыта команды аналитиков ценообразования и оформление его в виде явных правил индексации. Второй путь должен был ответить на вопрос - если не машинное обучение, то что?