Контекст: пользователей web-сервиса необходимо сегментировать для персонализации предложений сервиса. Это возможно сделать на основе cookie-файлов, так как история посещения страниц говорит об интересах пользователя.
Решение: построение модели сегментации при помощи тематического моделирования на основе cookie-файлов в виде текстового описания посещаемых страниц.
Итоги:
Проведен пилотный проект, интегрирован в бизнес- процесс заказчика:
Выявлены тематики 80% посещенных пользователем страниц;
70% являются интерпретируемыми;
Предсказание социально-демографических параметров аудитории;
Выделены интересы 90% посетителей по тематикам посещенных страниц;
80% интересов являются интерпретируемыми;
Увеличена конверсия рекламной кампании на 10% при А/Б тестировании;
Внесены изменения в 15% готовых рекламных кампаний.
Для построения модели были использованы:
Список URL-страниц, которые посетил пользователь;
Описание URL-страниц;
Сопроводительная информация о пользователе;
Результаты показа рекламы пользователю.
Результаты моделирования:
Модель поведения пользователей интернет-ресурса;
Модель прогнозирования вероятности отклика на рекламную кампанию;
Интерпретация клиентской базы.
Заказчик: Маркетинговое агентство
Технологический стек: TopicNet, BigARTM, Python, gensim.