Что такое рекомендательная система и зачем она нужна
Урок объясняет, что такое рекомендательная система, какую ценность она создаёт и почему длинный хвост важнее блокбастеров.
Рекомендательная система — это алгоритм, который для конкретного пользователя из огромного каталога выбирает небольшой список объектов, которые с наибольшей вероятностью ему понравятся или будут полезны.
Проблема изобилия
Когда в каталоге десять товаров, человек просто просматривает их все и выбирает. Когда товаров — миллионы (а у Amazon, Netflix или YouTube именно столько), просмотреть всё физически невозможно. Возникает парадокс выбора: чем больше вариантов, тем труднее решиться, и тем выше шанс, что человек уйдёт, ничего не выбрав. Рекомендательная система превращает бесконечную полку в персональную витрину из десятка позиций, на которые действительно стоит посмотреть.
Это не косметическая фича, а ядро бизнеса. По публичным оценкам, около 80% просмотров на Netflix и значительная доля просмотров на YouTube приходят именно из рекомендаций, а не из поиска. Маркетплейсы строят на рекомендациях блоки «с этим товаром покупают», «похожие товары» и персональную ленту. Хорошие рекомендации напрямую повышают вовлечённость, время в продукте и выручку.
Длинный хвост
До эпохи интернета магазин держал на полке только бестселлеры: место ограничено, и невыгодно хранить товар, который купят раз в год. Цифровые платформы сняли это ограничение — на сервере помещается весь каталог. Распределение спроса при этом имеет характерную форму: несколько хитов собирают огромный спрос, а дальше тянется длинный хвост из миллионов нишевых позиций, каждая из которых популярна у узкой группы.
спрос |* | * | * | ** | ***___ длинный хвост | ----________ +-----------------------> товары хиты ниши
Поиск работает, только когда человек уже знает, чего хочет. Рекомендации работают в противоположной ситуации: они открывают пользователю нишевые товары, о существовании которых он не подозревал. Именно монетизация длинного хвоста — экономическая причина, почему рекомендательные системы стали обязательными.
Простейшая иллюстрация ценности
Представим каталог и счётчик кликов. Даже наивная сортировка по популярности уже лучше случайного порядка — это будет наш первый baseline.
from collections import Counter
clicks = ["A", "B", "A", "C", "A", "B", "D", "A", "B", "C", "A"]
counts = Counter(clicks)
print("Витрина по популярности:")
for item, c in counts.most_common():
print(f" {item}: {c} кликов")Вывод:
Витрина по популярности: A: 5 кликов B: 3 кликов C: 2 кликов D: 1 кликов
Как работает под капотом
На самом верхнем уровне любая рекомендательная система делает три вещи: собирает сигналы (что пользователь смотрел, покупал, лайкал), строит модель предпочтений и выдаёт ранжированный список. Чем богаче сигналы и точнее модель, тем релевантнее список. Весь курс — это постепенное усложнение второго шага: от подсчёта популярности до нейросетевых эмбеддингов.
Частые ошибки
- Считать рекомендации поиском. Поиск отвечает на явный запрос, рекомендации угадывают неявную потребность — это разные задачи.
- Гнаться только за хитами. Если показывать всем одно и то же популярное, теряется персонализация и весь длинный хвост.
- Игнорировать baseline. Прежде чем строить сложную модель, всегда сравнивайте её с простой популярностью — иногда разница невелика.
Итоги
- Рекомендательная система выбирает из огромного каталога короткий персональный список.
- Она решает проблему изобилия и монетизирует длинный хвост нишевых товаров.
- Для крупных платформ рекомендации — основной драйвер вовлечённости и выручки.
- Любая система собирает сигналы, моделирует предпочтения и ранжирует выдачу.