Измерение вкуса
Измерение вкуса
Говоря о том, насколько нам что-либо понравилось или не понравилось, мы выставляем оценку. Такая оценка называется рейтингом. Каждый рейтинг имеет шкалу оценок, например шкалу от одного до пяти, где один — «очень плохо», пять — «очень хорошо». В такой шкале всем приблизительно понятно, что означают оценки 2, 3, 4. На этапе такого приблизительного понимания возникает первая погрешность, присущая рейтингам. Некая вольность толкования оценок.
Для оценки фильмов многие используют десятибалльную шкалу. Например, крупнейший в мире сервер, посвященный кино, IMDB (Internet Movie Database). Выясняется, что, выставляя фильму «десять баллов», многие пользователи вкладывают в это разный смысл. Кто-то выражает этим, что ему фильм очень понравился, а кто-то хочет сказать, что он без ума от этого фильма. Зачастую распределение рейтингов выглядит следующим образом (см. рис. 25.1 и 25.2).
Римские каникулы
Рисунок 25.1. Распределение рейтингов.
Пираты Карибского моря 2: Проклятие черной жемчужины
Рисунок 25.2. Распределение рейтингов.
Видно, что оценка 10 «аккумулирует» в себе оценки различных превосходных степеней, таких как 11, 12 и т. д., если бы они были. Будь шкала изначально более широкой, распределение выглядело бы так, как показано черными линиями на
рисунках. Естественно, что этот феномен также вносит погрешность в то, как рейтинг отражает реальную картину.
Собрав рейтинги, с ними начинают некие действия, от простых — «рассчитать средний рейтинг» — до более сложных. Например, сравнить вкусы разных людей или применить процедуру коллаборативной фильтрации. Во всех случаях нам понадобится вычитать из одного рейтинга другой или складывать их между собой. И тут выясняется, что рейтинг имеет нелинейную природу. Возьмем трактовку шкалы рейтингов (например, принятую на сервере www.pokazuha.ru):
12 шедевр
11 гениально
10 великолепно
9 отлично
8 очень хорошо
7 хорошо
6 неплохо
5 никак
4 плохо
3 очень плохо
2 отвратительно
1 хуже некуда
Видно, что разница между оценкой 4 и оценкой 1,— это разница между «плохо» и «хуже некуда». Разница составляет 3 балла, но при этом выражает непринципиальное различие в негативной оценке. Разница между оценкой 9 и оценкой 6 тоже составляет 3 балла, но в этой разнице — принципиальное отличие «неплохого» от того, что очень понравилось и заслужило оценку «отлично». Причина этого в том, что шкала рейтингов является ранговой (порядковой). Оценки выстроены по принципу возрастания положительных эмоций. Но ранговая шкала, в отличие от количественной шкалы, не гарантирует осмысленность сложения и вычитания. Задумайтесь: складывая рейтинги, вы складываете не столько оценку впечатления, сколько порядковый номер этой оценки.
Более корректным было бы просто таблично сопоставить рейтинги, их языковые трактовки и «силу» произведенного впечатления. В данном случае мы имеем дело с задачей преобразования ранговой шкалы в количественную.
Сейчас на практике для прогнозирования оценки фильма для человека, который его еще не смотрел, часто используют коллаборативную фильтрацию. Это процедура, которая позволяет исходя из оценок, которые человек поставил другим фильмам, найти людей «похожих» на него по проставленным оценкам и использовать усреднение оценки этих людей для искомого фильма как прогноз. Такая процедура, как правило, не работает.
Основные причины:
Для определения «похожих» людей используется евклидово расстояние, которое подразумевает вычитание рейтинга одного пользователя из рейтинга другого. Как писалось раньше, правомерность вычитания крайне сомнительна без предварительных преобразований и учета факторов «понятности» и «ограниченности» шкалы.
За счет того, что количество элементов спектра восприятия, участвующих в формировании итогового впечатления, достаточно велико, одинаковая оценка какого-либо фильма может быть вызвана совершенно разными причинами. А это означает, что совпадение итогового впечатления по какому-либо фильму можно трактовать только как некое повышение вероятности совпадения вкусов вообще. Для того чтобы говорить, что мы нашли людей, совпадающих по вкусу, необходимо достаточно точное совпадение по достаточно большому количеству различных фильмов или анализ причин проставления той или иной оценки.
Вообще-то, при достаточном объеме информации, то есть рейтингов, проставленных человеком, вполне решаема задача построения модели его спектра восприятия. Это тем более интересно, что оценка спектра восприятия аналогична оценке интеллекта человека вообще.