Преимущества десятибалльной системы оценивания
UPD 15.04.2024: По результатам обратной связи добавлена часть про шринкфляцию оценок.
В последние годы я начал вести несколько списков:
Прочитанных книг с рейтингом и иногда обзорами на goodreads
Просмотренных фильмов с рейтингом на IMDb
Игр, в который я играл на Rawg
В каждом из этих сервисов собственная система оценки:
Goodreads - 5-балльная: от 1 до 5 звезд
IMDb - 10-балльная: от 1 до 10 звезд
Rawg - 4-балльная: skip, meh, recommended, exceptional
Такой разброс заставил меня задуматься о том, насколько правильно (для себя, естественно) я проставляю оценки - не могут ли попасть, например два фильма, один из которых я считаю изменившим мою жизнь, а второй просто хорошим, в одну категорию. Пришлось придумать для себя "объективные" причины расстановки оценок, вот как я их сформулировал:
Для фильмов:
- Очень плохо
2-4. Разочаровавшие фильмы, субъективно по степени разочарования, т.к. здесь пока мало фильмов
Фильмы, оставившие смешанные чувства - посмотрел, забыл и ладно
Средние фильмы: о просмотре не пожалел, но и пересматривать нет желания
Неплохие фильмы, которым, однако, чего-то не хватило
Хорошие и интересные фильмы
Очень хорошие фильмы, которые оставили сильное впечатление и запомнились
Исключительные фильмы, которые каким-либо образом значительно повлияли на меня
Для книг:
Абсолютно не понравилось/пожалел о покупке
Разочаровавшие книги
Средние книги: прочитал, забыл и ладно
Хорошие и интересные книги
Очень хорошие книги, которые оставили сильное впечатление и запомнились
Для игр:
Skip - абсолютно не понравилось
Meh - средние игры: поиграл и забыл/не доиграл
Recommended - хорошие и интересные игры
Exceptional - очень хорошие игры, которые оставили сильное впечатление и запомнились
Таким образом, если соотнести все эти оценки между собой, получится что-то следующее:

Я вижу здесь две проблемы:
Для книг и фильмов отсутствует разделение между 9 и 10 баллами. Это делает невозможным отделение исключительных книг от очень хороших. Для сравнения, сейчас я отметил 3 фильма как 10/10 и 25 как 9/10. Несмотря на то, что все вместе они заслуживают 5 звезд из 5, мне жаль что в 5-балльной оценке я не смог бы никаким образом выделить 3 своих самых любимых фильма.
Категория "средние" слишком широкая - в неё попадает слишком много баллов, то есть условные игры на 2/10 и 6/10 являются "средними", что в общем мало чего о них говорит.
Мне кажется, что подобные проблемы присутствуют и в системе образования, которая чаще всего использует 4-балльную систему оценки: неудовлетворительно (2), удовлетворительно (3), хорошо (4) и отлично (5). В МГТУ им. Н.Э. Баумана в рамках балльной системы используется 100-балльная система оценки студентов. При этом по результатам семестра оценки выставляются следующим образом:
С 60 баллов - 3
С 70/72 (периодически меняется) баллов - 4
С 85 - 5

На рисунке хорошо видно, что такая шкала оценки крайне неравномерна. Хуже того - оценки в цифрах заставляют считать, что тройка - это чуть-чуть получше двойки, а четверка - чуть-чуть получше тройки, хотя на самом деле там разрыв в 60 баллов. Собственно, у таких оценок присутствуют те же самые две проблемы:
Невозможно отделить исключительный результат (10/10) от очень хорошего (9/10).
Слишком широкая категория "двойка", особенно учитывая, что в нее никто не должен попадать. Она забирает слишком много баллов из шкалы оценки и лишает ее гибкости.
Представляется, что использование 10-балльной системы оценивания может решить обозначенные проблемы, при этом создаваемые им проблемы для меня не очевидны.
UPD: Шринкфляция оценок
Одной из проблем использования 10-балльной системы может стать шринклфляция оценок. Что это такое можно посмотреть на графике, оригинал которого мне найти не удалось, ввиду его большой растиражированности:

Чем больше массив объектов оценки, тем сложнее распределить их по любой шкале. В результате количество "очень хороших" объектов оценки, оцененных высоко в том числе для привлечения внимания, увеличивается настолько, что уже даже внутри них становится сложно ориентироваться без дополнительного ранжирования. Возможно, то же самое произошло и с пятибалльной системой оценивания, которую я критиковал выше, и именно эта шринкфляция, а не система оценок, является тем, о чем нужно говорить и с чем нужно справляться.