Skip to main content

Command Palette

Search for a command to run...

Преимущества десятибалльной системы оценивания

Updated
4 min read
📝
This is a Draft Amnesty Week draft. It may not be polished, up to my usual standards, fully thought through, or fully fact-checked. Commenting and feedback guidelines: I'm posting this to get it out there. I'd love to see comments that take the ideas forward, but criticism of my argument won't be as useful at this time. 

UPD 15.04.2024: По результатам обратной связи добавлена часть про шринкфляцию оценок.

В последние годы я начал вести несколько списков:

  • Прочитанных книг с рейтингом и иногда обзорами на goodreads

  • Просмотренных фильмов с рейтингом на IMDb

  • Игр, в который я играл на Rawg

В каждом из этих сервисов собственная система оценки:

  • Goodreads - 5-балльная: от 1 до 5 звезд

  • IMDb - 10-балльная: от 1 до 10 звезд

  • Rawg - 4-балльная: skip, meh, recommended, exceptional

Такой разброс заставил меня задуматься о том, насколько правильно (для себя, естественно) я проставляю оценки - не могут ли попасть, например два фильма, один из которых я считаю изменившим мою жизнь, а второй просто хорошим, в одну категорию. Пришлось придумать для себя "объективные" причины расстановки оценок, вот как я их сформулировал:

Для фильмов:

  1. Очень плохо

2-4. Разочаровавшие фильмы, субъективно по степени разочарования, т.к. здесь пока мало фильмов

  1. Фильмы, оставившие смешанные чувства - посмотрел, забыл и ладно

  2. Средние фильмы: о просмотре не пожалел, но и пересматривать нет желания

  3. Неплохие фильмы, которым, однако, чего-то не хватило

  4. Хорошие и интересные фильмы

  5. Очень хорошие фильмы, которые оставили сильное впечатление и запомнились

  6. Исключительные фильмы, которые каким-либо образом значительно повлияли на меня

Для книг:

  1. Абсолютно не понравилось/пожалел о покупке

  2. Разочаровавшие книги

  3. Средние книги: прочитал, забыл и ладно

  4. Хорошие и интересные книги

  5. Очень хорошие книги, которые оставили сильное впечатление и запомнились

Для игр:

  • Skip - абсолютно не понравилось

  • Meh - средние игры: поиграл и забыл/не доиграл

  • Recommended - хорошие и интересные игры

  • Exceptional - очень хорошие игры, которые оставили сильное впечатление и запомнились

Таким образом, если соотнести все эти оценки между собой, получится что-то следующее:

https://i.imgur.com/UqyVJ1Q.png

Я вижу здесь две проблемы:

  1. Для книг и фильмов отсутствует разделение между 9 и 10 баллами. Это делает невозможным отделение исключительных книг от очень хороших. Для сравнения, сейчас я отметил 3 фильма как 10/10 и 25 как 9/10. Несмотря на то, что все вместе они заслуживают 5 звезд из 5, мне жаль что в 5-балльной оценке я не смог бы никаким образом выделить 3 своих самых любимых фильма.

  2. Категория "средние" слишком широкая - в неё попадает слишком много баллов, то есть условные игры на 2/10 и 6/10 являются "средними", что в общем мало чего о них говорит.

Мне кажется, что подобные проблемы присутствуют и в системе образования, которая чаще всего использует 4-балльную систему оценки: неудовлетворительно (2), удовлетворительно (3), хорошо (4) и отлично (5). В МГТУ им. Н.Э. Баумана в рамках балльной системы используется 100-балльная система оценки студентов. При этом по результатам семестра оценки выставляются следующим образом:

  • С 60 баллов - 3

  • С 70/72 (периодически меняется) баллов - 4

  • С 85 - 5

https://i.imgur.com/KAbZeGN.png

На рисунке хорошо видно, что такая шкала оценки крайне неравномерна. Хуже того - оценки в цифрах заставляют считать, что тройка - это чуть-чуть получше двойки, а четверка - чуть-чуть получше тройки, хотя на самом деле там разрыв в 60 баллов. Собственно, у таких оценок присутствуют те же самые две проблемы:

  1. Невозможно отделить исключительный результат (10/10) от очень хорошего (9/10).

  2. Слишком широкая категория "двойка", особенно учитывая, что в нее никто не должен попадать. Она забирает слишком много баллов из шкалы оценки и лишает ее гибкости.

Представляется, что использование 10-балльной системы оценивания может решить обозначенные проблемы, при этом создаваемые им проблемы для меня не очевидны.

UPD: Шринкфляция оценок

Одной из проблем использования 10-балльной системы может стать шринклфляция оценок. Что это такое можно посмотреть на графике, оригинал которого мне найти не удалось, ввиду его большой растиражированности:

https://i.imgur.com/qGBhObQ.png

Чем больше массив объектов оценки, тем сложнее распределить их по любой шкале. В результате количество "очень хороших" объектов оценки, оцененных высоко в том числе для привлечения внимания, увеличивается настолько, что уже даже внутри них становится сложно ориентироваться без дополнительного ранжирования. Возможно, то же самое произошло и с пятибалльной системой оценивания, которую я критиковал выше, и именно эта шринкфляция, а не система оценок, является тем, о чем нужно говорить и с чем нужно справляться.

More from this blog

Научная основа хорошего сна. Конспект мастеркласса Мэттью Уолкера

Мэттью Уолкер - ученый, занимающийся исследованием сна и его влияния на здоровье. У него достаточно много статей с хорошими показателями (Google Scholar), опубликованная научно-популярная книга "Зачем мы спим" (ЛитРес), серия подкастов и свой центр н...

Oct 1, 202410 min read
А

Александр Кузнецов

26 posts

Базальт СПО и МГТУ им. Н.Э. Баумана. Уведомления о новых постах — в telegram-канале.