DataLife Engine > Технологии > Обучение: кнут или все-таки пряник?

Обучение: кнут или все-таки пряник?

Эксперимент: деньги или их потеря?

Исследователи UNIGE протестировали 84 участника, чтобы исследовать предвзятость доверия в контексте обучения на основе вознаграждения или наказания, известного как обучение с подкреплением. «Принцип прост», - говорит Маэль Лебретон, исследователь Швейцарского центра UNIGE (CISA).

Обучение: кнут или все-таки пряник? 2Обучение: кнут или все-таки пряник? 2

«Участникам были показаны два абстрактных символа на экране. Один символ был связан с вероятностью 75%, чтобы выиграть пол доллара, а второй - только с 25% вероятностью выиграть. В каждом испытании они должны были выбрать один из символов, чтобы попытаться выиграть, и оценить, насколько они были уверены в своем выборе. По мере выполнения задачи испытуемые учились уточнять свои решения, идентифицируя символ, который больше всего выплачивал. «Принцип потери был обратным: участники выбирали символ, связанный с наименьшей вероятностью потери денег, а затем оценивали точность их решений.

Результаты эксперимента UNIGE

Обучение: кнут или все-таки пряник? 3Обучение: кнут или все-таки пряник? 3

Первоначальные результаты показали, что способность к обучению статистически идентична, когда участники учатся искать выгоды. С другой стороны, участники были гораздо увереннее, когда речь шла о зарабатывании денег, а не об их потере.

Эти результаты демонстрируют, что обучение должно быть адаптировано к тому, что мы хотим, чтобы человек учил. «Контекст обучения имеет решающее значение. Страх потери заставляет людей беспокоиться, и они начинают сомневаться в своем выборе. Однако, он также обеспечивает большую гибкость и точность. С другой стороны, приманка прибыли повышает уверенность в себе и благосостояние, но уменьшает нашу способность делать оценки. Тогда возникает вопрос о достижении баланса между этими двумя элементами », - говорит исследователь из Женевы.

«Мы также обнаружили, что участники сделали свой выбор быстрее в позитивном контексте, чем в негативном». Соответственно, было бы неплохо перечислить различные формы обучения, чтобы увидеть, какой тип нужно расставить по приоритетам - скорость, уверенность или точность. Затем, выбирая между вознаграждением и наказанием в зависимости от цели, которая будет достигнута.




Вернуться назад