Федеральное агентство по образованию

Т О М С К И Й П О Л И Т Е Х Н И Ч Е С К И Й У Н И В Е Р С И Т Е Т
УТВЕРЖДАЮ
Декан АВТФ
________________
« _____ » _______________ 2009 г.
Аддитивная функция полезности
методические указания по курсу
«Теория риска и моделирование рисковых ситуаций»
для студентов специальности 080116«Математические методы в экономике»
ТОМСК 2008
УДК 519.2
Аддитивная функция полезности
Mетодические указания по курсу методические указания по курсу
«Теория риска и моделирование рисковых ситуаций»
для студентов специальности 080116«Математические методы в экономике»
- Томск: Изд. ТПУ, 20с.
Составители:
Рецензент:
Методические указания обсуждены на заседании кафедры прикладной математики 06.04.2008 г.
Зав. кафедрой
1. Понятие функции полезности и её применение в задачах принятия решения (ЗПР).
Полезность – некоторое число, приписываемое лицом, принимающим решение, каждому возможному исходу. Функция полезности Неймана-Моргенштерна для лица, принимающего решение, (ЛПР) показывает полезность, которую он приписывает каждому возможному исходу. У каждого ЛПР своя функция полезности, которая показывает его предпочтение тем или иным исходам в зависимости от его отношения к риску.
Понятие функции полезности возникло в теории потребительского спроса при сравнении различных наборов товаров. Полезность потребления продукта, например, для потребителя может быть выражена в виде функции, отражающей полезность в зависимости от количества потребления этого продукта. В определённых пределах полезность может увеличиваться, уменьшаться или оставаться без изменения при увеличении потребления продукта. Функция полезности может быть построена и для определенного набора продуктов. При этом, в зависимости от того, являются ли продукты взаимозаменяемыми или нет, интегральная функция полезности набора потребляемых продуктов определяется с учётом взаимного их влияния на общую их полезность потребления.
В ЗПР значение функции полезности выражает предпочтения, полезность альтернатив. Она может быть оценена на множестве альтернатив и на множестве критериев, при этом критерии могут быть взаимно независимыми и зависимыми.
1.1. Формализация задач принятия решений.
Принятие решений – действие над множеством альтернатив, в результате которого получается множество выбранных альтернатив.
Сделаем формальное описание задачи:
Пусть: z = {
,…,
} – множество целей системы управления.
x = {
,…,
} – множество альтернатив.
Y- множество исходов альтернатив.
e = {
,…,
} – множество возможных состояний (ситуаций).
Исход y
Y может быть представлен в виде трёх аргументов:
, где
,
,
. Матрицу
называют матрицей исходов, оценочным функционалом, функцией предпочтения.
Необходимо построить модель исходов альтернативных решений в соответствии с предпочтением ЛПР.
Для обеспечения комплексной оценки решений необходимо сформулировать для полного множества целей систему показателей (критериев), характеризующую степень их достижения. Множеству целей Z сопоставим множество критериев К. В частном случае каждой цели
может быть сопоставлен один критерий
. Для построения модели оценки решений необходимо:
1) получить оценку предпочтительности решений по каждому критерию для каждой ситуации;
2) получить комплексную оценку решений по совокупности критериев для каждой ситуации;
3) получить интегральную оценку решений с учётом возможных ситуаций.
Модель оценки решений в частных постановках может быть записана в виде функциональной зависимости от параметров, характеризующих внешнюю среду и локальных критериев. Как правило, модель оценки решений носит более сложный характер причинно-следственных связей и не описывается простыми формальными состояниями.
Выбор лучшего решения в транспортной задаче связан с определением экстремума функции. И только для задач векторной оптимизации требуется вмешательство ЛПР, для определения приоритетов нескольких критериев. Во всех этих случаях рассматривались задачи принятия решений, в которых выбор решения производили в условиях определённости, с учётом конкретной ситуации, определённые состоянием внешней среды.
В реальной практике нередко приходится иметь дело с более сложной обстановкой, когда выбор альтернативы под влиянием внешней среды, неподдающейся точному прогнозу и имеющей случайный характер, приводит к одному из нескольких возможных исходов, и для осуществления выбора наилучшего решения необходимо оценивать альтернативы в зависимости от возможных ситуаций (ситуаций внешней среды) и целевых установок. Такая комплексная оценка решения не может быть произведена без участия ЛПР, без учёта системы его взглядов (системы предпочтений) на ценность альтернатив.
1.2. Аксиоматический подход к построению функции полезности.
Аксиоматический подход к ЗПР базируется на поверке ряда аксиом для построения функции полезности альтернатив. Аксиомы делятся на две группы:
1) аксиомы существования функции полезности;
2) аксиомы независимости критериев.
Аксиомы существования функции полезности формализованы на множестве альтернатив и множестве критериев. В случае независимости альтернатив
, где
, и существования линейного порядка их предпочтения
(> - знак отношения строгого предпочтения) показано, что на этом множестве можно построить функцию полезности такую, что
. При наличии информации (количественной или качественной) на множестве критериев
, где
, характеризующих альтернативы, показано, что для них могут быть построены функции полезности, как по каждому критерию
, так и по совокупности критериев.
Методология рационального принятия решений в условиях неопределённости, основанная на функции полезности индивида, опирается на пять аксиом, которые отражают минимальный набор необходимых условий непротиворечивого и рационального поведения игрока. Для компактного изложения аксиом потребуется следующее определение.
Предположим, что конструируется игра, в которой индивид с вероятностью р получает денежную сумму х и с вероятностью (1-р) – сумму z. Эту ситуацию будем обозначать G(x, z:
).
Аксиома 1. Аксиома сравнимости (полноты).
Для всего множества S неопределённых альтернатив (возможных исходов) индивид может сказать, что либо исход x предпочтительнее исхода y (
), либо (
), либо индивид безразличен в отношении к выбору между x и y (
). Запись
означает, что исход x предпочтительнее исхода y либо индивид безразличен в отношении к выбору между x и y.
Аксиома 2. Аксиома транзитивности (состоятельности).
Если
и
, то
. Если
и
, то
.
Аксиома 3. Аксиома сильной независимости.
Предположим, что мы конструируем игру, в которой индивид с вероятностью p получает денежную сумму x и с вероятностью (1-p) – сумму z, т. е. G(x, z:p). Сильная независимость означает, что если индивид безразличен в отношении к выбору между x и y, (
), то он также будет безразличен в отношении к выбору между игрой (лотереей) G(x, z:p) и игрой G(y ,z:p), т. е. из
следует G(x, z:p)
G(y, z:p).
Аксиома 4. аксиома измеримости.
Если
или
, то существует единственная вероятность p, такая, что
G(x, z:p).
Аксиома 5. Аксиома ранжирования.
Если альтернативы y и u находятся по предпочтительности между альтернативами x и z и можно построить игры, такие, что к выбору между y и G(x, z:
), а также к выбору между u и G(x, z:
), то при
>
.
Если принять приведённые аксиомы и предположить, что люди предпочитают большее количество некоторого блага меньшему, то всё это в совокупности определяет рациональное поведение ЛПР.
При названных предпочтениях американскими учёными Дж. Нейманом и О. Моргенштерном было показано, что ЛПР при принятии решения будет стремиться к максимизации ожидаемой полезности. Другими словами, из всех возможных решений он выберет то, которое обеспечивает наибольшую ожидаемую полезность.
1.3. Построение и структура функции полезности.
Вид аддитивной функции полезности:
U(x)=
, где
U(k) – функция полезности альтернативы на множестве критериев K, 0
U(k)
1;
- функция полезности альтернативы по критерию
, 0![]()
![]()
1,
;
- вес j-го критерия,
,
>0.
Дж. Нейман и О. Моргенштерн предложили процедуру построения индивидуальной функции полезности, которая (процедура) заключается в следующем: ЛПР отвечает на ряд вопросов, обнаруживая при этом свои индивидуальные предпочтения, учитывающие его отношение к риску. В общем случае график функции полезности может быть трёх типов:
· для ЛПР, не склонного к риску, - строго вогнутая функция, у которой каждая дуга кривой лежит выше своей хорды;
· для ЛПР, безразличного к риску, - прямая лини;
· для ЛПР, склонного к риску, - строго вогнутая функция, у которой каждая дуга кривой лежит ниже своей хорды.
2. Исследование функции полезности на моделях экономических систем.
Классификация задач принятия решений:
ЗПР

![]()


Будем считать, что имеется несколько целей и одна ситуация.
2.1. Построение аддитивной функции полезности.
Перед выпускником учебного заведения стоит проблема выбора оптимального места дальнейшей работы. Выбор определяется значением критериев:
- величина зарплаты;
- процент творческой работы;
- время, за которое можно добраться до работы.
Выпускник может производить выбор из пяти предполагаемых мест работы со следующими оценками:
Предприятие | Критерии | ||
|
|
| |
| 100 | 50 | 30 |
| 140 | 30 | 50 |
| 170 | 25 | 45 |
| 130 | 15 | 10 |
| 140 | 40 | 40 |
Построим функцию полезности по каждому критерию
, где
, 0
1.
Введём обозначения:
- лучшее значение по критерию j (
=170;
=50;
=10),
- худшее значение по критерию j (
=100;
=15;
=50).
Для удобства работы с ЛПР все критерии представить с позиции их максимизации или минимизации. Поэтому новое значение критерия
лучше представить как разность
, где
- значение критерия 3 для i-ой альтернативы.
- максимальное значение критерия 3 (
=50). Тогда для третьего критерия будем иметь (50-30; 50-50; 50-45; 50-10; 50-40) = 40.
= 0, т. е. 0
40.
=0,
= 1. Остальные три определяются опросом ЛПР. ЛПР должно указать последовательно значения полезности соответственно будут равны 0,5; 0,25; 0,75. Будем считать, что данная задача решена. Тогда для определения коэффициентов
предлагается следующий подход.
Пусть даны две альтернативы (
,
,
) и (
- ?,
,
), где
и
- худшее и лучшее значение критерия j,
- значение третьего критерия (для нас безразлично значение дополняющего критерия, т. к. все критерии взаимозависимы). Спрашиваем у ЛПР: каково должно быть значение критерия
у второй альтернативы, чтобы эти альтернативы были эквивалентны, т. е. функции полезности у них были одинаковы. Для нашей задачи сравниваем альтернативы (100, 50,
) и (
- ?, 15,
). Выясняем у ЛПР: какова должна быть зарплата, если процент творческой работы составляет 15 %, а работа должна быть эквивалентна по степени удовлетворения в работе, зарплата которой – 100, но процент творческой работы составляет 50 %. Если ЛПР называет допустим
= 155, то U(
,
,
) =U(
,
,
).



По графику функции полезности
определяем для
= 155
= (155-150)(0,75-0,5)/(160-150) +0,5 = 0,625 = ![]()
Аналогично у ЛПР определяем эквивалентность альтернатив:
(100,
, 40)
(
- ?,
,0).
Пусть ЛПР выбирает
= 140. Тогда получаем:


=(140-130)(0,5-0,25)/(150-130)+0,25 = 0,375
Получаем систему:

![]()
0,625
0,375
Решаем систему и получаем:

Определяем значение функции полезности для всех альтернатив
: U(100; 50; 20)=0,5*0+0,3125*1+(20-15)*0,5/(25-15)+0,25*0,1875=0,3828
: U(140,30,0)=0,3047
: U(170,25,5)=0,6093
: U(130,15,40)=0,3125
: U(140,40,10) =0,4139
Вывод: Наиболее благоприятное место работы – третье предприятие.
АДДИТИВНАЯ ФУНКЦИЯ ПОЛЕЗНОСТИ
Методические указания по выполнению лабораторной работы
Составитель: доцент, к. т.н.
Подписано к печати
Формат 60х84/16. Бумага писчая №2.
Плоская печать. Усл. печ. л. Уч.-изд. л.
Тираж 50 экз. Заказ. Цена свободная.
ИПФ ТПУ. Лицензия ЛТ №1 от 18.07.94.
Типография ТПУ. Томск, пр. Ленина, 30.


