Принцип гарантированного результата

Если же ситуация не такая (например, не известно, знает ли противник принимаемое нами решение), то выбор х является разумной осторожной стратегией, так как нет оснований надеяться, что противник не сможет всякий раз выбирать наилучшее для себя решение (пусть даже не зная нашего решения, а просто угадывая). Таким образом, использование принципа гарантированного результата в игре  

Пусть Центр, по-прежнему, знает целевые функции производственных единиц fi(Xi) и их производственные функции фД ,-, Y(, (). Однако теперь это уже не дает ему достаточной информации для сведения своей задачи планирования в условиях неполной информации к оптимизационной задаче. Действительно, при помощи информации о функциях fi(xi) и (fi(ui, у,, ) Центр может построить зависимость у,- = г 5((ыь /), но теперь в ней есть неопределенные факторы е MI, конкретные значения которых в момент распределения ресурса ( между Производителями неизвестны Центру. Как же распределить этот ресурс, если Центру не известны величины ,-, т. е. он не может предсказать результатов своих действий В этих случаях разумно воспользоваться принципом гарантированного результата, т. е. поставить следующую задачу найти такое распределение ресурса щ, чтобы на нем достигался  
В таких случаях наиболее часто используют принцип гарантированного результата, т. е. считают, что какое бы решение мы пи выбрали, месторождения всегда будут расположены наихудшим для нас образом, после чего выбирают такой план разведки, в котором потери от плохого расположения месторождений являются наименьшими. В данном случае неопределенность не создается нашим противником (неизвестные законы природы вряд ли можно считать враждебными нам), выбор гарантирующей стратегии просто является разумным поведением в условиях отсутствия информации о законах, управляющих исследуемым объектом.  
Авторы книги являются сторонниками использования принципа гарантированного результата в играх с природой, особенно в экономических задачах. Успехи в построении численных методов нахождения гарантирующей стратегии и гарантированного результата, наблюдавшиеся в последние годы, служат материальной основой успешной реализации такого подхода.  
Одним из наиболее распространенных подходов такого типа является принцип гарантированного результата. При его использовании предполагают, что какое бы решение мы ни приняли, неизвестный параметр может принять наихудшее значение (скажем, месторождения полезных ископаемых будут расположены наихудшим образом). В соответствии с этим выбирают такой план действий, при котором наихудшее значение показателя W(x, у) является наибольшим. Математически принцип гарантированного результата имеет следующий вид. Для каждого управления х находим наихудшее значение показателя W(x, у)  
Конечно, неизвестные законы природы вряд ли можно считать враждебными нам. Принцип гарантированного результата означает лишь, что мы действуем в условиях неполной информации крайне осторожно, учитывая возможность наихудшего исхода. Осторожность принципа гарантированного результата часто критикуется, предлагаются другие подходы к выбору решения.  

Подход, противоположный принципу гарантированного результата, основывается на оптимистичном предположении, что неизвестные величины у будут принимать значения, наилучшие для нас, т. е. при каждом х е X будет реализовываться величина  
В примере с геологической разведкой такой» подход означает, что какое бы решение мы ни приняли, полезные ископаемые будут расположены наилучшим для нас образом. Крайний оптимизм этого подхода вызывает недовольство у ЛПР, поэтому была сделана попытка найти какой-то компромисс между рассматриваемым подходом и принципом гарантированного результата. В качестве компромиссного был предложен так называемый критерий Гурвица, состоящий в выборе такого управления х, па котором достигается  
В гл. 2 были рассмотрены некоторые подходы к принятию решения в условиях неопределенности. Принцип гарантированного результата в данном случае приобретает следующий вид  
Применение принципа гарантированного результата. Попытаемся сформулировать объективный метод выбора оценок Лг, используя принцип гарантированного результата. Для этого прежде всего необходимо распространить определение критерия Центра (1.4) на случай, когда не выполняется равенство (1.3). Будем полагать, что критерий Центра 7Ц имеет вид  
Принцип гарантированного результата 157, 217, 354  
Если центр не располагает никакой информацией о действиях элементов, то с его точки зрения элементами может быть выбрано любое допустимое состояние. В этом случае в качестве критерия эффективности механизма функционирования можно взять наихудшее значение целевой функции системы на множестве всех возможных вариантов ее функционирования. Такой подход к построению показателей функционирования при наличии той или иной неопределенности опирается на правило принятия решений, известное как гарантированный результат . Его применение соответствует принятию центром в условиях неопределенности осторожных , гарантированных оценок. Дальнейшее рассмотрение покажет, что гибко понимаемый принцип гарантированного результата является эффективным инструментом для построения оценок функционирования системы в самых различных условиях.  
Если центр не располагает никакой информацией о действиях элементов, то использование принципа гарантированного результата предполагает выбор наихудших (с позиции целевой функции системы) допустимых ее состояний. Критерий эффективности механизма функционирования в этом случае определяется как  
В зависимости от используемых центром методов построения прогноза могут применяться различные варианты задачи оптимального планирования с прогнозом состояний системы. Так, если центр не использует информацию о принципах выбора стратегий элементами, то значения упР могут определяться на основе классического принципа гарантированного результата  
В случае полной централизации планирования закон (4.7.9), (4.7.10) превращается в закон оптимального планирования. Если рассматривать выбор значения плана я как стратегию центра, то нетрудно заметить, что процедура определения плана (4.7.9), (4.7.10) соответствует планированию на основе принципа гарантированного результата для игрока, делающего ход первым и располагающего информацией о принципах выбора рациональных стратегий элементами. Для сокращенного названия такой процедуры планирования (4.7.9) — (4.7.10) будем использовать обозначение ОПП (оптимальное планирование с прогнозом). Дополнив задачу (4.7.9), (4.7.10) процедурой однозначного выбора решений (если таких решений несколько), получим конкретный закон оптимального планирования с прогнозом ).  

По отношению к неопределенности, связанной с незнанием параметров г = rt , центр может использовать два вида действий. Первый заключается в использовании для устранения неопределенности принципа гарантированного результата. Функционирование систем в этом  
Принцип максимального гарантированного результата может также быть рациональным, если элементы не используют информацию о прошлых периодах функционирования (например, в системе без повторения периодов функционирования). Указанные факторы послужили основанием того, что в ряде моделей двухуровневых систем в качестве принципа выбора рациональных стратегий элементов принимается принцип гарантированного результата. При этом предположении в 5.12 будут рассматриваться механизмы функционирования 2е = , яе> (с полной или частичной централизацией планирования).  
Таким образом, если поведение элементов при выборе оценок s = , определяется принципом гарантированного результата, то в условиях теорем 5.9 — 5.13 механизмы функционирования 2е позволяют обеспечить достоверность сообщаемых данных sr = г при любых 0 механизме функционирования 2е, можно увеличить значение его критерия эффективности. Действительно, значение целевой функции системы в решении игры элементов sr = г для механизма функционирования 2Е будет равно  
Исследование функционирования организационных систем с детерминированными моделями ограничений при встречном способе формирования данных начато в теория активных систем в начале 70-х годов в работах . Первые полученные результаты касались исследования простых одномерных моделей, определения условий обеспечения достоверности информации, эффективности различных вариантов принципа согласованного планирования . Интересно отметить, что удовлетворительных (или хороших) результатов функционирования по этим показателям удается добиться в тех случаях, когда в системе действует эффективная система штрафов за искажение информации или обеспечивается в том или ином смысле согласование интересов центра и активных элементов. Так, в наибольшей степени идею согласования интересов элементов и центра отражает закон открытого управления, при котором каждому активному элементу центр устанавливает наиболее предпочтительный план. Еще одно направление исследований систем с встречным способом формирования данных было связано с рассмотрением механизмов, обеспечивающих прогрессивное стимулирование сообщаемых элементами оценок. Подробный обзор результатов, полученных в этой области до 1975 г., можно найти в . Несколько позднее рассмотрение встречного способа формирования данных было начато и в теории игр . Параллельно проводились исследования случая, когда по отношению к неопределенности в моделях элементов центр выступает с позиций принципа гарантированного результата .  
Уже два приведенных примера отчетливо показывают ряд важных особенностей функционирования систем с зависимыми периодами и дальновидными элементами. Во-первых, существенно усложняются критерии элементов и соответственно принципы выбора рациональных стратегий элементов. Во-вторых, множество R (r, N) решений игры элементов в таких системах зависит от степени дальновидности N = Nt элементов. Поскольку степень дальновидности является субъективной характеристикой элементов, то она может быть, вообще говоря, неизвестна центру. Поэтому и критерии эффективности элементов, учитывающие будущее, также могут быть неизвестны центру полностью, даже если ему известен вид целевых функций элементов в отдельном периоде функционирования. Следовательно, при построении показателей, оценивающих функционирование организационной системы на основе принципа гарантированного результата, необходимо также брать гарантированный результат по степени дальновидности элементов. Например, аналог критерия эффективности механизма функционирования в системе с встречным способом формирования  

Горелик В. А. Принцип гарантированного результата в неантагонистических играх с обменом информации/В кн. Исследование операций, вып. 2.— М. Вычислительный центр АН СССР, 1971.  
Критерий максимина (принцип гарантированного результата, или критерий Вальда). Данный принцип заключается в выборе в качестве оптимальной (наиболее эффективной) той альтернативы (стратегии), которая имеет наибольшее среди наименее благоприятных состояний внешней среды значение функции полезности. Таким образом, оптимальной считается альтернатива А», для которой выполняется соотношение  
Критерий Гурвица. Данный критерий представляет собой комбинацию принципа гарантированного результата и принципа оптимизма. Функция, описывающая критерий Гурвица, представляется в виде  
В зависимости от значения весового коэффициента а можно получить различные предпочтительные альтернативы. Причем если а = 0, то имеем принцип оптимизма, если а — 1, то получим принцип гарантированного результата.  
Для выбора «нехудших» систем (оптимальных по Парето) разработаны достаточно эффективные методы. Но, как правило, методы безусловного предпочтения не позволяют окончательно определить оптимальное решение. В связи с этим предложен ряд методов векторной оптимизации, среди которых следует отметить методы выделения ведущего показателя, лексикографического упорядочения показателей, использования принципа гарантированного результата и его обобщений, а также методы последовательных уступок, формирования обобщенного П К (ОПК) и др. .  
Использование принципа наилучшего гарантированного результата (2.4) означает, что Центр рассматривает производственную единицу как природный фактор. Конечно, при наличии информации об интересах производственной единицы разумно использовать эти интересы для достижения лучших результатов, чем (2.4). Пусть, например, известно, что интересы производственной единицы состоят в том, что при воздействии Центра и е можно оценить с помощью гарантированного результата  
Стратегия St называется максиминной, т.е. при любом из условий конъюнктуры рынка результат будет не хуже, чем W — 1020 д.е. Поэтому такую величину называют нижней ценой игры, или максимином, а также принципом наибольшего гарантированного результата на основе критерия Валь-да, в соответствии с которым оптимальной стратегией при любом состоянии среды, позволяющем получить максимальный выигрыш в наихудших условиях, является максиминная стратегия.  
Поскольку игроку X неизвестно, какую стратегию выберет Y, то самому X разумно выбрать стратегию, рассчитанную на наихудшее для него поведение противника (принцип т.н. гарантированного результата).  
Посмотрим теперь, что могло бы получиться, если бы Центр управлял производственными единицами административным образом, т. е. не только распределял бы ресурсы щ, но и назначал программы производства ух,. .., у . Заметим, что отсутствие точной информации о величинах ь. .., %N не связано с тем, экономическим или административным образом осуществляется управление производственными единицами. В случае административного управления Центр выбирает значения г/,,. .., ыдгиуь Тл- при неопределенных величинах 1(. .., ,v, поэтому опять разумно воспользоваться принципом гарантированного результата, т. е. решать следующую задачу найти такое распределение ресурсов j,. .., UN и вариантов производственных программ Yi > YN, на которых достигается  
Принцип гарантированного результата означает, что мы действуем осторожно в условиях неполной информации. Осторожность этого принципа выбора решения часто критикуется, предлагаются другие подходы. Скажем, предла-  
Однако представляется более рациональным распределить товар между рынками А2нА3, так как рынок А2 должен быть выбран согласно принципу гарантированного результата, а рынок А3 — согласно принципу оптимизма, причем изменение весового коэффициента в принципе Гурвица приводит к тем же альтернативам А2 и Ау Поэтому, используя формулу (6. 1 1 ) для двух рынков и а = 0,5, получим следующее процентное распределение товара между ними  

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *