Поиск в словарях
Искать во всех

Математическая энциклопедия - дифференциальные игры

Дифференциальные игры

дифференциальные игры

раздел математич. теории управления (см. Автоматического управления теория), в к-ром изучается управление в конфликтных ситуациях. Теория Д. и. примыкает также к общей игр теории. Первые работы по теории Д. и. появились в сер. 50-х гг. 20 в.

Постановка задач теории дифференциальных игр. Различают Д. и. двух игроков и нескольких игроков. Основные результаты получены для задач с двумя игроками. Содержательное описание этих задач укладывается в следующую схему. Имеется динамическая система, в к-рой часть управляющих воздействий подчинена игроку I, а другая часть игроку II. При постановке задачи, стоящей перед игроком I или II, предполагается, что выбор управлений этого игрока, гарантирующий ему достижение определенной цели при любом неизвестном заранее управлении противника, может опираться лишь на нек-рую информацию о текущих состояниях системы. В теории Д. и. рассматриваются также задачи управления в условиях неопределенности, когда помехи, действующие на систему, трактуются как управления противника. Напр., постановка задачи игрока I описывается следующим образом. Обычно предполагается, что движение управляемой системы задается дифференциальным уравнением

где хфазовый вектор системы, ии vуправляющие векторы игроков I и II соответственно. Определен класс стратегий игрока I, и для каждой стратегии определен пучок движений X(U), к-рый порожден этой стратегией в паре со всевозможными управлениями противника и выходит из начального состояния системы (1). Эти понятия выбираются так, чтобы они соответствовали заданным ограничениям на управления игроков и характеру информации о текущих состояниях системы, предоставленной игроку I. На движениях x(t), t>t0, системы (1) задан функционал (плата игры), значение к-рого игрок I стремится минимизировать (иногда функционал g зависит также от реализаций u(t), v(t), t>t0, управлений игроков). Учитывая самую неблагоприятную реализацию движения выбор к-рой в этой задаче предоставляется противнику, качество стратегий оценивается величиной

Задача игрока I состоит в определении стратегии на к-рой достигается минимум функционала х 1 (эта задача наз. задачей степени). Иногда рассматривается так наз. задача качества, в к-рой требуется определить условия существования стратегии удовлетворяющей неравенству где снек-рое заданное число.

Аналогичным образом формулируются задачи игрока II, к-рый максимизирует плату игры. Стратегии игрока II оцениваются величиной

Задача степени здесь состоит в выборе стратегии максимизирующей значение функционала x2, а задача качества в определении условий, при к-рых для нек-рой стратегии

Если в задачах игроков I и II классы стратегий и таковы, что для всякой пары можно определить хотя бы одно движение порожденное этой парой, то говорят, что эти две задачи составляют дифференциальную игру, определенную на классе стратегий Если в Д. и. выполняется равенство

то величина с 0 наз. ценой дифференциальной игры.

Типичным примером Д. и. является игра преследования уклонения. В этой игре х= ( х 1, . . ., xk+l) =(y1, ..., у k,z1, . . ., zl), где уи z фазовые векторы преследователя и преследуемого соответственно, движение к-рых описывается уравнениями

Наиболее часто рассматривается случай, когда выбор управлений стеснен ограничениями вида

(2)

где Р и Qнекоторые компакты. Платой в этой игре является время до встречи, т. е.

где {у} т и {z} т - векторы, составленные из первых ткомпонент векторов y и z. Таким образом, сближение точек {y(t)}m и {z(t)}m нa заданное расстояние е трактуется как встреча объектов. В случае, когда игроки располагают информацией о текущей позиции игры (t, x(t)), т. е. в позиционной игре преследования-уклонения, существует цена игры.

Формализации дифференциальных игр. Для математич. формализации Д. и. необходимы строгие определения перечисленных выше понятий. Основное внимание в теории Д. и. было уделено задачам, в к-рых игрокам известна позиция игры, а управления удовлетворяют ограничениям (2). В этом случае естественно было определить стратегии игроков как функции u=u(t, x), v=v(t, х )со значениями в компактах Ри Qсоответственно. Оказалось, однако, что при таком подходе нередки случаи, когда приходится рассматривать разрывные стратегии, а порожденные ими движения нельзя определить известными в теории дифференциальных уравнений понятиями. Трудности, возникшие сначала на этом пути, привели к созданию иных постановок Д. и. Ниже рассмотрены такие формализации, где не используются позиционные стратегии. Затем дана формализация позиционных Д. и., к-рая охватывает разрывные позиционные стратегии и базируется на специальном определении движений.

Среди сложившихся направлений в теории Д. и. прежде всего следует отметить цикл исследований (см., напр., [2] [4]), восходящих к работе У. Флеминга [1]. Здесь рассматривается аппроксимация Д. и. многошаговыми играми, где игроки последовательно (по шагам) выбирают свои управления на заданных промежутках времени [ti, ti+1), i=0, 1, . .., N. Причем обычно выделяется игрок, выбирающий каждый раз свое управление первым и сообщающий этот выбор противнику. В зависимости от того, минимизирует или максимизирует этот игрок плату игры, различают мажорантную и минорантную многошаговые игры. Применение этого подхода сводится к доказательству теорем существования цены Д. и., определенной здесь как общее значение, к к-рому сходятся цены мажорантной и минорантной игр при измельчении разбиений [ti, ti+1), i=0, 1, .. ., N (увеличении числа шагов). Однако построение позиционных стратегии, не зависящих от дискретизации времени, при таком подходе, как правило, не рассматривается.

Л. С. Понтрягин предложил постановку игровых задач управления (см., напр., [5] [8]), где допускается информационная дискриминация противника, т.

Рейтинг статьи:
Комментарии:

Вопрос-ответ:

Похожие слова

Ссылка для сайта или блога:
Ссылка для форума (bb-код):