Главная              Рефераты - Математика

Книга: Оптимальное управление линейными динамическими объектами

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

ГОУВПО «Пермский государственный университет»

С.В. Лутманов

ЛИНЕЙНЫЕ ЗАДАЧИ

ОПТИМИЗАЦИИ

Часть 2

Оптимальное управление линейными динамическими объектами

Учебное пособие

Рекомендовано УМС по математике и механике УМО по классическому университетскому образованию РФ в качестве учебного пособия для студентов высших учебных заведений, обучающихся по группе направлений и специальностей «Механика»

Пермь 2005

БК 22. 161.8

Л 86

УДК 519.9

Лутманов, С.В.

Л 86 Линейные задачи оптимизации: учеб. пособие [Электронный ресурс] /Перм. ун.-т. – Пермь, 2005.- Ч.2. Оптимальное управление линейными динамическими объектами. – 195 с.

ISBN 5-7944-0565-1

В учебном пособии рассматриваются задачи теории оптимального управления линейными динамическими объектами. В частности, подробно исследован случай управления с терминальным критерием качества и случай управления по критерию предельного быстродействия. Изучается возможность сведения задачи теории оптимального управления к функциональной проблеме моментов. Вывод необходимых условий оптимальности управляющих воздействий опирается на математический аппарат выпуклого анализа. Указываются эффективные достаточные условия оптимальности программных управлений. Само построение оптимальных управлений осуществляется либо аналитическим путем, либо с применением систем аналитических вычислений, реализуемых в интерактивном режиме на ЭВМ. Весь излагаемый материал поясняется на примерах, большинство из которых решено с применением пакета MATHEMATICA 4.2 Пособие предназначено для студентов, магистрантов и аспирантов математических специальностей, изучающих курсы, связанные с вопросами оптимизации.

Ил. 34. Библиогр. 32 назв.

Печатается в соответствии с решением редакционно-издательского совета Пермского государственного университета

Рецензенты: кафедра дифференциальных уравнений Удмуртского государственного университета; профессор кафедры «Математическое моделирование систем и процессов» Пермского государственного технического университета, д.т.н. В.Ю. Столбов

ISBN 5-7944-0565-1 © Лутманов С.В., 2005

ОГЛАВЛЕНИЕ

ПРЕДИСЛОВИЕ…………………………………………………………………. 5 1. ЛИНЕЙНЫЕ УПРАВЛЯЕМЫЕ ДИНАМИЧЕСКИЕ ОБЪЕКТЫ……….8

1.1. Примеры линейных управляемых динамических объектов …………………8

1.2. Системы однородных линейных дифференциальных уравнений …………16

1.3. Фундаментальная матрица Коши ……………................................................20

1.4. Допустимые реализации вектора управляющих параметров ………………26

1.5. Формула Коши …………………………...........................................................31

1.6. Критерии качества управления динамическими объектами………………..33

1.7. Программные стратегии ……………………………………………………...36

1.8. Постановка и существование решения задачи теории оптимального управ-

ления ……………………………………………………………………………….39

1.9. Область достижимости линейного управляемого динамического объекта 45

2. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ С ФИКСИРОВАННЫМ ВРЕМЕНЕМ И ТЕРМИНАЛЬНЫМ КРИТЕРИЕМ КАЧЕСТВА……………………………………..49

2.1. Случай закрепленного левого конца и свободного правого конца траекто-

рии ………………………………………………………………………………….49

2.2. Поведение функции Л.С. Понтрягина вдоль оптимальной пары…………..53

2.3. Частные случаи геометрических ограничений на вектор управляющих па-

раметров……………………………………………………………………………56

2.4. Минимизация расстояния до целевого множества…………………………67

2.5. Случай подвижного левого и свободного правого конца траектории……85

2.6. Минимизация расстояния до целевого множества в случае подвижного ле-

вого конца траектории…………………………………………………………….96

3. ЗАДАЧА ЛИНЕЙНОГО ПРЕДЕЛЬНОГО БЫСТРОДЕЙСТВИЯ…….107

3.1. Постановка задачи линейного предельного быстродействия и существова-

ние ее решения.……………………………………………………………………107

3.2. Необходимые условия оптимальности программной стратегии ………….108

4. ЛИНЕЙНАЯ ЗАДАЧА ТЕОРИИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ КАК ФУНКЦИОНАЛЬНАЯ ПРОБЛЕМА МОМЕНТОВ………………….117

4.1. Сведение задачи теории оптимального управления к функциональной про-

блеме моментов…………………………………………………………………..117

4.2. Управляемость линейной динамической системы…………………………125

4.3. Управление по критерию «минимум энергии»…………………………….128

4.4. Управление по критерию «минимум силы»……………………………….134

ПРИЛОЖЕНИЕ…………………………………………………………………142 БИБЛИОГРАФИЧЕСКИЙ СПИСОК …………………………………...192

ПРЕДИСЛОВИЕ

Предлагаемое учебное пособие написано на основе спецкурса «Линейные задачи оптимизации», который автор читает для студентов и магистрантов (специальность «Механика») механико-математического факультета Пермского государственного университета. Оно представляет собой конспект лекций той части курса, которая посвящена задачам оптимального управления линейными динамическими системами. Линейные динамические системы с выпуклыми геометрическими ограничениями на управляющие параметры являются удобными объектами исследования в теории оптимального управления. Вывод необходимых условий оптимальности управляющих воздействий для таких систем опирается на математический аппарат выпуклого анализа и требует существенно меньших усилий, чем для нелинейных систем. В ряде случаев удается сформулировать эффективные достаточные условия оптимальности. Само построение оптимальных управлений осуществляется либо аналитическим путем, либо с применением систем аналитических вычислений, реализуемых в интерактивном режиме на ЭВМ.

Пособие состоит из четырех разделов и приложения. В первом разделе изучаются основные свойства систем линейных дифференциальных уравнений, вводится понятие фундаментальной матрицы Коши системы однородных линейных дифференциальных уравнений и доказывается формула Коши. Здесь же приводится постановка задачи теории оптимального управления в классе программных стратегий, оговаривается класс допустимых стратегий и доказывается теорема существования решения задачи теории оптимального управления.

Во втором разделе для задач управления с терминальным критерием качества и фиксированным временем выводятся необходимые условия оптимальности программного управления в форме принципа максимума Л.С. Понтрягина. В частности, когда минимизируемый функционал имеет смысл расстояния от целевого множества до фазового вектора объекта в финальный момент времени, эти условия записываются в форме прицеливания на опорный вектор к области достижимости динамического объекта. Для этого случая формулируются и доказываются эффективные достаточные условия оптимальности. Рассмотрены ситуации, когда левый конец траектории закреплен и когда он является подвижным. В последнем случае принимается, что множество начальных положений объекта описывается системой дифференцируемых неравенств.

Третий раздел посвящен задачам линейного быстродействия. Оптимальное время перехода определяется здесь как разность между первым моментом времени, для которого пересечение области достижимости управляемого объекта и целевого множества не является пустым, и начальным моментом времени. Оптимальная программная стратегия строится из условия прицеливания на соответствующий опорный вектор к области достижимости объекта.

В четвертом разделе изучается возможность сведения задачи теории оптимального управления к функциональной проблеме моментов. Приводятся необходимые и достаточные условия разрешимости проблемы моментов. На их основе доказывается критерий полной управляемости динамическим объектом и реализуется конструктивный алгоритм решения задачи теории оптимального управления по критерию «минимум энергии» и «минимум силы».

В каждом разделе пособия дается подробный алгоритм решения соответствующего класса задач теории оптимального управления. Реализация алгоритма поясняется на конкретных примерах. Большинство из них решается с применением пакета MATHEMATICA 4.2. Заголовки примеров, решение которых требует обращения к компьютеру, помечены звездочкой. Для них в приложении приводятся тексты программ, обеспечивающие решение этих примеров.

По тематике книги существует обширная библиография. Приведенный в конце книги библиографический список содержит лишь те источники, которые непосредственно использовались при написании данного учебного пособия. Пособие разбито на разделы, внутри которых принята самостоятельная нумерация задач, лемм, рисунков, примеров и теорем. В свою очередь, раздел разбит на пункты, в которых ведется независимая нумерация формул. Ссылки на материалы (за исключением формул), расположенные в пределах данного раздела, нумеруются одним числом, вне данного раздела – двумя числами. Ссылки на формулы нумеруются одним числом только в пределах данного пункта. Вне данного пункта, но в пределах данного раздела, они нумеруются двумя числами, вне данного раздела – тремя числами.


1. ЛИНЕЙНЫЕ УПРАВЛЯЕМЫЕ ДИНАМИЧЕСКИЕ ОБЪЕКТЫ

1.1. Примеры линейных управляемых динамических объектов. Рас-

смотрим управляемые объекты, состояние которых в каждый момент времени t R 1 характеризуется набором величин x 1 ,",x n . Эти величины называются фазовыми координатами объекта. Управление объектом осуществляется посредством воздействий u 1 ,",u r , которые будем называть управляющими параметрами объекта. Принимаем, что изменение фазовых координат во времени описывается системой обыкновенных линейных дифференциальных уравнений вида

x 1 = a 11 (t x ) 1 + +" a 1n (t x ) n +b 11 (t u ) 1 + +" b 1r (t u ) r +c t 1 ( ),

.......................................................................................... (1)

x n = a n 1 (t x ) 1 + +" a nn (t x ) n +b n 1 (t u ) 1 + +" b nr (t u ) r +c n (t ),

где a ij = a ij (t ), b ik = b ik ( )t , c i = c t i ( ), t R i j 1 , , =1,", ,n k =1,",r - известные непрерывные функции времени.

Система дифференциальных уравнений (1) допускает векторноматричную запись

x = A t x ( ) +B t u ( ) +C t ( ). (2)

Здесь обозначено

⎛⎜ x

x = ⎜⎜⎜⎜⎜⎜"x 1n ⎠⎟⎟⎟⎟⎟⎟⎟⎟, u =⎛⎝⎜⎜⎜⎜⎜⎜⎜"uu 1r ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟, A t ( )= ⎜⎛⎝⎜⎜⎜⎜⎜⎜⎜aa 11n "1( )( )tt """ aa 1nn "n ( )( )tt ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟, B t ( )=⎜⎛⎝⎜⎜⎜⎜⎜⎜⎜bb 11n "1( )( )tt """ bb 1nr "r ( )( )tt ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟, C t ( )=⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜cc t 1n "( )( )t ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟.

Векторы xR n и uR r называются фазовым вектором и вектором управляющих параметров объекта, соответственно.

Система дифференциальных уравнений (1), или ее векторно-матричная форма (2), является математической моделью (с той или иной степенью точности) реального управляемого физического объекта. В дальнейшем эту математическую модель будем называть линейным управляемым динамическим объектом. Следуя [17], приведем примеры линейных управляемых динамических объектов.

Пример 1. Рассмотрим материальную точку массы m , движущуюся в вертикальной плоскости ξ η , в однородном поле тяжести (см. рис. 1 ). Управ-

ляющее воздействие на точку M осуществляет-

ся посредством реактивной силы f , возникающей в результате отделения от точки частиц с элементарной массой dm . Тогда масса точки M является величиной переменной, а движение точки описывается векторным дифференциальным

ξ уравнением Мещерского

Рис. 1

m dv = +mg dm a r , (3) dt dt

где a r - вектор относительной скорости отде-

ляющихся частиц. Проектируя уравнение (3) на оси выбранной системы координат, получим

= ma cosα ξ , (4) = ma cosα η mg .

Здесь α α ξ , η - углы, которые составляет вектор относительной скорости отделяющихся частиц с соответствующими координатными осями. Запишем систему (4) в нормальной форме

x 1 = x 3 ,

x 2 = x 4 , (5) x 3 = u 1 , x 4 = u 2 g ,

где

x 1 = = = = =ξ , x 2 η , x 3 ξ , x 4 η , u 1 a m cosα ξ , u 2 = a m m cosα η . m

Векторно-матричная форма системы дифференциальных уравнений (5) имеет вид

⎛⎜⎜x ⎞⎟

⎜⎜⎜x

⎜⎝⎜⎜⎜⎜⎜⎜xx 12 43⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟=⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎛000 0 000 0 1000 1000 ⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎝⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜x x x x 12 43⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎝⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜1 00 0 1 000 ⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎜⎝⎜⎜⎛u u 1 2 ⎠⎞⎟⎟⎟⎟+⎝⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜−000g ⎟⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠⎟.

Обычно физический объект можно моделировать линейными дифференциальными уравнениями лишь в дополнительных предположениях об области изменения его фазовых координат.

Пример 2. Рассмотрим упругий вал, несущий жестко насаженные маховики A B , и C (см. рис. 2 ). Система вращается вокруг оси вала с постоянной угловой скоростью ω , однако вследствие возмущений возникают крутильные колебания, которые необходимо успокоить управ-

ляющими моментами u u 1 , 2 , приложенными к ма-

ховикам A и C соответственно. Система имеет три степени свободы. В качестве обобщенных координат выбираются следующие величины: q 2 - угол отклонения маховика B от заданного движения системы ψ (t )=ωt t , ≥t 0 ; q q 1 , 3 - суть углы закручивания маховиков A и C соответственно относительно маховика B .

Пусть I A ,I B ,I C - моменты инерции маховиков. Вычислим кинетическую энергию всей системы. Имеем

T = 1 2 I A (ω + + +q 1 q 2 )2 1 2 I B (ω + +q 2 )2 1 2 I C (ω + +q 3 q 2 )2 .

Обозначим через c c 1 , 2 крутильные жесткости соответствующих участков вала. Принимаем, что система работает в пределах деформаций, подчиняющихся закону Гука. Тогда потенциальная энергия системы определяется равенством

Π = 1 2 c q 1 12 + 1 2 c q 2 32 .

Из выражения для элементарной работы

δA =Q q 1 δ 1 +Q q 2 δ 2 +Q q 3 δ 3 = + +u q 1 δ 1 (u 1 u 2 )δq 2 +u q 2 δ 3

следует, что обобщенные силы Q i i , =1,2,3 выражаются равенствами

Q 1 = u Q 1 , 2 = +u 1 u 2 ,Q 3 = u 3 .

Составим уравнения Лагранжа

d ⎛⎜⎜ T ⎞⎟

dt ⎜⎜⎝∂q i ⎠⎟⎟⎟−∂ q T i =Q i ∂Πq i , i =1,2,3.

Получаем следующие три дифференциальных уравнения второго порядка:

I q A 1 + =I q A 2 −c q 1 1 +u 1 ,

I A q 1 + + +(I A I B I C )q 2 + = +I q C 3 u 1 u 2 , (6)

I q C 2 + =I q C 3 −c q 2 3 +u 2 .

Разрешим систему дифференциальных уравнений (6) относительно старших производных

q 1 = − c 1(I A + I B )q 1 − c 2 q 3 + 1 u 1,

I I A B I B I A

q 2 = +c 1 q 1 c 2 q 3 , (7)

I B I B q 3 = − c 1 q 1 − c 2 (I B + I C )q 3 + 1 u 2.

I B I B + I C I C

Проведя замену переменных

x 1 = q 1 , x 2 = q 2 , x 3 = q 3 , x 4 = q 1, x 5 = q 2, x 6 = q 3 ,

запишем систему (7) в нормальной форме

x 1 = x 4 , x 2 = x 5 , x 3 = x 6 ,

x 4 = − c 1 (I A + I B ) x 1 − c 2 x 3 + 1 u 1,

I I A B I B I A

x 5 = +c 1 x 1 c 2 x 3,

I B I B

x 6 = − c 1 x 1 − c 2 (I B + I C ) x 3 + 1 u 2. (8)

I B I B +I C I C

Векторно-матричная форма системы дифференциальных уравнений (8) имеет вид

⎜⎜⎜⎜⎛ 00 00 00 10 10 00⎞⎟⎟⎟⎟⎟ ⎜⎛ 0 0 ⎞

⎟⎟ ⎜⎜⎜⎜⎜⎜⎜ 0 0 0 0 0 1⎟⎟⎟⎟⎜⎛ x

⎜⎜⎜xx ⎟⎟⎟⎟⎟⎟ = ⎜⎜⎜⎜⎜− c ( II I + I ) 0 − Ic 0 0 0⎟⎟⎟⎟⎟⎟⎟⎟⎜⎜⎜⎜⎜⎜⎜xx ⎟⎟⎟ ⎜⎜⎜ ⎟

⎜⎜⎜⎝⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜x xx x 12 4653 ⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟ ⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜ 1 Ic A I A B B 1 c B 1 B 00 c 2 I (B IIc B +B 2 B 2 +I C I C ) 00 00 00 ⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜xxx 1 652 43 ⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎜⎜⎜⎜⎜⎜⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜ I 10 000 A I 1 0000 C ⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎛⎜⎜⎜⎝u u 1 2⎞⎠⎟⎟⎟⎟.

⎜⎜

⎜⎝⎜⎜ ⎟

Заметим, что в разобранном примере математическая модель, представленная системой дифференциальных уравнений (8), адекватна физическому объекту только в пределах деформаций, удовлетворяющих закону Гука, т.е. ес-

ли фазовые координаты x 1 ,x 2 ,x 3 достаточно малы по абсолютной величине.

К дифференциальным уравнениям вида (2) можно прийти и в результате линеаризации исходных нелинейных дифференциальных уравнений движения объекта. Опишем процедуру линеаризации.

Пусть математической моделью управляемого динамического объекта служит система нелинейных дифференциальных уравнений

y =Y t y v ( , , ) , t ∈[t T 0 , ], y R n , v R r . (9) Относительно функции Y :[t 0 ,TR n + r R n предполагается существование непрерывных частных производных не ниже второго порядка включительно по каждому из аргументов.

Допустим, что некоторой функции v :[t T 0 , ]→ R r отвечает решение y ()⋅ = y (⋅,t 0 , y 0 ,v () ) дифференциального уравнения (9), удовлетворяющее начальному условию y t ( 0)= y 0 . Предположим, что именно эта функция y (⋅) является требуемым законом движения для управляемого объекта. Однако при физической реализации указанного управления v (⋅) закон движения y ()⋅ реального динамического объекта вследствие ряда факторов (неадекватность математической модели, наличие неконтролируемых возмущений, невозможность в точности удовлетворить начальным условиям и др.) будет отличаться от идеального движения y ()⋅ . Для реализаций управляющих воздействий и отвечающих им движений примем следующее представление:

y (⋅)= y (⋅)+ x (⋅), v (⋅)= v (⋅)+ u (⋅). (10) Здесь величины x ()⋅ , u ()⋅ полагаются малыми. Подставим выражения (10) в уравнения (9). В результате получим

y ( )t + x ( )t = Y (t , y (t )+ x (t ),v (t )+ u (t )), t ∈[t 0 ,T ]. (11) С точностью до величин второго порядка малости по отношению к x (⋅) , u (⋅) из (11) выводим

y ( )t + x ( )t =Y ( ) ( ) [ ,T ]. y v

Обозначая

A ( )t = Y (t , y ( )t ,v ( )t ), B ( )t = Y (t , y ( )t ,v ( )t ), t ∈[t 0 ,T ] (12)

y v

и учитывая, что

y ( )t = Y (t , y (t ), v (t )), t ∈ [t 0 ,T ],

приходим к уравнениям (2), в которых C t ( )= 0, t ∈[t T 0 , ].

Пример 3*. На горизонтальный плоскости находится двухзвенный механический манипулятор, каждое звено которого представляет собой абсолют-

но жесткий стержень длиной

l i ,i =1,2. Первое звено соединено с неподвижным основанием манипулятора вращательной парой O 1 , а со вторым звеном – враща-

Рис. 3 тельной парой O 2 . Масса схвата

манипулятора – m , центр масс i -го звена находится в середине стержня – точке C i , его масса – m i , момент инерции i -го звена относительно своего центра масс – I i ,i =1,2. В соединительных парах могут развиваться управляющие вращательные моменты, соответственно, v 1 и v 2 ,

На горизонтальной плоскости, в которой расположен манипулятор, введем прямолинейную ось O 1 x . Обозначим через ϕi угол, образованный i -м звеном манипулятора, i =1,2, с осью O 1 x . Запишем дифференциальные уравнения движения манипулятора в форме уравнений Лагранжа второго рода, в которых в качестве обобщенных координат берутся углы ϕi ,i =1,2 . Кинетическая энергия манипулятора определяется по формуле

T = T 1 + T 2 + T c , (13)

где T i – кинетическая энергия i -го, i =1,2, звена, а T c – кинетическая энергия схвата манипулятора. Последовательно вычисляем

1 ( 2 21 )( 2 2 2 ) 4I 1 + m 1l 12 2

T 1 = I 1 ϕ1 + m 1 v C = 4I 1 ϕ1 + m 1 l 1 ϕ1 = ϕ1 ,

28

T 2 = (I 2ϕ22 + m 2 v C 22 )= [4I 2ϕ22 + 4m 2 l 12ϕ12 + m 2 l 22ϕ22 + 4m 2 l 1l 2ϕ1ϕ2 cos(ϕ1 −ϕ2 )],

T c = mv c 2 = m [l 12ϕ12 + l 22ϕ22 + 2l 1l 2ϕ1ϕ2 cos(ϕ1 −ϕ2 )].

Подставляя найденные величины энергий составных частей манипулятора в (13), находим

T = 1 2 [l 1 2 (m 1 + 4m 2 + 4m )+ 4I 1 ]+ 1 ϕ2 2 [l 2 2 (m 2 + 4m )+ 4I 2 ]+ (2m + m 2 )l 1 l 2 ϕ1 ϕ2 cos(ϕ1 −ϕ2 ).

8 8

Введем обозначения

a = 1 [l 1 2 (m 1 + 4m 2 + 4m )+ 4I 1 ], b = 1 [l 2 2 (m 2 + 4m )+ 4I 2 ], c = (2m + m 2 )l 1 l 2 .

4 4

Тогда выражение для кинетической энергии манипулятора принимает вид

T = [a ϕ1 2 + 2c ϕ1 ϕ2 cos(ϕ1 −ϕ2 )+ b ϕ2 2 ].

Справедливы равенства

T d T

= a ϕ1 + c ϕ2 cos(ϕ1 −ϕ2 ), = a ϕ1 + c ϕ2 cos(ϕ1 −ϕ2 )− c ϕ2 1 −ϕ2 )sin(ϕ1 −ϕ2 ),

∂ϕ1 dt ∂ϕ1

T d T

= b ϕ2 + c ϕ1 cos(ϕ1 −ϕ2 ), = b ϕ2 + c ϕ1 cos(ϕ1 −ϕ2 )− c ϕ11 −ϕ2 )sin(ϕ1 −ϕ2 ),

∂ϕ2 dt ∂ϕ2

T = −c ϕ1 ϕ2 sin(ϕ1 −ϕ2 ), T = c ϕ1 ϕ2 sin(ϕ1 −ϕ2 ). (14)

∂ϕ1 ∂ϕ2

Обобщенной силой Q i , отвечающей обобщенной координате ϕi , является управляющий вращательный момент v i , i =1,2.

Используя формулы (14), выпишем уравнения Лагранжа

d T T

− = Q i , i =1,2.

dt ∂ϕi ∂ϕi

В результате получим

a ϕ 1 +c ϕ 2 cos (ϕ ϕ 1 − 2)+c ϕ 2[1] sin (ϕ ϕ 1 − 2)= v 1 , c ϕ 1 cos (ϕ ϕ 1 − 2)+b ϕ 2 −c ϕ 12 sin (ϕ ϕ 1 − 2)= v 2 . (15)

Разрешим дифференциальные уравнения (15) относительно старших производных

2 2 ,

1 2 abc cos (ϕ ϕ 1 − 2 )

2 2 .

2 2 abc cos (ϕ ϕ 1 − 2 )

Полученную систему двух дифференциальных уравнений второго порядка от-

носительно переменных ϕ12 заменой переменных

y 1 =ϕ 1, y 2 =ϕ 2, y 3 =ϕ 1, y 4 =ϕ 2

сведем к системе четырех дифференциальных уравнений первого порядка

y 1 = y 3 , y 2 = y 4 ,

1 2bv −2bcy sin y y −2cv cos y y c y sin 2

y 3 = ⋅ 1 4 2 ( 1 2 ) 2 2 2 ( 1 2 ) 2 3 2 (y 1 y 2 ),

2 abc cos (y 1 − y 2 )

y 4 = 1 ⋅ 2av 2 +2acy 32 sin(y 1 − y 2 )−2cv 2 1 cos2 (y 1 − y 2 )+c y 2 42 sin 2⎡⎣ (y 1 − y 2 )⎤⎦ (16)

⎛ ⎞⎜⎜⎜0 ⎟⎟

v ∗( )t ≡ ⎛ ⎞⎜⎝ ⎠⎜0 0 ⎟⎟⎟⎟, y ∗( )t = ⎜⎜⎜⎜⎜⎝ ⎠⎜0 00 ⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟.

По формулам (10) находим

⎜⎜ 0 0 1 0⎞⎟

A = ⎜⎜ ⎜⎜⎜⎜00 0 0 00 0 00 1 00 ⎠⎟⎟⎟⎟ ⎟⎟⎟ ⎟⎟⎟ , B = ⎜⎜ ⎜⎛⎜⎜ ⎜⎜⎜⎝⎜⎜⎜ab cab c 00 −− b c 22 ab cab c 00 −− a c 22 ⎞⎠⎟⎟ ⎟⎟⎟ ⎟⎟ ⎟⎟.

⎜⎝⎜

Таким образом, линеаризованные уравнения здесь имеют вид

⎜⎜⎛ x

⎜⎜⎜⎜⎜xx ⎟⎟⎟⎟

⎜⎜⎜⎜⎜⎝x 1423⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟ = ⎜⎜⎜⎜⎝⎜⎜⎜⎜⎜⎜⎜⎛0000 0000 1000 1000⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎝⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜xxxx 1423⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎜⎜⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎛ab cab c 00−−bc 22 ab cab c 00−−ac 22 ⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎝⎜⎜⎛⎜uu 12 ⎞⎟⎟⎟⎟⎠.

1.2. Системы однородных линейных дифференциальных уравнений

Системе дифференциальных уравнений (1.1) поставим в соответствие однородную систему уравнений

x 1 = a 11 (t x ) 1 + +" a 1n (t x ) n ,

.............................................. x n = a n 1 (t x ) 1 + +" a nn (t x ) n .

или ее векторно-матричный аналог

x = A t x ( ) . (1)

Установим некоторые простейшие свойства дифференциального уравнения (1).

Свойство 1. Пусть x (⋅) - решение дифференциального уравнения (1) и x t ( 0)= 0 для некоторого значения t 0 R 1 . Тогда x ( )t ≡ 0, t R 1 .

Доказательство. Справедливость свойства следует непосредственно из теоремы существования и единственности решения дифференциальных уравнений.

Свойство 2. Пусть x ( 1 ) (⋅),",x ( s ) (⋅) - система решений уравнения (1). Тогда для всех α 1,",α s R 1 выражение

x ˆ()⋅ =∑s α i x ( )i ()⋅

i =1

будет также решением дифференциального уравнения (1).

Доказательство. Действительно,

dx t ˆ( ) ⎛ ⎞ ⎛ ⎞

.

dt dt i = 1 ⎠ i = 1 i = 1 ⎝ i = 1 ⎠

Определение 1. Система решений x ( 1 ) (⋅),",x ( s ) (⋅) уравнения (1) называется линейно зависимой, если существуют такие константы α 1,",α s R 1 , не обращающиеся одновременно в нуль, что

s α i x ( ) i ( )t ≡ 0, t R 1 .

i =1

В противном случае система решений x ( 1 ) (⋅),",x ( s ) (⋅) называется линейно независимой.

Заметим, что для зависимой системы решений x ( 1 ) (⋅),",x ( s ) (⋅) набор векторов x ( 1 ) (t ),",x ( s ) (t ) является линейно зависимым при всех t R 1 . Это утверждение может быть обращено следующим образом.

Лемма 1. Пусть для некоторого значения t 0 R 1 набор векторов

x ( 1 ) (t 0 ),",x ( s ) (t 0 ) линейно зависим. Тогда система решений x ( 1 ) (⋅),",x ( s ) (⋅) уравнения (1) является линейно зависимой.

Доказательство. Из линейной зависимости векторов x ( 1 ) (t 0 ),",x ( s ) (t 0 ) следует существование ненулевого набора констант α 1,",α s R 1 , для которого

s α i x ( ) i ( )t 0 = 0 . (2)

i =1

Полагаем

x ˆ()⋅ =∑s α i x ( )i ()⋅ .

i =1

По свойству 2 функция x ˆ()⋅ является решением уравнения (1), при этом в силу

(2) справедливо равенство x t ˆ( 0)= 0. Тогда по свойству 1 должно выполняться

s

x ˆ( )t =∑α i x ( ) i ( )t ≡ 0, t R 1 ,

i =1

что и означает искомую линейную зависимость системы решений

x ( 1 ) (⋅),",x ( s ) (⋅). Лемма доказана.

Следствие. Пусть система решений x ( 1 ) (⋅),",x ( s ) (⋅) линейно независима.

Тогда набор векторов x ( 1 ) ( )t ,",x ( s ) ( )t является линейно независимым при всех t R 1 .

Доказательство. От противного приходим к существованию некоторого значения t R , для которого набор векторов x ( 1 ) ( )t ,",x ( s ) ( )t является линейно зависимым. Тогда по лемме 1 система решений x ( 1 ) (⋅),",x ( s ) (⋅) должна быть зависимой, что противоречит исходным предположениям.

Установим критерий линейной зависимости и независимости системы

решений x ( 1 ) (⋅),",x ( s ) (⋅) уравнения (1).

Теорема 1. Система решений x ( 1 ) (⋅),",x ( s ) (⋅) уравнения (1) является линейно зависимой или линейно независимой, тогда и только тогда когда соответственно линейно зависим или линейно независим набор векторов x ( 1 ) (t 0 ),",x ( s ) (t 0 ) хотя бы при одном значении t 0 R 1 .

Доказательство. Необходимость теоремы вытекает непосредственно из определения 1 и следствия из леммы 1 . Достаточность в части линейной зависимости системы решений x ( 1 ) (⋅),",x ( s ) (⋅) доказана в лемме 1 . Наконец, если набор векторов x ( 1 ) (t 0 ),",x ( s ) (t 0 ) является линейно независимым при некотором значении t R , то для системы решений x ( 1 ) (⋅),",x ( s ) (⋅)равенство

s α i x ( )i ( )t 0 = 0

i =1

невозможно ни при каких ненулевых наборах констант α 1,",α s R 1 . Это означает, что система решений x ( 1 ) (⋅),",x ( s ) (⋅) не является линейно зависимой, и поэтому она линейно независима. Теорема доказана.

Определение 2. Линейно независимая система решений

x ( 1 ) (⋅),",x ( n ) (⋅) (3)

дифференциального уравнения (1), где n - размерность вектора x , называется фундаментальной системой решений дифференциального уравнения (1). Теорема 2. Для уравнения (1) существует фундаментальная система решений, и любое решение этого уравнения может быть представлено как линейная комбинация решений, составляющих фундаментальную систему. Доказательство. Пусть набор векторов

e 1,",e n R n

образует базис в R n . Определим систему решений (3) условиями

x ( i ) (t 0 )= =e i i , 1,",n .

По теореме 1 из линейной независимости векторов x ( 1 ) (t 0 ),",x ( n ) (t 0 ) вытекает линейная независимость системы решений (3). Таким образом, существование фундаментальной системы решений для уравнения (1) установлено.

Покажем, что каждое решение x ()⋅ уравнения (1) можно представить в виде

x ( )t =∑n α i x ( ) i ( )t , t R 1 .

i =1

Набор векторов x ( 1 ) (t 0 ),",x ( n ) (t 0 ) является базисом в R n . Тогда для любого решения x (⋅) уравнения (1) найдется набор констант α 1,",α n R 1 такой, что

n x ( )t 0 =∑α i x ( )i ( )t 0 .

i =1

Решения x ()⋅ и n α i x ( ) i ()⋅ имеют общее начальное условие и потому совпадают.

i =1

Теорема доказана.

Пример 4*. Рассмотрим однородную линейную систему дифференциальных уравнений третьего порядка

x 1 = + +x 1 4x 2 x 3 ,

x 2 = + +x 1 x 2 x 3 , (4) x 3 = 2x 1 −4x 2 + x 3 .

Приведем векторно-матричную форму записи этой системы

⎜⎝⎛⎜⎜⎜xx 123⎞⎟⎟⎟⎟⎟⎟⎟⎟=⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜112 −144 111⎠⎝⎞⎛⎟⎟⎟⎟⎟⎟⎟⎟⎜⎜⎜⎜⎜⎜⎜⎜xxx 123⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟.

⎜⎜x

⎜⎜

Покажем, что следующая система решений этого уравнения

⎜⎛2e

x ( )1 ( )t =⎜⎜⎜⎜⎜⎜⎝ e 033tt ⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟, x ( )2 ( )t =⎜⎜⎜⎛⎜⎜⎜⎜⎜⎝7coscos−10tt +cos2sinsint tt ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟, x ( )3 ( )t =⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜−43coscos−t sint −+sint 2sint t ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟, t R 1

образует фундаментальную систему решений.

Сначала непосредственно проверяем, что каждый член системы

2e 3t

D t ( )= e 3t

0

7cost +sint cost −2sint

−10cost

3cost −sint

−sint .

−4cost +2sint

x ( 1 ) (⋅),x ( 2 ) (⋅),x ( 3 ) (⋅) является решением уравнений (2). Далее составим определитель

Вычислим его значение при t = 0. Имеем

2 7 3

D ( )0 =1 1 0= −10 ≠ 0.

0 −10 −4

Таким образом, D ( )0 ≠ 0 и набор векторов x ( 1 ) (0), x ( 2 ) (0), x ( 3 ) (0) является линейно независимым. Тогда по теореме 1 система решений x ( 1 ) (⋅),x ( 2 ) (⋅),x ( 3 ) (⋅) уравнений

(2) является фундаментальной системой решений.

1.3. Фундаментальная матрица Коши. Пусть

x ( )1 ()⋅ =⎜⎜⎜⎜⎜⎜⎛x 1n ( )( )"11 ((⋅⋅))⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟,",x ( )n ()⋅ =⎝⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜xx 1n ( )( )"nn ((⋅⋅))⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟ ⎝⎜⎜⎜x

фундаментальная система решений однородного дифференциального уравнения (2.1). Для всех t R 1 построим квадратную матрицу Z (t ) следующего вида

Z t ( )=⎛⎜⎜⎜⎜⎜x 1( )"1 (t )

"

"

x 1( )n (t )⎞⎟⎟⎟⎟⎟⎟⎟.

"

⎝⎜⎜⎜x n ( )1 (t ) " x n ( )n (t )⎠⎟⎟⎟

Из теоремы 1 следует, что матрица Z (t ) является невырожденной при всех t R 1 и, следовательно, для всех t R 1 существует обратная матрица

ζ1( )1 ( )t

Z 1 ( )t = ⎜

⎜⎜ζn ( )1 ( )t

Полагаем

ζ1( )n ( )t ⎞ ⎟

⎟.

ζn ( )n ( )t ⎟⎟⎠

X [t ,τ ]= Z t Z ( ) ( )τ =

−1 ⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝xx 1n ( )( )11"[[tt ,,ττ ]]

" x 1n ( )( )nn [[tt ,,ττ ]]⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟, t ,τ R 1 .

" "

" x

Определение 3 . Матрица X [t ,τ ] , t ,τ R 1 называется фундаментальной матрицей Коши для однородного дифференциального уравнения (2.1).

Установим ряд свойств фундаментальной матрицы Коши.

Теорема 3. Для всех t , ,τ sR 1 имеют место равенства

⎜⎜" " "1 " 0 ⎞⎟

X s s [ , ]= =E ⎜⎝⎜⎜0 " 1 ⎠⎟⎟⎟⎟⎟⎟⎟ , . (1)

(X [t ,τ ])−1 = X [τ , ,t ] (2)

d

X [t , τ ]= A t X t ( ) [ , τ ], (3)

dt

d

dτ X t [ ,τ ]=−X t [ ,τ ] ( )A τ . ( 4)

Доказательство. Равенство (1) является простым следствием определения 3 . Докажем равенство (2). Имеем

(X [t ,τ ])−1 =(Z t ( ) Z −1 ( )τ )−1 =(Z −1 ( )τ )−1 Z −1 ( )τ = Z ( )τ Z −1 ( )t = X [τ ,t ] .

Для вывода равенства (3) замечаем, что

n x i ( ) j [t ,τ ]= x i ( ) s ( )t ζ s ( ) j ( )τ , ,i j =1,",n .

s =1

Тогда

⎜⎜⎛x ( )[t ,τ ]⎞

x ( )j [t ,τ ]=⎜⎜⎜⎜ 1n ( )jj "[t ,τ ]⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟= s =n 1 ζ j τ ⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜xx i ( )"ss ( )tt ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟.

⎜⎜⎜x

Таким образом, столбцы матрицы X [t ,τ], t ,τ∈[t 0 ,T ] являются линейными комбинациями столбцов матрицы Z (t ) и поэтому представляют собой решения уравнения (2.1). Последнее означает, что

d x ( ) i [t ,τ ]= A t x ( ) ( ) i [t ,τ ] , i =1,",n d X t [ ,τ ]= A t X t ( ) [ ,τ ]. (5) dt dt

Для вывода равенства (4) продифференцируем по переменной τ очевидное тождество X [t ,τ] [X τ,t ]= E . Имеем

d X [t ,τ] X [τ,t ]+ X [t ,τ] d X [τ,t ]= 0 .

d τ ⎠ d τ

Перепишем последнее равенство с учетом (5):

d X [t] X [τ,t ]= −X [t ,τ]A ( )τ X [τ,t ]. (6)

d τ ⎠

Умножим равенство (6) на матрицу X 1 [τ,t ] справа. В результате получим искомое равенство (4) Теорема доказана.

Равенству (4) в доказанной теореме можно дать следующую трактовку: d X t [ ,τ ]=−X t [ ,τ ] ( ) d −1[τ ,t ]=−X −1[τ ,t A ] ( )τ

A τ X dτ dτ

d { −1[τ ,t ]} =−A ( )τ {X −1[τ ,t ]} .

X

Таким образом, матрица {X −1 [t ,τ ]}T является фундаментальной матрицей Коши для линейной однородной системы дифференциальных уравнений

d ψ

= −A ( )t ψ. (7)

dt

В дальнейшем систему (7) будем называть сопряженной системой дифференциальных уравнений по отношению к системе (2.1).

Укажем один способ построения фундаментальной матрицы Коши для случая, когда известна фундаментальная система решений x ( 1 ) ( )⋅ , ,x ( n ) (⋅) дифференциального уравнения (2.1), не связанный с вычислением обратной матрицы для матрицы

Z ( )⋅ = (x ( ) 1 ( )⋅ , ,x ( ) n ( )⋅ ).

Для каждого номера i ∈{1, ,n } составим систему линейных алгебраических уравнений

c x 1 1(1) (τ)+ +c x n 1(n ) (τ) = 0,

…………………………..

c x 1 i (1) (τ)+ +c x n i (n ) (τ) =1,

………………………….

c x 1 n (1) (τ)+ +c x n n (n ) (τ) = 0,

τ∈[t 0 ,T ] (8)

относительно переменных c 1 , ,c n . Эта система имеет решение при всех τ∈[t 0 ,T ], т. к. ее определитель отличен от нуля при всех τ∈[t 0 ,T ]. Пусть c k ( i ) ( )τ , k i , =1, , ,n τ∈[t 0 ,T ] – решение системы (8). Положим

c 1( )i ( )τ x 1( )1 ( )t + +c n ( )i ( )τ x 1( )n ( )t

( )i ⎜ ⎟ x [t ,τ] = ⎜ ................................ ⎟ , t ,τ∈[t T 0 , ] , i =1, ,n .

⎜⎜⎝c x t c x t ⎟⎟⎠

Вектор x ( ) i [t ,τ] представляет собой i -й, i =1, ,n , столбец фундаментальной матрицы Коши.

В случае, когда матрица A постоянна в алгоритме построения фундаментальной матрицы Коши система алгебраических уравнений (8) заменяется на следующую систему:

c x 1 1(1) (0)+ +c x n 1(n ) (0) = 0,

…………………………..

c x 1 i (1) (0)+ +c x n i (n ) (0) =1,

………………………….

c x 1 n (1) (0)+ +c x n n (n ) (0) = 0.

Пусть c k ( i ) , ,i k =1, ,n – ее решение. Столбцы фундаментальной матрицы Коши строятся по формуле

c x 1( )i 1 ( ) t c x i 1n t

⎜⎟

( )i

x [t ,τ] = ⎜ ................................ ⎟ , t ,τ∈[t T 0 , ] , i =1, ,n . (9) ⎜⎜⎝c x 1( )i 1 ( ) t c x i 1n t ⎟⎟⎠

Пример 5*. Требуется построить фундаментальную матрицу Коши для однородного дифференциального уравнения из примера 4 и проверить для нее выполнение равенств (1)-(4).

Выше было показано, что система решений

⎜⎛2e

x ( )1 ( )t =⎜⎜⎜⎜ e 33tt ⎟⎟⎟⎟⎟⎟⎟⎟, x ( )2 ( )t =⎜⎜⎜⎛⎜⎜⎜⎜⎜⎝7coscos−10tt +cos2sinsint tt ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟, x ( )3 ( )t =⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜−43coscos−t sint −+sint 2sint t ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟, t R 1

⎜⎜⎜⎝ 0 ⎠⎟⎟

этого уравнения является фундаментальной. Построим фундаментальную матрицу Коши непосредственно следуя ее определению. Имеем

X t [ ,τ ]=⎛⎜⎜2e 33tt 7cost +sint 3cost −sint ⎞ ⎛⎟⎟⎟⎟⎟⎟⋅⎜⎜⎜⎜⎜⎜⎜⎜⎜2ee 033ττ 7coscos−τ 10τ −cos+2sinsinτ ττ −34coscos−ττ sin−+τ sin2sinττ ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟−1 = ⎜⎜⎜⎜⎜⎝⎜⎜ e 0 cos−10t −cos2sint t −4cos−sint +t 2sint ⎠ ⎝⎟⎟⎟⎟

⎛⎜⎜⎜ 54 e 3(tτ ) + 1 5 cos(tτ )− 52 e 3(tτ ) − 52 cos(tτ )+ 53 e 3(tτ ) − 53 cos(tτ )− ⎟⎟⎟⎟⎞⎟

⎜⎜⎜

⎜⎜⎜⎜⎟⎟⎟⎟

⎜⎜⎜ ⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝⎜⎜ 2sin (t τ )

−4sin(tτ )

⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠⎟⎟⎟ cos(tτ )+sin(tτ )

⎜⎜⎜⎜⎜⎜⎜⎜−52 e 1 53(sintτ )(−t −52 τ cos) (tτ )− +1 5 e 52 3 sintτ (+t −54 cosτ ) (tτ )+ 103 e 10 1 3sin tτ (−t 103 τ cos) (tτ )+⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟ ⎟. (10)

=

Осуществим построение фундаментальной матрицы Коши, не прибегая к обращению матрицы Z ( )⋅ . Для этого последовательно решаем три системы линейных алгебраических уравнений

2c 11−+ + =+107c c 222 −34c c 33==10., ⎜⎝⎜⎛⎜⎜⎜cc 132( )(111)⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟=⎜⎜⎛⎜⎝⎜⎜⎜⎜−152 52 ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟, 2cc 11−+ + =+107ccc 222 −34cc 33 ==010,, ⇒ ⎜⎜⎛⎜⎜⎜⎝⎜⎜⎜⎜ccc 132( )(( )222)⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟=⎜⎛⎜⎝⎜⎜⎜⎜⎜−1 554 2⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟. c c 0, ⇒ ⎜⎜

⎜⎜c ( )⎠⎟⎟

2c 11−+ + =107cc 222 34cc 33 01, ⎜⎛⎜⎜c 132( )(333)⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟=⎛⎜⎜⎜⎜⎜⎜⎝⎜−101 23 103 ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟. c + c = 0, ⇒ ⎜⎜⎜⎜c

− = ⎜⎝⎜c ( )⎠

По формуле (9) определяем столбцы фундаментальной матрицы Коши

( )1 ⎜2e 33 t (t τ τ) ⎟ 2 ⎛⎜7cos(t −τ)+sin(t −τ)⎞⎟ ⎜⎛ 3cos(t −τ)−sin(t −τ) ⎟⎞

2 ( )

x [t ,τ] = ⋅⎜ e ⎟− (t −τ)⋅⎜cos(t −τ)− 2sin(t −τ)⎟+⎜ −sin(t −τ) ⎟ =

5 ⎜⎜ 0 ⎟ 5 ⎜⎝ −10cos ⎟⎠ ⎜⎝−4cos(t −τ)+ 2sin(t −τ)⎟⎠

⎝ ⎠

⎛ 54 e 3(t −τ) + 1 5 cos(t −τ)− 7 5 sin(t −τ)⎞

⎜ ⎟

= ⎜ 5 2 e 3 ( t τ) 5 2 cos(t −τ)− 1 5 sin(t −τ)⎟,

⎜ ⎟ ⎜ 2sin(t −τ) ⎟

⎝ ⎠

( )2 ⎜ 2e 33 t (t τ τ) 4 ⎜⎛7cos(t −τ)+sin(t −τ)⎟⎞ ⎛⎜ 3cos(t −τ)−sin(t −τ) ⎟⎞

1 ( )

x [t ,τ] = ⋅⎜ e ⎟+ ⋅⎜cos(t −τ)−2sin(t −τ)⎟− 2⋅⎜ −sin(t −τ) ⎟ =

5 ⎜⎜ 0 ⎟ 5 ⎜⎝ −10cos(t −τ) ⎠⎟ ⎜⎝−4cos(t −τ)+ 2sin(t −τ)⎟⎠

⎝ ⎠

⎛ 52 e 3(t −τ) − 52 cos(t −τ)+ 14 5 sin(t −τ)⎞

⎜ ⎟

= ⎜ 1 5 e 3 ( t τ) + 5 4 cos(t −τ)+ 5 2 sin(t −τ) ⎟,

⎜ ⎟ ⎜ −4sin(t −τ) ⎟

⎝ ⎠

( )3 ⎜2e 33 t (t τ τ) ⎟ 3 ⎛⎜7cos(t −τ)+sin(t −τ)⎟⎞ 1 ⎛⎜ 3cos(t −τ)−sin(t −τ) ⎞⎟

3 ( )

x [t ,τ] = ⋅⎜ e ⎟−⎟ ⋅⎜⎝cos(t −τ)−2sin(t −τ)⎟+ 2 ⋅⎜⎜−4cos(−t −sinτ)(+t −2τsin) (t −τ)⎟⎠⎟ =

10 ⎜ ⎟ 10 ⎜ −10cos(t −τ) ⎠⎟ ⎝

⎜ 0

⎝ ⎠

⎛ 53 e 3(t −τ) − 53 cos(t −τ)− 54 sin(t −τ) ⎞

⎜ ⎟

= ⎜ 103 e 3(t −τ) − 103 cos(t −τ)+ 101 sin(t −τ)⎟ . ⎜ ⎟ ⎜ cos(t −τ)+sin(t −τ) ⎟

⎝ ⎠

Получили совпадение с формулой (10). Непосредственно убеждаемся, что равенства (1)-(4) выполняются (см. приложение).

В случае A = const дадим другую интерпретацию для фундаментальной матрицы Коши.

Определение 4. Квадратная матрица e tA , определенная степенным рядом

e tA = + + + + + +E 1!A t A 2!2 t 2 A 3!3 t 3 " A k k ! t k " , (11)

где E - единичная матрица размера n ×n , называется экспоненциалом матрицы A .

Покажем, что ряд (11) сходится абсолютно для любого фиксированного t R 1 . Действительно, с одной стороны,

A k k ! t k Ak !k t k , k = 0,1,2,",

а с другой стороны, степенной ряд

1+ + + + + +1!A t A 2!2 t 2 A 3!3 t 3 " Ak !k t k "

сходится абсолютно при всех t R 1 .

Из абсолютной сходимости ряда (11) следует, что его можно почленно дифференцировать. Вычисляем

d tA d A A 2 2 A 3 3 A k k A 2 A 3 2 A k k

e = (E + + + + + + = + + + + + =1! t 2! t 3! t " k ! t ") A 1! t 2! t " k ! t "

dt dt

= + + + + +A (E 1!A t A 2!2 t 2 A 3!3 t 3 " (kAk −1 !1) t k −1 + =") Ae At . (12)

Из (12) вытекает справедливость матричного равенства

d tA At

e = Ae , dt

которое означает, что столбцы экспоненциала матрицы A являются решениями однородного дифференциального уравнения

x = Ax . (13)

В силу очевидного равенства e At t 0 = E эти столбцы образуют фундаменталь-

=

ную систему решений дифференциального уравнения (13). Таким образом,

X [t ,τ ]= e (tτ )A , t ,τ R 1 .

1.4. Допустимые реализации вектора управляющих параметров.

Пусть управление динамическим объектом осуществляется на промежутке времени [t T 0 , ]. Начальную точку траектории x 0 называют левым концом траектории, а конечную x T – правым концом траектории. Начальный t 0 и конечный

T моменты времени в общем случае не являются фиксированными. Предполагается, что t 0 θ 0 ⊂ R 1 , T R t t . На левый и правый концы траектории обычно накладываются ограничение в форме включений

x 0 S 0 ( )t 0 R n , t 0 ∈θ0 , x T S T 1 ( ) ⊂ R n , T ∈θ1 .

В задачах теории оптимального управления принята следующая терминология: если множество S 0 (множество S 1 ) состоит из одной точки и не зависит от t 0 ∈θ0 (T ∈θ1 ), то говорят, что левый (правый) конец траектории закреплен; если S 0 (t 0 ) = R n , t 0 ∈θ0 , (S 1 (T ) = R n ,T ∈θ1 ), то левый (правый) конец траектории называют свободным.

Реализация вектора управляющих параметров не является произвольной функцией времени. Эта функция должна быть достаточно «гладкой» и в любой момент времени удовлетворять геометрическим ограничениям

u t ( )∈ PR r , t ∈[t T 0 , ].

Оба приведенных требования обусловливаются техническими возможностями механизмов, осуществляющих управляющие воздействия на объект.

С другой стороны, слишком «бедное» множество возможных реализаций вектора управляющих воздействий может не обеспечить достижение поставленной цели управления. В частности, таковым является класс непрерывных на отрезке времени [t T 0 , ] функций. Покажем это на примере.

Пример 6. Рассмотрим поезд, движущийся от станции A к станции B в соответствии с уравнениями

x 1 = x 2 , x 2 =u ,

где x 1 - расстояние от станции A до поезда; u - тяга поезда, которой можно управлять. На величину тяги наложено ограничение u ≤1. Требуется так выбрать управление, чтобы поезд преодолел путь между станциями за наименьшее время. При этом скорость в начальный и конечный моменты времени должна быть нулевой.

x 1

Рис. 4

Нетрудно сообразить, что время перехода будет минимальным, когда поезд до половины пути разгоняется с максимальным ускорением u t ( )=+1, а вторую половину максимально затормаживается, т.е. u t ( )=−1. Таким образом, реализация оптимального управления в данном случае имеет вид

0 1, , , u t

1, , ,

Функция u 0 (t ), t ∈[t T 0 , ] терпит разрыв в точке T .

Из опыта решения прикладных задач следует, что реализации вектора управляющих воздействий принадлежат классу C 0 [t T 0 , ] – кусочно-непрерывных функций, то есть таких функций u :[t 0 ,T ]→ R r , которые непрерывны в каждой точке t ∈[t 0 ,T ], за исключением, быть может, конечного числа точек τ1 , ,τm ∈[t 0 ,T ], в которых функция u ()⋅ терпит разрывы первого рода. В этих точках существуют конечные пределы

t →limτi −0 u (t ) = ui − 0), t →limτi +0 u (t ) = ui + 0),

но ui − 0)≠ ui + 0),i =1, ,m . В теории оптимального управления принимается, что в точках разрыва реализации вектора управляющих воздействий непрерывны справа. Таким образом,

t →limτi +0 u (t ) = ui ),i =1, ,m .

Определение 5. Реализация u ()⋅ вектора управляющих воздействий называется допустимой, если u ()⋅ ∈C t T 0