Главная  Нелинейные системы управления 

[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [ 128 ] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

где 422 - фундаментальная матрица первого уравнения системы (10.255). Следовательно, фундаментальную матрицу системы (10.253) можно записать в виде

Z (/. /о) =

Е >5.г(т, дйт

(10.256)

Представим корреляционную матрицу R, (,, g в виде

p/RnR.2\ (10 257)

VRgi R22/

где - корреляционная матрица для г\ (t).

Используя (10.251)-(10.253) и (10.256), из (10.253) получаем

Rn (. Q = j" Ro (т) dx, t =min (/„ /.,),

откуда следует, что процесс ц (/) являегся процессом с независимым приращением [161.

§ 10.8. Оптимальные дискретные системы

В этом параграфе рассматриваются дискретные системы, т. е. системы, которые описываются разностными уравнениями. Большинство понятий, введенны.х при рассмотрении непрерывных систем, без изменений переносятся на дискретные системы. Б частности, как в случае непрерывных систем, определяются такие понятия, как управляемость, стабилизируемость, наблюдаемость, восстанавливаемость, обнаруживаемость.

Если дискретная система линейна и стационарна, т. е. описывается уравнениями

X (t -f 1) = Ах (О -f Вы (0; у (О =Сх (О + Du (i),

то критерии управляемости, стабилизируемости, наблюдаемости (восстанавливаемости) и обнаруживаемости формулируются так же, как и для непрерывной системы, описываемой уравнениями

к (О = Ах (О + Ви (0; у (t) - Сх (О + Du (/).



в силу специфических свойств дискретных систем отдельные определения требуют уточнения. В случае непрерывного линейного объекта в определении полной управляемости одну из точек (начальную или конечную) можно зафиксировать и сформулировать его следующим образом: объект вполне управляем, если, какова бы ни была начальная точка х (tg) = х°, существует допустимое (т. е. кусочно-непрерывное) управление, переводящее объект из точки х° в начало координат X (tf) = О за конечное время. Полную управляемость дискретного линейного объекта так определять нельзя. Если принять такое определение, то вполне управляемым был бы объект, который описывается уравнением

х(И-1)-0. х(д=х«,

хотя ясно, что он в действительности не является управляемым.

Синтез оптимальной линейной системы при квадратном критерии

Пусть объект описывается линейным уравнением

X (i -i- 1) = А (О X (О + В (О U (I) + h (О (10.258) и задан квадратичный критерий оптимальности

y=x4(/)Fx(tV)+ 2 (x4/)Q(/)x(/)u4/)R(/)u(/)], (10.259)

где h (О - известная векторная функция; F, Q (i) - симметричные неотрицательно-определенные матрицы (F > О, Q (О > О, io < i < if - 1); R (О - симметричная, положительно-определенная матрица (R (t) > О, г„ < i < - 1).

Требуется найти оптимальное управление с обратной связью, т. е. управление, при котором критерий (10.259) принимает минимальное значение при произвольном начальном условии X (io) = х°. Критерий (10.259) имеет такой же физический смысл, что и критерий (10.121) в непрерывном случае.

Оптимальное управление с обратной связью имеет следующий вид:

и*(0- -L-(0 ВО

+ K(i+l)h(i)-\-jP(i+\)

K(i + l)A(Ox(i) +

(10.260)



К(1-Ы)Н (0+ YPii + \]

(10.264) (10.265)

5[х(1 + 1), ,-411-

4(1+ 1).....uUf-I) [

х-((,) Fx(tV)-f

+ 2 [x4/)Q(/Jx(/)-f u(7)R(y)u(/)l

(10.267)

L (О = В (i) К (i + 1) В (О + R (О, (10.261)

где К (О - симметричная неотрицательно-определенная матрица, определяемая из уравнения

K(0 = Q(0 + A40[K(t+1)-

(I -1- 1) В (О (О ВЧО К (( + 1)1 А (О (10.262)

при граничном условии

K(i/) = F; (10.263)

р (t) - вектор-столбец размера л, определяемый из уравнения

р (О 2А(О К (i -f 1) h (О + 4- Р + -

»K(i+l)B(0 L-(0 В(0

при граничном условии

Р (/)= О Когда объект задается уравнением

x(i-f l) = A(0x(0 + B(0u(0.

т. е. h (t) = О, то оптимальное управление с обратной связью принимает вид

U* (0= -(О В (О К (I + 1) А (О X (t), (10.266)

где L (() определяется из (10.261), а неотрицательно-определенная матрица К (О - из (10.262), (10.263). Действительно, при h (О = О уравнение (10.264) становится однородным и в силу граничного условия (10.265) его решением является р (t) = 0.

Для доказательства полученного решения (10.260)-(10.265) воспользуемся методом динамического программирования. Введем функцию Беллмана:



[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [ 128 ] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

0.0016