Теории управления
Управление - относится к математической теории управления движением
технической системы.
Необходимо написать алгоритм, по которому некоторая система управляется с
помощью энергетического воздействия, например : летательный аппарат
управляется с помощью рулевой машины. Оказывается создать управление это не
очень сложно и это можно сделать интуитивно. Однако создать оптимальное
управление чрезвычайно сложно.
Теория оптимизации - это наука о наилучших алгоритмах (управления)
созданных по некоторому критерию качества
Критерий качества - создание (абстрактное) некоторой функции риска,
которая должна быть в процессе оптимизации минимизированна (экстремальная
задача).
Управление бывает оптимальным и квазиоптимальным.
Оптимальное - на бумаге,
Квазиоптимальное - реальное, стремится к идеальному.
Управление бывает :
1) Программное
2) С помощью отрицательной обратной связи
Программное управление –
требуется создать программу, которая дает оптимальную траекторию (заложена
в ЭВМ) движения некоторой системы.
Пример 1 : Перевод летательного аппарата из точки А в
точку В.
Критерий - минимизировать расход горючего.
Для реализации такой задачи создано две системы - Novstar
(США) и Глонасс (Россия), стоимость их очень высока.
Пример 2 : Надо создать такую траекторию, чтобы шарик скатился из точки ‘А’
в точку ‘В’ за минимальное время.
А
А - Оптимальная
В
В траектория
Управление с помощью отрицательной обратной связи
Отрицательной обратной связью - называется передача энергии с выхода на
вход некоторой управляемой системой
вх + Система вых
обратная связь
Бывает два вида обратной связи : Положительная ОС и отрицательная ОС.
Отрицательная ОС уменьшает входное воздействие на систему пропорционально
выходному отклику (демпфирует систему в целом).
Автоматика - наука изучающая теорию анализа и синтеза
систем управления (корректировка движения, оптимизация
переходных процессов) и создание оптимального управления.
Радиоавтоматика - наука, изучающая вопросы управления
движением радиотехнических систем.
Структурная схема системы радиоуправления :
Радио- ((( Устройство (-(( Объект (( Датчик
приемник Управления Управления
ООС
Радиоприемное устройство - устройство выделения сигнала
по некоторому радиоканалу.
Особенность выделения сигнала состоит в том, что сигнал выделяется на
фоне внутренних шумов и помех.
Внутренние шумы - тепловые шумы, которые всегда имеют
место в радиоприемном устройстве.
Таким образом в радиоавтоматике случайные процессы изучаются особо (шум,
помеха, сама траектория движения)
Устройство управления - как правило - вычислительная сис-
тема с приводом и энергетической
установкой.
Привод - преобразователь механических колебаний в элек-
трические.
Объект управления - некоторая динамическая система.
Динамическая система - система, которая описывается ли-
нейными и нелинейными дифферен-
циальными уравнениями высокого
порядка.
Датчик - устройство, которое измеряет положение летатель-
ного аппарата в пространстве.
Глава 1 Стохастическое управление
В случае стохастического управления, управляемые процессы являются
случайными (стохастическими). Начальная точка управления А и конечная В не
известны. В этом случае сам
управляемый процесс описывается стохастическими уравнени-
ями, которые, как правило, апроксимируются марковскими процессами.
Примеры систем автоматического управления
Системы автоматического управления можно описать прибли-
женно используя линейные или нелинейные дифференциальные
уравнения (детерминированный подход без учета шумов).Это
было до 60х годов: все подходы были стохастические линейные и нелинейные
дифференциальные уравнения.
Пример 1 (детерминированный)
Управление движением космического аппарата в грави-
тационном поле земли (задача двух тел).
В геоцентрической системе координат
Z r - расстояние от центра земли
З - центр земли (вся ее масса)
К.А.
r К.А. - космический аппарат
X На космический аппарат действует
З притяжение :
Y F2 [pic] ; [pic]
К.А. F2 - управляющая сила
F3 - сопротивление среды
[pic] ; [pic]
Третий закон Ньютона :
F3 F1 [pic]
Если это уравнение спроектировать на оси ко-
ординат, то получим следующие три уравнения :
(1) [pic]
(1)- система линейных дифференциальных уравнений 2-го по-
рядка, которая описывает движение космического аппа-
рата.
Силы U1,U2,U3 - силы управления.
{x(t),y(t),z(t)}[pic] r(t) - траектория
Оказывается, что в зависимости от начальных условий и па-
раметров K1,K2,K3 траектория r(t) может быть круговая,
эллипсоидная, параболическая.
Пример 2 : Нелинейная система. Описывается нелинейным дифференциальным
уравнением.
Генератор колебаний :
Можно показать, что процесс
x(t) описывается дифферен-
x(t) циальным уравнением 2-го
M порядка с нелинейным
членом [pic].
R
C L L [pic]
C Если емкость варьировать,
то [pic] может стать ну-
лем и тогда мы получим си-
нусоидальное колебание:
x(t)=a sin((t+()
(автоколебания)
Если [pic]- положительно, то амплитуда колебаний увели-
чивается с течением времени.
Если [pic]- отрицательно - амплитуда колебаний уменьша-
ется с течением времени до нуля.
Глава 2
Математическое описание систем (детерминированная терия) (идеальный случай)
Линейные системы, которые описываются дифференциальными
уравнениями называются динамическими системами.
Если система описывается алгебраическими уравнениями -
- это описание состояния равновесия (статические системы)
По определению [pic]
[pic] (1)
(1)- линейное дифференциальное уравнение n-го порядка.
Правая часть - это дифференциальное уравнение воз-
действия. Если Ly=0 (2) ,то Ly=Px.
(2)- однородное дифференциальное уравнение - описывает
линейные динамические системы без воздействия на
них. Например колебательный контур.
Правая часть уравнения (1) описывает воздействие на ли-
нейную систему или называется управлением.
Ly=x - управление.
Если есть часть Px - то это сложное управление, учитыва-
ющее скорость, ускорение.
Передаточная функция линейной системы
От дифференциального уравнения (1) можно перейти к линей-
ной системе, т.е. к некоторому четырехполюснику.
Вх W(p) Вых
Этот четырехполюсник можно создать на элементной базе или
смоделировать на ЭВМ.
От дифференциального уравнения (1) к W(p) можно перейти
двумя путями - используя символический метод и 2-е прео-
бразование Лапласа.
[pic] Сивмолический метод Хиви Сайда.
Применив символический метод к (1) получим :
[pic]
[pic] (3)
Формула (3) представляет собой отношение двух полиномов -
описание передаточной функции.
Использование преобразования Лапласа
[pic] - преобразование Лапласа, p=j(
Если мы применим преобразование Лапласа к левой части (1)
и учитывая, что [pic], получим :
[pic] (4)
X(p) Y(p)
W(p)
Если правая часть передаточной функции простейшая -
[pic], то воздействие обычное. Передаточ-
ная функция будет иметь вид :
(5) [pic] , где знамена-
тель дроби есть характеристическое уравне-
ние.
Пример : Дифференциальное уравнение 2-го порядка описы-
вается передаточной функцией :
[pic] (6)
Для нахождения решения дифференциального уравнения снача-
ла необходимо решить следующее уравнение :
[pic]
Известно, что дифференциальное уравнение 2-го порядка
имеет решение в виде комплексной экспоненты или действий
над ней. (Это зависит от корней характеристического урав-
нения). Если корни комплексные, тогда решение будет :
(7) [pic](t+[pic](t)
Если корни (( ( j( решение будет [pic] (7)(
(7) и (7)’ - решение в виде нарастающей или затухающей синусоиды, либо
обычной синусоиды, если (=0.
Устойчивость линейных систем
Линейная система полностью описывается передаточной функ-
цией, которая представляет собой :
[pic] в комплескной плоскости
p=(+j( . Эти полиномы получены из дифференциальных урав-
нений путем преобразования Лапласа.
Ставится проблема: как исследовать систему с помощью W(p)
Оказывается, что это проще сделать чем исследовать диффе-
ренциальные уравнения. Исследование по W(p) производится с помощью анализа
полюсов и нулей.
Полюсом называется то значение корня уравнения в знаменателе, при котором
Q(p)=0.
Количество корней определяется степенью полинома. Если
корни комплексно-сопряженные, то в точке, где Q([pic])=0,
W(p)=( - полюс.
Нулями W(p) называются точки на комплексной плоскости,
где полином P(p)=0.
Количество нулей определяется порядком поли-
нома.
j(
( > 0 полюсы
сопряж. пара ( [pic] [pic]
( > 0
[pic]
[pic] - полюсы (корни характеристического урав-
нения). Если корни комплексные, то они сопряженные.
Выводы :
1. Если корни характеристического уравнения Q(p)
находятся в левой полуплоскости , то система ус-
тойчива. [pic]((t(() - решение для комплексных
корней.
2. Если ( >0 , то решение будет [pic]((t(().
Система неустойчива.
Расположение нулей определяет корректирующие свойства системы, т.е.
оказывают воздействие на переходной процесс
Если нули в левой полуплоскости, то такая система называется минимально
фазовой.
Если нули в правой полуплоскости - нелинейно фазовая
система.
Если полюсы на мнимой оси, т.е. (=0, то система нахо-
дится в колебательном режиме (Система без потерь).
Передаточная функция линейной системы на мнимой оси
В этом случае после преобразований получим:
W(j()=A(()+jB(() -
Передаточная функция есть комплексное число.
Замечание: Не путать с корнями на мнимой оси.
Оказывается очень удобно исследовать W(j()на мнимой оси не с помощью нулей
и полюсов, а с использованием комплек-
сной передаточной функции.
Комплексная функция :
АЧХ - четная функция: [pic]
ФЧХ - нечетная функция: [pic]
АЧХ
ФЧХ
АЧХ показывает селективность системы по
амплитудному спектру.
ФЧХ показывает - какой сдвиг фаз получает на
выходе фильтра каждая гармоника.
Замечание: Известно, что спектр сигнала (по
Фурье) удобно представлять в ком-
плексной виде, т.е. у спектра есть АЧХ (рас-
пределение гармоник по амплитуде от частоты), и ФЧХ (рас-
пределение фаз).
Выводы: Комплексное представление спектра или передаточ-
ной функции W(p) очень удобно радиотехнике. Это
позволяет компактно записать АЧХ и ФЧХ.
Передаточная функция систем радиоавтоматики
1)
вх [pic] [pic] (( [pic] вых
Передаточная функция последовательно соединенных звень-
ев : [pic]
2)
[pic] Передаточная функция парал-
лельно соединенных звеньев:
[pic]
вх вых
[pic]
: :
: :
: :
[pic]
3) y(t) Передаточная функция системы
x(t) ((((( [pic] (((( с обратной связью:
[pic]
[pic]
Типовые звенья радиоавтоматики
1) Инерционное звено
Передаточная функция :
C
вх R вых [pic] ; [pic]
W(() АЧХ
K
[pic]
( (()= - arctgT( ФЧХ
0
(
-45(
-90(
2) Интегрирующее звено
Передаточная функция :
W(() АЧХ W(p)=[pic]
[pic] ; ФЧХ : [pic]
0 (
3) Дифференцирующее звено
C
R
R L
W(() АЧХ Передаточная функция :
W(p)=Kp
АЧХ: W(()=K(
ФЧХ: ((()=[pic]
0 (
4) Форсирующее звено
W(() АЧХ
Передаточная функция:
[pic] [pic][pic]
K АЧХ : [pic]
( ФЧХ : [pic]
0
( (()
[pic]
[pic]
0 (
5) Запаздывающее звено
АЧХ: [pic]=1 Передаточная функция :
ФЧХ: ((()=(t [pic]
((() ФЧХ
АЧХ
1
Запаздывающее звено называется линией задержки, где
t=T - время запаздывания ЛЗ. ((()=(T; [pic]
5) Колебательное звено
Передаточная функция:
[pic]
АЧХ [pic] - параметр затухания
[pic]<1 - устойчивая система
[pic]>1 - самовозбуждающаяся
система
ФЧХ
6) Неминимально фазовое звено
Передаточная функция:
АЧХ при a=b : [pic]
[pic]; W(()=1
ФЧХ при а=b : [pic] АЧХ
ФЧХ
Цифровые системы автоматического управления
Задан процесс: Будем рассматривать про-
y(t) цесс y(t) в дискретные мо-
менты времени.
Такой процесс называется с
дискретным временем.
[pic]
Значения этого процесса в
дискретные моменты :
[pic]
[pic]
[pic] - значения
Существуют два типа процесса с дискретным временем :
1)Процесс с дискретным временем и непрерывным множеством
состояний. Это означает, что функция [pic] является непре-
рывной ( если это случайный процесс, то [pic] непрерывна в
среднем квадратическом).
ПЗС
y(t) Преобразователь [pic] [pic]-
непрерывные функции
ПЗС - прибор с зарядовой связью
[pic] - интервал дискретизации во времени (квантование по
времени)
Для таких процессов составляются разностные уравнения :
[pic] - 1-е приращение, конечная разность
[pic] - 2-я разность
2) Процесс с дискретным временем и дискретным множеством
состояний.
y(t) АЦП [pic]
Процесс 2 отличается от процесса 1 тем, что [pic] записы-
вается в цифровом виде - дискретная функция, вся база
исследований другая. Квантование идет и во времени и
по уровню.
Очень часто делается бинарное квантование 0;1. В этом
случае аппаратура сильно упрощается.
Замечание :
1) В первом случае (ПЗС) если y(t)([pic], то выход-
ной процесс [pic] , т.е. такой же, но дискрет-
ный.
2) [pic] - биномиальное распределение.
Оказывается, если число уровней квантования ( 8,то
их можно отождествить с непрерывными системами.
Представление дифференциальных уравнений, описывающих
системы автоматического управления конечных разностей
(1) [pic]
[pic] - первая разность, аналог пер-
вой производной
n - непрерывное время, непрерывное множество состо-
яний.
[pic] - аналог 2й
производной
.......................................
[pic] - аналог К-той производной
Если это подставить в непрерывное дифференциальное урав-
нение то получим следующее :
(2) [pic]
Если подставить в (2) разности, то получим :
(3) [pic] -
- разностное уравнение с дискрентным временем.
Z -преобразования
Аналогичны преобразованию Лапласа. Это очень удобный аппарат для
исследования систем с дискретным временем в
частотной области. Для этого вместо экспоненты (для упро-
щения) вводится [pic]- это есть Z-преобразование. Для
того, чтобы ввести Z-преобразование используется сле-
дующий прием связи непрерывного процесса X(t)и дискретно-
го [pic] (1)
X(1),X(2) - выборка с дискрет-
ным временем
([pic]
[pic]
Рассмотрим преобразование Лапласа :
[pic] (2)
Формально введем новую переменную :
[pic] (3)
Используя (2) и (3) получим
[pic] (4)
(4) - называется Z-преобразования, показывает как перейти
от функции с дискретным временем (X(n)) к спектру
на Z-плоскости.(Оно проще преобразования Лапласа,
но имеет те же свойства и для разных дискретных
функций имеются специальные таблицы.
Устойчивость систем с дискретным временем
Системы с непрерывным временем характеризуются передаточ-
ной функцией (отношения 2х полиномов), тоже самое в Z-пре
образовании, только переменная не p = ( ( j(, a [pic],
либо [pic] (на линейной оси)
P-плоскость Z-
плоскость
(Система
устойчива)
[pic] - окружность, следовательно левая комплексная полу-
плоскость легче преобразуется во внутренность круга
Если полюсы передаточной функции находятся во внутреннос-
ти круга, то система устойчива, если полюсы находятся на
самом круге, то будет колебательный процесс, если вне
круга - система неустойчивая.
- устойчивая система - колебательная
система
n
- неустойчивая система
n
Глава 3
Нелинейные динамические системы
Нелинейные динамические системы описываются дифференци-
альными уравнениями :
(1) [pic], где [pic] - вектор, [pic], [pic]
Если линейные дифференциальные уравнения имеют решения
(экспоненциальные), то для нелинейных дифференциальных
уравнений нет общих решений (за редким исключением), но
все реальные динамические системы нелинейны, некоторые
из них нельзя линеаризировать, как быть ?
Выход : 1) Там,где возможно, делается линеаризация правой
части уравнения (1).
Линеаризация - замена нелинейной функции на линейную.
(2) f(x,t)=A(t)x + B(t) + S(x,t)
S(x,t) - мало, им можно принебречь.
Если правая часть (1) не зависит от времени, то система
называется автономной [pic]
Линеаризация используется,как правило, для проверки
устойчивости системы. Для исследования свойств нелиней-
ных динамических систем, обычно используются качественные
и численные методы решения нелинейных дифференциальных уравнений. Теория
нелинейных уравнений часто называется
теорией нелинейных колебаний.
Пример : Нелинейной динамической системы уравнений Вандер
Поля.
[pic]
[pic] - нелинейность.
[pic] = const
Дифференциальное уравнение называется нелинейным, если
оно нелинейно относительно разыскиваемой переменной (са-
мой переменной или ее производной) (нелинейность из-за
квадрата)
Требуется найти решение x(t) .
Существуют численные методы решения таких дифференциаль-
ных уравнений ( численные методы рассматриваются на сет-
ке с шагом [pic] ) . Решение получается не непрерывное , а
дискретное.
Численные методы описыва-
t ются в книге: Эльсгольц
‘Теория дифференциальных
уравнений и вариационное
исчисление’.
U
[pic]
Численный метод Эйлера ( численный метод)
[pic] , [pic] ; [pic]
[pic]
[pic] (5)
Численный метод предназначен для решения не-
линейных дифференциальных уравнений.
Берется из апприорных (начальных условий)[pic],
подставляется в правую часть уравнения (5) и
т.д. Это называется реккурентностью.
Качественная теория решения нелинейных диффе-
ренциальных уравнений (в приложении к нелинейным систе-
мам)
В отличие от численного метода (Метод Эйлера), который
дает решение в 1й точке ( не дает траекторию (нужно де-
лать 1000 точек, чтобы получить траекторию)).
Пуан Каре в 19 веке дал качественную теорию решения диф-
ференциальных уравнений, она используется для решения не-
линейных дифференциальных уравнений в виде некоторого фа-
зового портрета (некоторый графический материал, по ко-
торому можно анализировать траекторию движения динамичес-
кой системы, т.е. фактически получить решение (1-го из
решений).
На примере X и Y :
y (1) [pic], где [pic]
f(x,y) - некоторая нели-
( dy нейная функция
[pic] - нелинейная
функция
x
Найти решение означает - найти y=((x) (2),
которая удовлетворяет (1).
Пуан Каре развил метод , как найти (2) прямо на
плоскости.
Метод изоклин
Если f(x,y)=const, то [pic], а [pic], на кривой
f(x,y)=const все производные имеют одно и тоже значение,
такая кривая называется изоклиной. (tg(=const, (=const)
Можно вычислить множество изоклин, это множество дает по-
ле направлений. Касательная к этому полю и есть решение,
т.о. это есть траектория, которую мы разыскиваем.
y Пример1: [pic] ; [pic]
y
- решение диф. - изоклина
уравнения
x
x
Пример 2: [pic], [pic]
Величина радиуса - значение производной, любая окружность - изоклина.
Решение (касательная к полю направления) -
-есть касательная к векторам, расположенная на изоклинах.
( - изоклина
( решение
[pic] - Уравнение Вандер Поля
x(t) - напряжение на контуре автогенератора, фазовая пе-
ременная
[pic] = const - параметр
[pic] - вторая фазовая переменная
Учитывая это имеем :
(1)’ [pic] пусть[pic] = 0
(1)’’ [pic] [pic]
-
изоклина
- фазовый портрет
- Решение дифференциаль-
ного уравнения Вандер
Поля - окружность
(при [pic] = 0)
Если на входы X и Y осцилографа подать две синусоиды, то
получим окружность (фигура Лиссажу), следовательно окруж-
ность дает решения синусоидального колебания.
x Y
t t
Пусть [pic] ( 0 (см. ур-е (1)’) фазовый портрет будет 2х ти-
пов :
Y X(t)
X
t
Выводы :
1) Динамические системы радиоавтоматики описыва-
ются дифференциальными уравнениями 1, 2 и бо-
лее высокого порядка ( например: колебатель-
ная система(солнечная система, автогенератор,
полет космического аппарата в поле притяже-
ния земли) описывается диф. уравнением 2-го
порядка и выше.
2) Линейные динамические системы описываются ли-
нейными диф. уравнениями. Линейная динамичес-
кая система составленная из R,L,C - цепочек и
активных элементов (транзисторов и т.д.).
Любая линейная система путем преобразования
Лапласа может быть представлена в виде пере-
даточной функции.(Диф. уравнение преобразует-
ся по Лапласу). Передаточная функция записы-
вается для удобства в комплексном виде, на
мнимой оси p=j( можно найти АЧХ и ФЧХ линей-
ной системы. Передаточная функция дает инфор-
мацию об устойчивости системы.
3) Нелинейные динамические системы описываются
нелинейными диф. уравнениями, в этих системах
обязательно есть нелинейность вида ([pic]
и др.), общих решений и анализа через переда-
точную функцию как правило не существует, по-
этому есть два метода :
а) численный метод (Эйлера и др.) (восстановле-
ние по точкам)
б) решение диф. уравнений методом фазового порт-
рета (качественная теория). (Это наглядный
путь выяснения поведения нелинейной системы)
Стохастические системы
Стохастика - случайность.
Определение: Динамическая система называется стохастичес-
кой , если она описывается дифференциальным
или разностным уравнением, в правую часть
которого входит случайный процесс.
Такую систему можно представить в виде линейного или не-
линейного четырехполюсника, на вход которого подается шум
Стохастическая
((t) система X(t)
((t)- шум
X(t)- выходной процесс
Составление модели любой динамической системы должно
в реальных условиях(например движение самолета или раке-
ты) составляться с помощью предварительных экспериментов
над движением реальной системы. (Как правило это диффе-
ренциальные или разностные уравнения) и в эти уравнения
вставляется некоторый шум, который является случайным
процессом.
Для дальнейшего составления модели используется иден-
тификация модели на основании эксперимента или экспери-
ментальных данных.
Идентификацией называется оценка коэффициентов разност-
ного уравнения и оценка параметров шума:
дисперсии, мат. ожидания, ковариации и др.
Идентификация служит для того, чтобы реальный процесс и
модель были близки.Получив модель мы имеем возможность,
используя эту модель, получить близкую к реальной карти-
не ситуацию движения системы и создать управление ситуа-
цией по нашей модели.
Вывод: Модель нужна, чтобы на ЭВМ научиться проектировать
управляемые динамические системы для любых такти-
ческих ситуаций, известных из практики.
Правильно созданная модель - это максимум успеха в проек-
тировании эффективной систе-
мы. После создания и отработки модели стохастической ди-
намической системы создается аппаратура по этой модели,
которая проверяется на динамическом стенде.
Динамический стенд - 2й этап моделирования реальной ситу-
ации уже с аппаратурой.
3й этап состоит в проверке аппаратуры на полигоне.( На
борту транспортного или военного средства).
Моделирование случайных процессов с дискретным временем
(1) [pic]- выборка случайного процесса с дискретным
временем.
X(t) Процесс (1) в общем виде очень
трудно анализировать, этот про-
цесс, как правило, получен из
эксперимента. Этот реальный
процесс обычно аппроксимируется
другим процессом, который поз-
[pic] волит нам математически созда-
t вать модели, близкие к реально-
му процессу.
Такое создание моделей называется - аппроксимацией.
Сам аппроксимирующий процесс называется агрегат.
Марковская аппроксимация случайных процессов
Марковским процессом называется такой процесс, у которого
многомерная плотность вероятности
факторизуется в следующем виде : [pic]. Некоторые
значения фазовых переменных в n-мерном пространстве - это
многомерная плотность вероятности
Двумерная плотность Многомерная ФПВ несет всю ин-
вероятности формацию о случчайном процес-
W(x,y) се. Больше информации не су-
ществует.
Однако использовать эту мно-
гомерную ФПВ чрезвычайно сло-
жно на практике, поэтому час-
то прибегают к некоторым ап-
проксимациям процесса :
Y
X
Аппроксимировать - выбрать такие отсчеты
процесса в моменты времени [pic], чтобы все [pic] были
независимы, тогда многомерная ФПВ факторизуется следую-
щим образом: [pic] - факторизация.
Однако при такой факторизации может потеряться информа-
ция о случайном процессе. Есть потеря информации для
произвольных отсчетов (кореллированность процесса).
Существует 2й способ аппроксимации - марковский способ
аппроксимации. Для марковских процессов многомерная ФПВ
факторизуется так :
(2) [pic], где [pic] - ус-
ловная плотность вероятности.
Факторизация (2) позволяет сильно упростить математичес-
кие выкладки в задачах фильтрации и управления.
Определение : Процесс называется марковским, если выпол-
няется условие (2)
Оказывается, существует очень много генераторов марковс-
ких процессов. Мы переходим к их рассмотрению.
Процессы авторегрессии
Процесс авторегрессии - простой генератор марковского
процесса.
1. Односвязная регрессия
(3) [pic]
[pic] - задано. [pic]
[pic] - от генератора белого шума
[pic] - корреляция.
[pic] Если а<1, то [pic](0 имеем
[pic] [pic] устойчивый процесс.
[pic]
[pic]
a<1
Если а>1 - неустой- [pic]
чивый процесс 1 2 3
4 n
[pic](( (P=1)
x(t) (a=0.9
a(1
(a=0.3
[pic]
[pic] [pic] [pic] [pic] [pic]
1 2 3 4 5 n
t
а=1 - модель взрыва. Если [pic] - гауссовский случайный про-
цесс, то легко доказать, что многомерная ФПВ факторизует-
ся.
а - коэффициент регрессии.
Если 0<a<1, то можно доказать, что а - это коэффициент
корреляций между [pic] и [pic].
Если процесс изменяется очень медленно, то он сильно кор-
релирован. Коррелированными процессами очень легко управ-
лять и они очень легко анализируются и прогнозируются.
Генератор марковского процесса, реализующий авторегрессию
1-го порядка
(1) [pic]
[pic] Генератор [pic]
[pic] - марковский случайный процесс [pic]
[pic] - генератор случайных чисел (в ЭВМ)
i = 0,1,2...n
Утверждение (1) : процесс (1) является марковским.
Доказательство: Пусть [pic] заданная величина. Процедура (1) называется
реккурсивной или иттеративной, рекурент-
ной.
(2) [pic]
Пусть [pic]([pic], где 0-среднее, [pic] - дисперсия.
В формуле (2) разность имеет гауссовкий процесс распре-
деления [pic] или :
(3) [pic]
(4) [pic]
(3) получено из (4) и (2) заменив [pic] на [pic]. Поскольку
[pic] - независимые по условию, то имеем :
[pic]
Утверждение доказано. Процесс (1) является марковским.
Структурная схема генератора марковского процесса
[pic] [pic]
реализация рекурсии
[pic]
a (((([pic] рис. 1
T
(((( - линия задержки.
Это структурная схема 4х полюсника, которая реализует
генерацию марковского случайного процесса [pic]. Это генера-
тор с внешним возбуждением, который возбуждается с по-
мощью независимого гауссовского процесса [pic].
Сетка дискретного времени:
((((((((((((( t
T
Утверждение (2)
На выходе 4х полюсника процесс [pic] ,i=1,2...n - коррелиро-
ван, с коэффициентом корреляции ‘a’.
Доказательство: Из (1) имеем [pic] , берем мат-
ожидание, [pic] ,
[pic] , [pic] - коэффициент корреляции.
Утверждение доказано.
Вывод: На вход схемы рис.1 идет некоррелированный слу-
чайный процесс [pic], а следовательно независимый.
(если процесс гауссовский и некоррелированный, то
он независимый, для других процессов это неверно)
В природе наиболее часто встречается гауссовский
случайный процесс. На выходе схемы - зависимый
коррелированный марковский процесс, у которого
плотность факторизуется по условным плотностям.
[pic] - не факторизуется
[pic] - факторизуется
Процесс (1) называется односвязный марковский
процесс.
Замечание: Процесс (1) получен при дискретизации непре-
рывного линейного диф. уравнения 1-го порядка.
[pic] без учета стохастической правой час-
ти [pic]
На сетке дискретного времени имеем :
[pic] ; [pic] - получаем обычную ( не
стохастическую) авторегрессию.
Tc+1=a
Авторегрессия 2-го порядка - двухсвязный процесс
(1) [pic]
Коэффициенты [pic] называются коэффициентами регрес-
сии. Уравнение (1) без стохастической правой части легко
получается из диф. уравнения 2-го порядка. Уравнение (1)
реализует генератор марковского процесса, который называ-
ется двухсвязным в зависимости от входного процесса [pic].
генератор
[pic] марковского [pic] рис.2
двухсвязного
процесса
На вход генератора действует белый шум. На выходе - двух
связный марковский процесс.
g(f)
белый шум
0
f
f
В зависимости от коэффициентов [pic] ны выходе будут раз-
личные процессы. Процесс (1) получается из линейного диф.
уравнения 2-го порядка, если это диф. уравнение рассмат-
ривать на временной сетке (дискретна во времени).
Известно, что диф. уравнение 2-го порядка имеет реше-
ние в виде комплексной экспоненты, если корни характерис-
тического уравнения комплексные, аналогично для некоторых
значений коэффициентов [pic], процесс авторегрессии будет
иметь вид стохастической синусоиды.
Генератор двухсвязного марковского процесса
[pic] [pic]
((((
((((
[pic]
[pic]
[pic]
T - период дискретизации
Изменение по синусоиде называется синусоидальный тренд.
Марковский процесс 2-го порядка более богатый, чем 1-го,
с помощью него можно моделировать более сложные процессы.
Авторегрессия m-го порядка
(2) [pic]
[pic] - возбуждающий белый шум.
Процесс (2) получен из диф. уравнения m-го порядка путем
дискретизации. Это марковский процесс с дискретным време-
нем.
Этот процесс значительно более информативен, чем ра-
нее рассмотренные, ибо он может моделировать сложномоду-
лированные случайные процессы. Он может модулировать АМ,
ЧМ, ФМ путем подбора [pic] , а также подбором [pic] мож-
но идентифицировать очень многие случайные процессы ре-
ально существующие на практике, например : хорошо моду-
лируется движение летательнвх аппаратов при маневре (рег-
рессия m=6(16), речь, полет космического корабля, посадка
на планету.Стохастическая модель удобна потому, что она адекватна реальным
ситуациям.
Генератор m-связного марковского процесса
[pic] [pic]
((((
...... (((( ((((
[pic]
[pic] [pic]
Разностные модели на примере модели 2-го порядка
(3) [pic] - разностная модель 2-го порядка
[pic] - приращение, характеризует скорость изменения
процесса
[pic] Модель с приращением удобна в
том
[pic] плане, что не требуется заранее
[pic] знать коэффициенты регрессии.
[pic]
[pic]
Разностные модели 3-го порядка
(4) [pic]
[pic] - 1-я разность
[pic] - 2-я разность
[pic]
1-я разность характеризует скорость изменения случайного
процесса.
2-я разность характеризует ускорение.
Модель (3) и (4) очень широко иcпользуется на практи-
ке, т.к. здесь почти нет коэффициентов, которые нужно
идентифицировать ( а и [pic] ), они легко подбираются на ЭВМ
по методу наименьших квадратов. Для этого надо иметь ре-
альный процесс отсчетов , модель (4) и нужно воспользо-
ваться следующей формулой МНК/метод наименьших квадратов/
min [pic] где, [pic] - модель,
[pic]
[pic] - реальный процесс
Суть МНК состоит в следующем :
Есть m-отсчетов реального процесса, есть m-отсчетов [pic]
модели, составляется сумма квадратов и подбираются пара-
метры (а,[pic]) так, чтобы минимизировать эту сумму (делает-
ся это на ЭВМ)(метод перебора) но в авторегрессии m-го
порядка. Сделать это очень сложно.
Модели скользящего среднего
Пусть [pic] - независимая случайная величина, с произвольным распределением
(очень часто гауссовское распределение)
М[pic]=0 ; М[pic]=[pic] ; [pic] (процесс не коррелирован)
Тогда процесс
(1) [pic]
называется процессом скользящего среднего. Этот
процесс сформирован полностью из шума [pic] (из белого шума)
путем сдвига и весового суммирования.
([pic] - весовые коэффициенты). Сумма (1) генерирует
процесс [pic]. Процесс [pic] - коррелированный марковский
процесс. [pic]
Генератор скользящего среднего для формулы (1)
[pic] [pic] [pic]
(
[pic]
i
(
[pic]
: [pic] i
:
[pic]
Модель авторегрессии и скользящего среднего
[pic]
авторегрессия скользящее среднее
[pic] генератор генератор [pic]
случайного сигнала авторегресии
Здесь [pic] - белый шум;
[pic] - марковский(модельный)процесс, n=1,2....
Между генераторами процесс коррелирован.
[pic]
Многомерная марковская модель
(1) [pic] , где [pic]
[pic]; [pic] ; [pic]
Это самая распространенная модель
(2) [pic]
В модели (1) шумы характеризуются матрицей ковариации в
отличие от авторегрессии, под которой понимается следую-
щее:
[pic] ; [pic] ; [pic]
[pic] - столбец
[pic] - строка
Элементы матрицы [pic] состоят из корреляции внутри столбика
шума. Столбики между собой коррелированы.
Модель нелинейной регрессии
(3) [pic]
(4) [pic]
В формулах (3)(матричная форма записи),и (4)(скалярная
форма записи) индексы при ‘Х’ это не степени, а номера в
формуле столбика.
(3) и (4) - самая информативная модель , все предыдущие
модели получаются как частный случай из этой модели. Нап-
ример модель речи линейная и нелинейная, но нелинейная
более точная.
Глава 4
Динамические системы наблюдаемые на фоне
шумов
Одномерные динамические системы и фильтр Калмана
(1) [pic] ; [pic]
Шумы [pic]- называются шумами наблюдения (для активных по-
мех). Задачу фильтрации будем решать методом наименьших
квадратов. Задача фильрации требует уменьшить [pic].
Вводим эмпирический риск :
(2) [pic]
- Это есть классическая запись метода наименьших квадра-
тов . Эмпирический риск назван так потому, что в риск
[pic] входят наблюдения. Согласно формуле (2) требуется
минимизировать риск, а следовательно уменьшить влияние
шумов.
Если бы не была придумана модель уравнения (1), тогда
невозможно было бы записать риск [pic]. Необходимо
так выбрать [pic], чтобы получить минимум по всей траектории.
Эти [pic] будем обозначать : [pic]- оптимальная траектория
Она получается путем дифференцирования [pic] , i=1,2...n
Проделав математические операции получаем одномерный
фильтр Калмана.
(3) [pic] ; [pic]- задано
n=1,2...
Комментарий к формуле (3) :
Фильтр Калмана сглаживает шумы и оказывается, если шу-
мы [pic] гауссовские, то этот фильтр является оптимальным.
(4) [pic]
n ( ( [pic]
Т.е. среднеквадратическая ошибка будет минимизирована.
Если шумы [pic] не являются гауссовскими, то такая оценка
[pic] является ассимптотически минимальной, т.е. (4) выпол-
няется когда n ( ( .
Формула (4) является критерием минимума среднеквадрати-
ческой ошибки.
Фильтр Калмана дает оценку процесса [pic] истинного процесса
[pic] для гауссовских шумов, оптимальную по критерию (4),
т.е. по критерию минимума среднеквадратической ошибки.
Замечание 1 : Оптимальность означает, что не существует
другого фильтра, который мог бы дать такие
же результаты по среднеквадратической ошибке.(Остальные
фильтры дают большую ошибку)
Замечание 2 : Фильтр Калмана, в отличие от согласованного
фильтра, выделяет форму сигнала наилучшим
образом. (Согласованный фильтр обнаруживает сигнал и дает
максимум отношения сигнал/шум на выходе и сильно искажает
сигнал) Для согласованного фильтра все равно какая форма
сигнала на выходе, а фильтр Калмана выдает тот же сигнал,
что и на входе. Т.е. согласованный фильтр - для обнаруже-
ния сигнала, а фильтр Калмана - для фильтрации от шумов.
Замечание 3 : Фильтр Калмана записывается во временной
области, а не в частотной, как фильтр Вин-
нера.
Фильтр Виннера - реализован в частотной области.
(5) [pic]
K(() - оптимальная функция передачи, которая мини-
мизирует среднеквадратическую ошибку.
y(t)
[pic]- Оценка оптимальна. Она минимизирует СКО.
[pic] - энергетический спектр (распределение энергии
случайного процесса).
[pic] - энергетический спектр помехи.
Фильтр Калмана и Виннера дают
-[pic] одинаковое качество фильтрации,
однако фильтр Калмана проще ре-
ализуется на ЭВМ. Поэтому его и
АЧХ (пунктир) используют.
-[pic]
режекция
помехи
Анализ фильтра Калмана
[pic] Фильтр [pic]
Калмана
[pic] ; [pic]
x(t)- ненаблюдаемый случайный процесс
y(t)- наблюдаемый случайный процесс
y(t) На входе фильтр Калма-
на использует наблюде-
ния и начальные усло-
вия. На выходе фильтра
x(t) получается исходный
процесс x(t).
[pic] [pic] [pic] [pic]
Фильтрация медленных процессов
x(t)
При а=0.999,
[pic] ,
есть медленный процесс, тогда
[pic] [pic] [pic] [pic] [pic], это следует из формулы
(3).В этом случае [pic] -
t - экстраполяция (прогноз),т.е.
прошлая и текущая оценки поч-
ти одинаковы. В таком фильтре Калмана почти полностью иг-
норируются наблюдения. При оценке ситуации фильтр Калмана
не доверяет наблюдениям, а доверяет лишь прошлой оценке.
Это годится для процессов, которые можно легко предска-
зать.
Фильтрация быстрых процессов
[pic] - большая величина (>1); [pic].
x(t)
динамическая ошибка
[pic][pic][pic][pic] [pic]
t
Тогда [pic], в этом случае [pic] (оценка) равна самим наблю-
дениям. Это значит, что фильтр Калмана не доверяет прош-
лым оценкам.
Вывод : Фильтр Калмана минимизирует и флуктуационную и
динамическую ошибку.
Динамической ошибкой называется разница между оценкой [pic] и
истинным значением [pic] процесса.
[pic]-[pic]=динамическая ошибка.
Флуктуационная ошибка - тоже, но за счет шума.
При быстром процессе шумы фактически не фильтруются.
Невязка [pic] входит в фильтр Калмана и выполняет роль
корректирующего члена, который в формуле (3)
учитывает ситуацию, которую дают наблюдения.
Оценка на шаге ‘n’ равна экстраполированной оценке
плюс некоторый корректирующий член, который есть невязка,
которая взята с весом [pic]. (Корректирующий член учитывает
наблюдения на шаге ‘n’) Вес [pic] учитывает апприорную дина-
мику системы (модели).
Вывод (по одномерному фильтру Калмана):
1) Фильтр Калмана можно построить в виде реккурентного
алгоритма только в том случае, если имеется модель
случайного процесса, который он фильтрует.
2) Фильтр Калмана оптимален для реального процесса только
в том случае, если реальный процесс близок к модели,
которую мы используем.
Многомерный фильтр Калмана
(1) [pic], где [pic] - текущее время, - [pic]
- вектор (столбики)
A - матрица k(k, H - матрица m(k.
[pic] - вектор, [pic] - шум наблюдения
[pic] ; [pic] - шум динамической системы.
Запишем (1) в скалярной форме. cov(=Q, cov(=P.
[pic]
[pic]
Многомерный фильтр Калмана для модели (1) :
[pic] ,
где [pic]- вес, [pic]- невязка.
[pic] ; где [pic]- единичная матрица
[pic]=[pic]Г[pic] ; Начальные условия задаются из аппри-
Г[pic] ; орных условий [pic]. [pic]- транспони-
рованная матрица (сопряженная).
Траекторные изменения
Часто требуется получить оценку траектории летательного
аппарата. Летательный аппарат может быть зафиксирован с
помощью радиолокатора, либо некоторой навигационной сис-
темой.
Летательный аппарат рассматривается в некоторой сис-
теме координат :
Если известны точно все 9 коор-
Z динат (см.ниже), то можно точ-
л.а. но навести ракету. Для определе-
ния всех координат существуют
р X траекторные фильтры, которые
строятся на базе фильтра Калмана.
Y
[pic]
Траекторный фильтр 2-го порядка
(1) [pic] ; a<1
Первые две строки (1) - это модель, последняя строка -
- наблюдение.
Составим многомерный фильтр Калмана , для этого по мо-
дели (1) составим многомерную модель.
[pic] ; [pic]
(2) [pic] ; [pic]
[pic] ; [pic] ; H=[1,0]
Из формулы (2) имеем :
[pic] ; [pic] ;
[pic]; [pic]; [pic]
Траекторный фильтр 3-го порядка
(4) [pic], первые две строки - модель,
последняя строка - наблюдения
[pic] ; [pic] ; [pic] ; [pic] ;
H = [1,0,0] ;
[pic] ; [pic];
[pic]
Теория нелинейной фильтрации
Здесь нелинейные модели записываются в виде :
(1) [pic] ; здесь : верхняя функция - нелиней-
ная регрессия, нижняя - уравнение наблюдений.
Функция [pic] генерирует на любом интервале неко-
торый случайный процесс [pic]. Это есть модель неко-
торого случайного процесса, более богатая, чем все преды-
дущие модели.
Уравнение наблюдений : наблюдается не сама [pic], а не-
которая функция (([pic]);наблюдения ведутся на фоне шумов [pic]
[pic] - шум нелинейной динамической системы (шум модели)
1) Требуется найти оценку [pic], такую, чтобы :
(2) [pic]
[pic]
Формула (2) - критерий минимума среднеквадратической
ошибки.
2) Требуется получить реккурентную оценку, такую же как в
фильтре Калмана.
В чистом виде получить оптимальную оценку нельзя, есть
лишь приближенные решения, когда функции f(x) и ((x) -
- линеаризуются.
[pic]
Тейлоровская линеаризация - используется ряд Тейлора,
линейная часть (1-я, 2-го
члена). ( ((x) и f(x) - имеют непрерывные первые про-
изводные).
Разложение в ряд Тейлора в точке [pic]
[pic]
где [pic] - оценка, которую мы еще не знаем, но собираем-
ся находить.
Эти линеаризованные функции подставим в (1) и получим
линейную систему :
(2) [pic]
Коэффициенты a,b,c,d находятся после подстановки.
[pic] и [pic] имеют произвольное распределение.
Будем использовать метод наименьших квадратов для на-
хождения оценок [pic].
[pic] ; [pic] ; [pic]
Выпишем эмпирический риск :
[pic]
[pic]
( - функционал.
После линеаризации :
[pic]
производная из ( берется легко
Продифференцировав и воспользовавшись методом индукции
получаем :
(3) [pic]
[pic] ; [pic] - задано [pic]
Выводы :
1. В связи с тем, что начальная точка разложения
в ряд Тейлора функции ((x) была выбрана в точ-
ке [pic], то несмотря на линеаризацию, урав-
нение (3) получилось как нелинейное и оно по-
хоже на уравнение (1) модели.
2. В отличие от фильтра Калмана, в [pic], при рек-
курентном его вычислении входит [pic] - оценка
‘x’ на первом шаге. Коэффициент усиления можно
вычислить заранее за ‘n’ шагов (в фильтре Кал-
мана). Но здесь этого сделать нельзя. Сущест-
вует так называемая обратная связь.
Пример нелинейной фильтрации :
[pic] ; [pic]
T - период колебания
( - период дискретизации
t - текущее время
[pic]- фаза гармонического колебания с амплитудой равной 1
[pic] процесс наблюдается на фоне шума
[pic] - дискретная частота; [pic]
(4) [pic]
(
Т
Отношение сигнал/шум может быть меньше 1. Требуется получить оценку фазы,
такую, чтобы разница в квадрате
была минимальной.
[pic]
[pic]
[pic]. Из (3) получаем :
(5) [pic]
Перемножим и пренебрежем 2й гармоникой :
(6) [pic] - ФАПЧ
(5) - ФНЧ, фильтрует 2-ю гармонику полностью(раз-
ностное уравнение)
Структурная схема ФАП
[pic] - на вход
[pic] вх [pic] [pic]
([pic]
[pic]
[pic] a
[pic] синтезатор (
опоры
([pic]
На вход поступает аддитивная смесь.
Принцип работы ФАП
Измеритель фазы является следящей системой с отрицатель-
ной обратной связью. Опорное колебание [pic] с фа-
зой [pic] - экстраполированная фаза. [pic]([pic]. Чем точнее
экстраполяция, т.е. чем меньше [pic], тем точ-
нее будет оценка.
Глава 5
Оптимальное управление дискретными динами-
ческими системами
Существует два типа детерминированных управляемых процес-
сов (детерминированных систем)
(1) [pic] - детерминированная система
[pic] - управление (некоторая функция от дискретного
времени, которая входит в разностное уравнение
динамической системы)
Стохастическая управляемая система
(2) [pic] , где [pic] - шум(может быть белым
[pic]),
а может быть и небелым, например, описываться сколь-
зящим средним ([pic]).
Критерий оптимального управления
Пусть модель (1) или (2) генерирует случайный процесс :
[pic] - управляемый процесс с дискретным
временем, т.е. процесс должен развиваться таким образом,
чтобы минимизировать некоторую функцию риска, тогда уп-
равление называется оптимальным.
Математически это выглядит так :
[pic],
где f(() - выпуклая функция
При движении ракеты по некоторой траектории из точки А в
точку В траектория должна быть такой, чтобы минимизиро-
вать энергетические затраты на управление.
Пример 2 :
Существует некоторая эталонная траектория.
Необходимо привести движение про-
цесса к эталону за минимальное
время. Это называется оптимизация
x(t)-эталон по быстродействию. Существует мно-
жество способов аналитического на-
[pic] хождения оптимальной функции упра-
x(t) вления.
[pic]
Метод динамического программирования
Имеется детерминированная система :
(1) [pic]
Принцип Бэлмана - состоит в том, что оптимальное управ-
ление ищется с конца в начало (из будущего в прошлое).
Задача решается в обратном направлении.
(2) [pic]
Аналитическое решение задачи по Бэлману
Предположим, что мы отправились из [pic]и прошли траекторию:
[pic] . И предположим, что за ‘k’ шагов управление вы-
брали. Принцип динамического программирования основывает-
ся на том, что любой кусок траектории оптимального управ-
ления является оптимальным.
(3) [pic]
Траектория от (k+1) до ‘n’ называется хвостом.
N - последняя точка в управлении
[pic]
[pic] [pic]
[pic] [pic] С учетом (3) запишем :
(4) [pic]
Допустим, что начиная от шага (k+1) до ‘n’ в формуле (4)
оптимальное управление уже выбрано.
(5) [pic]
k=N,N-1,...,1
[pic]
(6) [pic]
[pic]
Формула (6) называется уравнением Бэлмана (уравне-
ние динамического программирования)
Выводы: (из уравнения (6))
Уравнение (6) позволяет в реккурентной форме вы-
вычислить управление, шаг за шагом, от точки N
до 1 (из будущего в прошлое) получить минимиза-
цию (6) на каждом шаге. Получить [pic]. Значе-
ния управления фактически получаются методом пе-
ребора. Оптимальная траектория [pic]) неиз-
вестна до самого последнего шага.
Если задача имеет большую размерность, то
сложность при вычислении очень большая. Если
вводить динамические системы (т.е. модели), то
можно значительно упростить метод нахождения оп-
тимального управления. Т.е. получить управление
в замкнутом виде (в виде некоторой формулы).
Синтез оптимального управления для марковских динамичес-
ких систем.
(1) [pic] ; [pic] ; [pic] ; где -
[pic] - управление; [pic] - шум динамической системы.
Управление должно менять [pic] - траекторию, и изменять ее так, чтобы
минимизировать средний критерий качества,
причем управляется динамическая система не по всем коор-
динатам.
[pic] - управляемый случайный процесс.
Динамическая система, сама как таковая, не наблюдается, а
наблюдается (([pic])(нелинейно преобразованная фазовая пере-
менная) с шумом. В этом случае говорят, что динамическая система
ненаблюдаема напрямую. Для того, чтобы сделать ее
наблюдаемой необходимо использовать теорию нелинейной
фильтрации (см. предыдущие лекции).
В этом случае получаем оценку нелинейной динамической
системы в условиях линеаризации по Тейлору :
(2) [pic]
Синтез оптимального управления используя (2) проведем применив квадратичный
критерий качества, причем управле-
ние динамической системой будем вести к некоторому этало-
ну, т.е. задано : [pic] , i=1,2...n
Критерий оптимизации
(3) [pic] ;
где (( - норма, [pic].
Риск складывается из двух слагаемых :
1-е слагаемое : Это есть квадрат отклонения траектории от
эталона. Оно должно быть минимизировано с
учетом формулы (2).
2-е слагаемое : Это есть сумма с квадратом самого управ-
ления (некоторая сила) должны быть мини-
мизированны (так должно быть всегда)
Минимизация (3) - это достаточно сложная задача вариаци-
онного исчисления (просто взять здесь производную по ‘u’
не удается).
Для минимизации (3) используем уравнение Бэлмана :
(4) [pic]
[pic]
В формуле (4) минимизируя шаг за шагом получим :
(5) [pic] ; где [pic] - матрица
Выводы : (к формуле (5))
Оптимальное управление (5) реализуется с ис-
пользованием линейной оценки динамической сис-
темы, и это управление вставляется в формулу :
[pic]
Если упростить критерий и привести его к виду (3’):
(3’) [pic]
[pic]
то минимизация дает оптимальное управление эталона:
(6) [pic]
Оптимальное управление пропорционально разности меж-
ду экстраполированной оценкой и эталоном, т.о. полу-
чим :
(7) [pic]
Оценка (7) подставляется в (6). Со временем, при ми-
нимизации в этом случае сама оценка [pic] устремляется к
эталону.
Пример синтеза динамической системы управления частотой
генератора
Общая постановка :
Пусть имеется некоторая эталонная траектория [pic]
(1) [pic] , где [pic] - шум
Если эталон защищен, то его фильтруют.
Имеется управляемая динамическая система :
[pic]
Управляемая динамическая система - фаза генератора или
траектория, которая должна подстроиться под эталон.
(2) [pic] ; шума [pic] часто нет, поэтому
им пренебрегают. Пусть
(3) [pic]
Рассмотрим более сложную модель фазы рассматриваемого ге-
нератора.
(4) [pic]
Считаем, что в (1),(3) уход фазы очень медленный,т.е.
[pic] . Используя нелинейную функцию оценка эталона:
(4’) [pic]
В (4) решение уравнения относительно [pic] имеет вид :
(5) [pic] ; с<1.
Выше было доказано, используя уравнение Бэлмана,
что :
(6) [pic]
Структурная схема реализации оптимального управления под-
стройки частоты к эталону
(4’) (5’)
шум
эталонный нелиненый Решающее
Подстраи-
генератор фильтр [pic] [pic] устройство
ваемый ге- вых
Т Т нератор
( c
устройство
[pic] + - [pic] управления
[pic]
[pic]
На выходе - частота подстраиваемого генератора.
Подстраиваемый генератор имеет следующий вид:
[pic]
[pic] - изменяется по закону (4), управляющая функция воз-
действует /вырабатывающаяся на прошлом шаге (i-1)/ она
должна подстраивать генератор так, чтобы она стремилась
к эталону.
Для этого : имеется устройство управления, которое воз-
действует на контур подстраиваемого генератора так, чтобы
(путем воздействия на варикап) [pic]; ( ( с, тогда [pic].
Управляемая система с обратной связью: если есть откло-
нение фазы на [pic], (т.е. отклонение частоты) ([pic]),
тогда решающее усторойство дает оценку [pic]. Это приведет к
тому, что [pic] отклонится, напряжение подается на устрой-
ство управления, которое ликвидирует приращение. (правое
кольцо называется - кольцо ФАПЧ).
Глава 6
Управление нелинейными динамическими систе-
мами с помощью отрицательной обратной связи
Постановка задачи
Определение : Следящим измерителем называется система,
осуществляющая оценку некоторого параметра
(который является случайным процессом) в
следящем режиме.
Параметр может иметь следующий физический смысл :
а) Угловые координаты некоторого летательного аппарата,
которые изменяются во времени.
б) Изменение во времени доплеровской частоты.
в) Дальность до объекта.
Пример : летательный аппарат
D(t) - дальность
z [pic](t) - угол азимута
[pic] [pic] - доплеровская частота
D
[pic] X Все эти 3 параметра входят в
( некоторый сигнал.
Y ( - угол места
[pic] ; [pic]
Доплеровская частота : Любая движущаяся система, облучае-
мая электромагнитной энергией, из-
лучает эту энергию.
[pic] ; где [pic] - радиальная скорость.
Структурная схема следящего измерителя
y(t)=S(t,((t))+((t))
+ ((t) Фильтр
Дискриминатор экстраполя- [pic]
тор
-
[pic]
рис.1
Синтезатор [pic]
опоры (блок 3)
((t) - невязка.
[pic] - оценка.
Эта схема была построена в 30х годах инженерами-учеными.
Однако сначала 60х годов оказалось, что ее можно синтези-
ровать, используя теорию нелинейной фильтрации.
На рис.1 представлена схема следящего измерителя, где
управление осуществляется с использованием ООС. Эта
структура состоит из 3х блоков.
1й блок: - дискриминатор. На вход его подается смесь сиг-
нала S(t,((t))+((t) (аддитивная смесь), где
((t) - меняющийся парметр. Нужно получить его оценку [pic].
На другой вход дискриминатора подается копия сигнала S(t,((t)), которая
должна повторять сигнал, спрятанный в
шумах. Это достигается путем экстраполяции (предсказание) случайного
процесса. На входе дискриминатора образуется
невязка : [pic] - это есть невязка нелинейной
фильтрации.
2й блок: - фильтр экстраполятор (блок фильтрации). На его
вход поступает невязка. 2й блок формирует те-
кущую оценку случайного процесса ((t). Это окончательный
нелинейный фильтр - расширенный фильтр Калмана. В этом же
блоке формируется оценка экстраполяции (см. далее) и эта
оценка подается на синтезатор опоры.
3й блок: - формирует копию сигнала. Оценка ((t) формиру-
ется по следующему критерию : [pic]
- критерий среднеквадратической ошибки.
Оптимальная оценка по критерию минимума среднеквадрати-
ческой ошибки получается с помощью только лишь нелиней-
ной фильтрации.
Замечание : Фильтрация нелинейна потому, что невязка фор-
мируется нелинейно ( оцениваемый параметр
((t) входит в сигнал нелинейно), S(t,((t)) -
нелинейно.
Принцип экстраполяции для задач синтеза следящих измери-
телей управляемых с помощью ООС
Следящий измеритель отслеживает некоторый (многомерный)
параметр [pic], причем имеются наблюдения :
(1) [pic] , где [pic] - некоторая нелинейная
функция
В радиоавтоматике,в непрерывном времени это выглядит так:
[pic] , где [pic]; 0<t<T.
А -амплитуда гармонического колебания, которая, например,
несет информацию об угловом положении цели.
Т - время наблюдения
( - время запаздывания, несет информацию о временном по-
ложении сигнала
( Т
t
[pic]- доплеровская частота.
((t)- модуляция сигнала (известна заранее)
((t)- некоторая начальная фаза сигнала, которая несет ин-
формацию об угловом положении цели. Либо ((t)- ме-
шающий параметр.
[pic]
Система слежения за ((t) - следящий измеритель. Общий
вид записи см. (1).
Решение проблемы синтеза следящего измерителя :
Пусть ((t)[pic].Рассмотрим ((t) на дискретной сетке ([pic],
где [pic], (t - интервал дискретизации.
(2) [pic] ; (<1
(3) [pic] - 3х мерный вектор, [pic]
[pic] - фазовая координата
[pic] - приращение скорости
[pic] - ускорение (второе приращение)
Используя (3) модель (2) преобразуется :
(4) [pic]
h=(1 0 0( - вектор 3(3 , [pic]
А - матрица 3(3, такая, что получается модель (2).
Используя модель (4) видим, что верхнее уравнение линей-
ное, а нижнее уравнение нелинейное. Используя теорию не-
линеной фильтрации получим оценку :
(5) [pic]
(5) - уравнение нелинейной фильтрации.
Структурная схема, которая реализует алгоритм следящего
измерителя ([pic]) выглядит так :
дискриминатор фильтр экстраполятор
[pic] + ( [pic] [pic]
[pic] А
(t
синтезатор
опоры
[pic] [pic]
Экстраполяция.(,(,( - фильтры
Реализация нелинейного фильтра по формуле (5) несмотря на ее реккурентный
характер достаточно сложна для реализации
на сигнальных процессорах, поэтому часто используют еще
одно упрощение - переходят от векторно-матричной записи
нелинейной фильтрации по формуле (5) к скалярной записи.
(заметим, что формула (5) реализует следящий измеритель
некоторого параметра)
(,(,( - фильтры значительно упрощают синтез следящих
измерителей. Идея состоит в том, что вместо матричного
коэффициента [pic] в формуле (5) подставляются скалярные ве-
личины.
Проектирование (,(,( - фильтра
Модель :
[pic] ; а<1
[pic] - скалярное наблюдение
Был введен параметр :
[pic]
Поскольку мы ввели этот параметр, фильтр получился 3х
мерный. Далее вместо фильтра (5) запишем эвристический
фильтр: (Эвристика - полуинтуитивное мышление)
(6) [pic]
(<1, (<1, (<1
(7) [pic]
Комментарии к (6) и (7) : Справа - невязки, взяты из тео-
рии нелинейной фильтрации. Од-
нако в (6) экстраполированное значение получается из фор-
мулы (7). (7) - это кусок ряда Тейлора.
В нелинейной фильтрации экстраполяция получается ав-
томатически. А здесь мы ее искусственно создали в формуле
(7) , но она очень сильно близка к формуле (5).
(
Фильтрация ( Первое слагаемое в (6) (верхняя строка) есть
координаты ( [pic] , плюс взвешенный, с весом ( корректи-
| рующий член, который есть невязка. Эта невя-
| зка корректирует экстраполяцию за счет ново-
| го наблюдения.
(
Фильтрация ( Первое слагаемое во второй строке (6) - есть
приращения ( экстраполяция полного приращения([pic])
(
( 3-я формула в (6) - фильтрация второго при-
( ращения координаты.
(
Коэффициенты (,(,( получаются экспериментально.
(8) [pic] } -подбор (,(,(
[pic]
(8) - метод наименьших квадратов, подбор (,(,( на ЭВМ.
Структурная схема следящего измерителя за параметром [pic]
по формулам (6), (7).
формирователь невязки
[pic] [pic]
[pic] + ( [pic] ( [pic]
- [pic] [pic]
Синтезатор [pic] A
[pic] опоры S(()
[pic]; [pic] ; [pic] ( [pic]
Синтез следящего измерителя доплеровской частоты
Постановка задачи [pic] - вектор скорости
цели
Имеется РАС.
Посылается сигнал от РАС
с частотой [pic]. (=1(3см. Обратный сигнал будет на частоте
[pic] ; [pic]. Доплеровская частота используется
для повышения помехоустойчивости РАС и для наведения ра-
кет. Поскольку цель движется, то меняется ( и следова-
тельно и [pic]. Отсюда вывод: за доплеровской частотой нуж-
но следить.
Проблема : синтезировать следящий измеритель доплеровской
частоты.
Приходящий сигнал :
[pic]
((t) будем записывать в дискретные моменты времени.
[pic] , i=1,2,...n ; [pic]
Дискретная модель фаз :
(1) [pic];
[pic] ; [pic] ; T - период колебания.
(<1, такой, чтобы система была устойчива. Предполагаем,
что за (t не меняется [pic].
Синтез цифрового оптимального следящего измерителя доп-
леровской частоты.
y(t)=Acos((t+((t))+((t)
((t) - фаза, которая содержит доплеровскую частоту
((t)=[pic]
[pic] - неизвестны, но постоянны.
Обычно для реализации цифрового измерителя используется
квадратичный канал :
[pic] [pic] [pic]
( RC-фильтр АЦП [pic]
Оптималный
рис. 1 нелинейный
y(t) тактовая (( фильтр (3)
синхронизация
( RC-фильтр АЦП
[pic]
[pic] [pic] [pic]
После такого преобразования снимается несущая, остается
только доплеровская частота.
((t) - низкочастотный шум.
Acos((t),Asin((t) - НЧ компоненты.
На большей [pic] требуются очень сложные и дорогие АЦП.
После цифровой обработки (АЦП) модель записывается :
(2) [pic] , где [pic] ;
h = (1 0( ; [pic] ; [pic]
Вектор динамической системы двумерный и динамическая сис-
темы тоже двумерная.
(3) [pic]
Фильтр (3) дает оцнеку [pic] . Реализация невязки ана-
логично как в (,(,( - фильтрах.
Синтез аналого-цифрового следящего измерителя.
Рис. 2 Ф-1 Д АЦП Фильтр [pic]
Калмана
экстра-
[pic] УПЧ ( Ф-3 полятор
[pic] Ф-2 Д АЦП [pic]
Синтезатор [pic]
опоры
Ф-3 - узкополосный фильтр
Ф-1,Ф-2 - расстроенная пара фильтров
Ф-1 Дискриминационная
характеристика :
[pic]вычитателя
f
[pic]
Ф-2 (f
f
[pic] [pic]
Дискриминационная характеристика - это разность фильтров
Ф-1 и Ф-2. Она формирует невязку [pic].
(1) [pic]
Эта система используется для оценки доплеровской частоты,
меняющейся во времени. Это следует из уравнения (1), где
нижнее уравнение дает поправку доплеровской частоты за
один шаг.Невязка формируется также как в (,(,( - фильтрах.
Глава 7
Устойчивость стохастических систем
В радиоавтоматике все без исключения системы являются
стохастическими, т.е. сама динамическая система описыва-
ется стохастическими разностными уравнениями. Наблюдения
тоже записываются с учетом шумов.
1) Линейные стохастические системы
(1) [pic] ; [pic]
[pic] - шум динамической системы
[pic] - шум наблюдений
[pic] - m-мерный вектор
с - матрица перехода
Устойчивость определяется нормой матрицы ‘c’.
Достаточным условием устойчивости (1) является :
[pic], где
(2) [pic] , где [pic] - элементы матрицы ‘c’
с =([pic](, i=1,...,m ; k=1,...,m
Если условие (2) выполняется, то система всегда бу-
дет устойчива.
Замечание: В некоторых случаях система может быть устой-
чивой , если [pic], потому что условие (2) яв-
ляется достаточным, но не необходимым.
Пример стохастической системы 1-го порядка:
(1)’ [pic]
Оценка [pic] - система будет устой-
чива при 0<c<1.
[pic],[pic] 0<c<1 - является необходи-
c>1 мым и достаточным условием
устойчивости системы.
[pic]
[pic]
[pic]
Устойчивость нелинейных систем
Нелинейная стохастическая система :
(3) [pic]
Устойчивость нелинейных динамических систем опре-
деляется функцией Ляпунова.
Определение устойчивости по Ляпунову для детерминирован-
ной системы.
[pic]
Вводится специальная функция, называемая функцией Ляпуно-
ва. Обозначается : [pic]. Функция удовлетворяет следующим
условиям :
1. Если x=0, то [pic]=0
2. Приращение функции Ляпунова во времени ([pic][pic]0,
т.е. функция должна быть убывающей: [pic]
[pic] Для стохастической системы (3)
обычно функцию Ляпунова выби-
рают так: [pic]. А условие
устойчивости для системы (3)
будет следующим:
[pic]
1)[pic],
[pic] i(( (ассимптотически)
2) [pic]
Анализ качества работы стохастических систем радиоавтома-
тики
Качество линейных и нелинейных стохастических систем оп-
ределяется реальным качеством фильтра. (см. выше)
Синтез предполагает, что модель соответствует реальному случайному
процессу, который мы фильтруем. В этом случае
качество определяется следующим образом :
Пример: Одномерный фильтр Калмана.
Фильтр : [pic] ; [pic]
[pic]
[pic] - шум наблюдений
[pic]
[pic] - апостариорная дисперсия
[pic] - коэффициент усиления
фильтра Калмана
i - дискретное время
Модель : [pic]
[pic] [pic]
Качество фильтрации определяется адекватностью модели и реального процесса.
Как проверить адекватность модели
реальному процессу ? Сделать это
[pic] можно только по невязке: [pic],
где [pic].
i
Теорема : Процесс тогда и только тогда адекватен модели,
когда невязка является белым шумом.
Замечание: Это может случиться только тогда, когда [pic]
Проблема качества определяется проблемой экстраполяции.