1. Квадратичная функция потерь представляет собой квадратичную форму относительно отклонения (ошибки, невязки) υ -
оценки
от истинного значения параметра υ:
П(υ,
) = (υ -
)T В (υ -
) (4.7)
где В — любая положительно определенная симметричная матрица. Напомним, что матрицу В называют положительно определенной, если скаляр хтВх (квадратичная форма) положителен для любых ненулевых r-мерных вектор-столбцов х. При оценке скалярного параметра υ (r=1, υ = υ) квадратичная функция потерь П(υ,
) = b (υ -
)2, где b>0, т. е. является параболой (рис. 4.2, и). В общем случае (г^1) уравнение (4.7) задает (г+1)-мерный параболоид. Подставив выражение (4.7) в (4.6), найдем ![]()
Продифференцировав правую часть этого выражения по
и приравняв результат нулю, с учетом невырожденности матрицы В независимо от конкретного вида последней для оптимальной оценки
=
опт получим
опт =
(4.8)
где
=
- апостериорное математическое ожидание векторного параметра υ. Из равенства (4.8) видно, что байесовская оценка при квадратичной функции потерь есть апостериорное среднее измеряемого параметра.
Таким образом, байесовская оценка i-го параметра
,- есть его апостериорное среднее, т. е. математическое ожидание, вычисленное на основании апостериорной ПВ
содержащей всю информацию о υi извлеченную из y(t).
Байесовскую оценку (4.8 называют также оценкой по центру тяжести, ибо
, - центр тяжести апостериорного распределения
[при более строгой терминологии — абсцисса центра тяжести плоской фигуры, ограниченной кривой
и осью υi. Отметим, что независимость байесовской оценки (4.8) от матрицы В в (4.7) позволяет, не нарушив общности, считать матрицу В диагональной. Тогда функция потерь (4.7) П(υ,
) =
, (4.9)
где b>0. Смысл такой функции потерь ясен: плата за отличие
от υ растет пропорционально квадрату ошибки измерения каждого из параметров υi.
2. Прямоугольная (равномерная) функция потерь при оценке скалярного параметра υ предполагает ущерб от ошибок, не выходящих за пределы ±∆/2, нулевым, а от прочих ошибок — одинаковым:
(4.10)
— функция, описывающая прямоугольный импульс единичной амплитуды и длительности, симметричный относительно оси х = 0. Обобщая функцию (4.10) для многомерного случая
. (4.11)
При этом считаются безопасными любые случаи, когда ошибки по параметрам Х; одновременно попадают в г окон.
Байесовской оценкой окажется оценка по максимуму (моде) апостериорной ПВ:
опт =
(4.12)
где
= (
,
, ...,
)T - значение вектора υ, при котором апостериорная ПВ достигает максимума. Правило МАВ (4.12) можно получить и модифицировав функцию (4.11) до простой функции потерь
предполагающей одинаково опасными любые ошибки, но взимающей бесконечный по абсолютному значению отрицательный штраф, т. е. премирующей в бесконечном размере за точное совпадение оценки с истинным значением измеряемого параметра. Тогда правило МАВ (4.12) следует из выражения (4.11) после применения фильтрующего свойства δ-функции.
|
Следовательно, использование разных разумно выбранных функций потерь привело к различным результатам, иллюстрацией чему служит рис. 4.3, где приведены примерный вид апостериорной ПВ скалярного параметра, ее центр тяжести
и мода
.
Рис.4.3. Результаты оценки случайного параметра при разных функциях потерь
Можно ввести и другие функции потерь, увеличив число примеров, приводящих к различным байесовским оценкам. Следует, однако, отметить, что для симметричных апостериорных распределений и симметричных неубывающих функций потерь все байесовские оценки совпадают. Для практических задач асимметричные функции потерь не представляют интереса.
4.3. Критерии оценки неслучайных параметров сигналов и граница Крамера-Рао
Как следует из § 4.2, основным в байесовской теории оценок является допущение о том, что оцениваемые параметры — случайные величины и их априорная ПВ известна. В априорной ПВ содержится информация, источником которой служат наблюдения, предшествующие данному измерению. Реальные обстоятельства, однако, нередко складываются так, что наблюдатель не обладает надежной априорной информацией о υ. Такая картина характерна, например, для оценки каких-либо физических величин, не измерявшихся ранее вообще или измерявшихся в иных условиях. Например, обширная статистика метеообразований в экваториальной области Земли не может рассматриваться как достоверная априорная информация для метеолокатора, работающего в приполярных широтах; сведения, полученные с помощью радиотелескопа, просматривающего один сектор небесной сферы, нельзя использовать как априорные при переходе к другому сектору и т. п. Незнание априорной ПВ X исключает возможность нахождения байесовских оценок, так как воспользоваться равенством (4.14) для построения апостериорного распределения при этом не удается. Можно, конечно, в этом случае применить так называемые минимаксные оценки, гарантирующие непревышение средним риском при любых ПВ определенного значения. Однако отыскание таких оценок не просто и, кроме того, сами минимаксные оценки нередко излишне осторожны, минимизируя средний риск для «плохих» W ценой существенного завышения П для остальных.
Радикальным способом преодоления трудностей, обусловленных отсутствием априорных данных, является полный отказ от интерпретации измеряемых параметров как случайных величин и переход к небайесовским критериям качества, не требующим предписываемого формулами (4.5), (4.6) усреднения риска по значениям измеряемой величины X. Один из таких критериев, весьма продуктивный и в наибольшей мере адекватный общепринятому взгляду на качество физических измерений, базируется на требованиях несмещенности и минимума условной дисперсии оценки. При измерении физической величины экспериментатор, как правило, старается придерживаться такой методики, при которой результат измерения не содержит систематической погрешности. Это стремление формально можно выразить условием несмещенности оценки для любых возможных истинных значений оцениваемого параметра υ. Усреднение проводится по всем колебаниям y(t).
Таким образом, каким бы ни было действительное значение параметра, его оценка в среднем не должна отличаться от X.
Введенные условия в совокупности можно трактовать как единый критерий качества, предписывающий считать оптимальной ту оценку, для которой одновременно выполнены условия
(4.13)
(4.14)
Такая оценка будет иметь потенциальную, т. е. наивысшую возможную, точность. Подобный критерий в общем случае не ведет столь же явно, как байесовский, к конкретным правилам оценки. В то же время для ряда важнейших практических задач вытекающие из него решения оказываются достаточно простыми Основу их составляет соотношение, называемое первенством (границей) Крамера-Рао и устанавливающее нижний предел условной дисперсии несмещенной оценки параметра.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 |



