3) Взаимная энтропия для двух ансамблей

4) Условная энтропия первого порядка

5) Условная энтропия второго порядка

Проверка. Используя (23.72) и подставляя значения энтропии первого и второго порядка, имеем
Информационные характеристики элементов взаимосвязанных вероятностных пространств оцениваются по характеру измерения априорной и апостериорной вероятностей их элементов. При этом под априорной вероятностью подразумевается вероятность нахождения элементов дискретных пространств в том или ином исходном состоянии перед началом каждого опыта. Например, вероятность сообщения быть переданным до того, как на приемном конце о нем получены какие-либо сведения, будет априорной вероятностью, а вероятность того, что действительно было передано данное сообщение, после того как оно было получено, будет апостериорной вероятностью.
Предположим, нас интересует степень достоверности того, что при приеме bj было передано aі. Информация, устанавливающая степень достоверности интересующего нас факта, сводится к изменению априорной вероятности р (аі) до апостериорной вероятности р (аі/bj). Количественной мерой этого изменения является логарифм отношения апостериорной вероятности к априорной.
Количество информации, содержащееся в событии bj относительно события ai,
![]()
Умножим числитель и знаменатель на bj, тогда

что лишний раз подчеркивает свойство симметрии информации. Благодаря именно этому свойству информация I (ai, bj) называется взаимной информацией между событиями аi и bj. Взаимная информация есть мера статистической связи между ai и bj. При полной статистической связи между ai и bj вероятность р (аі/bj)= 1, а
(23.77)
Выражение (23.77) представляет количество собственной информации, содержащейся в величине ai.
При этом сама величина ai может состоять из элементов, положение каждого из которых относительно других элементов имеет определенную информацию. При этом сумма собственных информациq элементов, представляющих величину ai, равна собственной информации самой величины ai.
Пример. Определить количество собственной информации в каждом символе принятого сообщения А5 и в сообщении в целом, если априорные вероятности появления сообщений на выходе источника заданы табл. 23.2:
Таблица 23.2. К примеру

де р0 — априорная вероятность появления сообщений на выходе источника;
р1— вероятность после приема первой кодовой посылки а1;
р2 » второй » а2;
р3 » третьей » а3.
(Кодовые слова состоят из кодовых посылок. Кодовое слово соответствует одной букве первичного алфавита, а кодовая посылка — одной букве вторичного алфавита. В нашем примере букве A1 первичного алфавита соответствует кодовое слово 000, состоящее из трех кодовых посылок).
Решение. 1) Сумма вероятностей сообщений, получение которых возможно после приема первой кодовой посылки,
![]()
2) Вероятностьполучения каждого из сообщений а5—а8 после приема первой кодовой посылки, как произведение априорной вероятности каждого символа на величину, обратную сумме априорных вероятностей данной группы сообщений

аналогично
![]()
3) После приема второй кодовой посылки число возможных сообщений еще больше сократится: на 10 начинаются только два сообщения, очевидно, что вероятность каждого из них будет 1/2, действительно:

4) После получения третьего символа вероятности получения всех сообщений, кроме A5, становятся равными нулю
![]()
5) Поскольку по определению, количество собственной информации равно отношению апостериорной вероятности к априорной, то количество собственной информации в первой принятой кодовой посылке а1 относительно сообщения А5:
![]()
Количество собственной информации во второй принятой кодовой посылке а2 сообщения А5 равно количеству добавочной информации, вносимой а2 при известном а1.
![]()
Количество собственной информации в третьей принятой кодовой посылке равно количеству добавочной информации, вносимой а3 при известных а1 и а2,
![]()
Количество собственной информации во всем сообщении А5 равно сумме собственных информации отдельных символов, составляющих кодовое слово, соответствующее A5, и равно количеству взаимной информации каждой дискретной кодовой посылки a1; a2; a3 относительно сообщения А5:
![]()
т. е.
![]()
что возможно в том случае, когда условные вероятности р (b/а) = 1, т. е. при отсутствии помех кодовые слова всегда однозначно определяют сообщение.
Нетрудно убедиться в том, что количество информации при передаче А1 равнялось бы 1 бит
при передаче А8 равнялось бы 5 бит ![]()
Среднее же количество информации на сообщение, создаваемое данным источником,

Как видим, среднее значение собственной информации элементов ансамбля есть энтропия ансамбля
![]()
Аналогично, условная собственная информация, содержащаяся в событии аi при условии появления bj
![]()
Математическое ожидание этой величины на ансамбле АВ есть общая условная энтропия

Взаимная информация, как и всякая случайная величина, имеет среднее значение, дисперсию, моменты любого порядка и производящую функцию моментов.
Среднее значение взаимной информации получается в результате усреднения частных значений по всему произведению ансамблей. Так для ансамблей А и В
(23.78)
Выражение (23.78) можно записать в виде
![]()
Первое слагаемое
![]()
Второе слагаемое
![]()
так как
![]()
Теперь (23.78) можно записать в виде
(23.79)
Выражение (23.79) лишний раз подтверждает, что количество информации служит мерой уменьшения неопределенности.
Какой бы ни был применен подход к изменению количества информации — статистический, алгоритмический или любой другой — количество информации исчисляется как разность, как уменьшение разнообразия, как уменьшение некоторой исходной неопределенности — энтропии.
С точки зрения вещественно-энергетических процессов информация служит мерой уменьшения шумов, хаоса, энтропии. П. Бриллюэн рассматривает информацию как меру упорядоченности и называет ее нэгэнтропией, подчеркивая этим связь информации с уменьшением исходной неопределенности.
С точки зрения теории познания информацию можно трактовать как уменьшение незнания, как увеличение знаний. В этом смысле между информацией и знанием — прямая связь.
Определяя информационные характеристики вероятностных пространств, мы имели в виду дискретные пространства. Однако существует обширный класс задач, которые не могут быть решены при помощи безоговорочного использования выражений, полученных для дискретных пространств. К таким задачам относятся определение информационных характеристик физических каналов связи, передающих радиосигналы, задачи, в которых событие на входе и выходе исследуемого объекта есть временная функция в некотором непрерывном интервале и т. д.
Если квантование непрерывных сигналов происходит с частотой более высокой либо равной минимуму, определенному теоремой Ко-тельникова, то при передаче таких сигналов информационных потерь не будет (влияние помех в данном случае не рассматриваем). Если взаимную информацию между точками непрерывного пространства рассматривать как предел, к которому стремится взаимная информация между конечными областями, стягивающимися к этим точкам, то для вычисления взаимной информации можно использовать выражения для дискретных пространств, заменив в них вероятности на соответствующие плотности распределения вероятностей.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 |


