Теоретические основы информатики (стр. 5 )

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6

Партнерка на США и Канаду по недвижимости, выплаты в крипто

30% recurring commission
Выплаты в USDT
Вывод каждую неделю
Комиссия до 5 лет за каждого referral

Для непрерывных случайных величин, и , заданных плотностями распределения вероятностей , и $p_{XY}(t_1,t_2)$ , аналогичная формула имеет вид

$I(X,Y)=\int\limits_{\quad\bR^2}\!\!\!\!\! \int p_{XY}(t_1,t_2)\log_2{p_{XY}(t_1,t_2)\over p_X(t_1)p_Y(t_2)}dt_1dt_2.$

Очевидно, что

$\begin{align*}P(X=X_i,X=X_j) = \begin{cases} 0,&\text{при $i\ne j$}\\ P(X=X_i),&\text{при $i=j$}\end{cases}\end{align*}$

и, следовательно,

$I(X,X)=\sum_ip_i\log_2{p_i\over p_ip_i}=-\sum_ip_i \log_2p_i.$

Энтропия дискретной случайной величины в теории информации определяется формулой

Свойства меры информации и энтропии:

$I(X,Y)\ge0$ , $I(X,Y)=0 \xLeftrightarrow X$ и независимы;

;

$HX=0 \xLeftrightarrow X$ - константа;

, где $H(X,Y)=-\sum_{i,j}p_{ij}\log_2p_{ij}$ ;

$I(X,Y)\le I(X,X)$ . Если , то - функция от . Если - инъективная функция1) от , то .

Смысл энтропии Шеннона

Вводится понятие энтропии. На нескольких примерах показывается, как вычисляется энтропия дискретной случайной величины. Вводится понятие префиксного кодирования. Задачи на самостоятельную работу улучшают восприятие материала. Также много различных математических исследований

Энтропия. дискретной случайной величины - это минимум среднего количества бит, которое нужно передавать по каналу связи о текущем значении данной д. с.в.

Рассмотрим пример (скачки). В заезде участвуют 4 лошади с равными шансами на победу, т. е. вероятность победы каждой лошади равна 1/4. Введем д. с.в. , равную номеру победившей лошади. Здесь HX=2 . После каждого заезда по каналам связи достаточно будет передавать два бита информации о номере победившей лошади. Кодируем номер лошади следующим образом: 1-00, 2-01, 3-10, 4-11. Если ввести функцию , которая возвращает длину сообщения, кодирующего заданное значение , то м. о. - это средняя длина сообщения, кодирующего . Можно формально определить через две функции , где code(X) каждому значению ставит в соответствие некоторый битовый код, причем, взаимно однозначно, а len возвращает длину в битах для любого конкретного кода. В этом примере ML(X)=HX .

НЕ нашли? Не то? Что вы ищете?

Пусть теперь д. с.в. имеет следующее распределение

$P(X=1)={3\over4},\, P(X=2)={1\over8},\, P(X=3)=P(X=4)={1\over16},$

т. е. лошадь с номером 1 - это фаворит. Тогда

$HX={3\over4}\log_2{4\over3}+{1\over8}\log_28+{1\over8}\log_216= {19\over8}-{3\over4}\log_23\approx1.186 \hbox{ бит/сим}.$

Закодируем номера лошадей: 1-0, 2-10, 3-110, 4-111, - т. е. так, чтобы каждой код не был префиксом другого кода (подобное кодирование называют префиксным). В среднем в 16 заездах 1-я лошадь должна победить в 12 из них, 2-я - в 2-х, 3-я - в 1-м и 4-я - в 1-м. Таким образом, средняя длина сообщения о победителе равна бит/сим или м. о. L(X) . Действительно, сейчас задается следующим распределением вероятностей: P(L(X)=1)=3/4 , , . Следовательно,

$ML(X)={3\over4}+{2\over8}+{3\over8}={11\over8}=1.375 \hbox{ бит/сим}.$

Итак, .

Можно доказать, что более эффективного кодирования для двух рассмотренных случаев не существует.

То, что энтропия Шеннона соответствует интуитивному представлению о мере информации, может быть продемонстрировано в опыте по определению среднего времени психических реакций. Опыт заключается в том, что перед испытуемым человеком зажигается одна из лампочек, которую он должен указать. Проводится большая серия испытаний, в которых каждая лампочка зажигается с определенной вероятностью p_i $(\sum_i^Np_i=1)$ , где - это номер лампочки. Оказывается, среднее время, необходимое для правильного ответа испытуемого, пропорционально величине энтропии $-\sum_{i=1}^N p_i\log_2p_i$ , а не числу лампочек , как можно было бы подумать. В этом опыте предполагается, что чем больше информации будет получено человеком, тем дольше будет время ее обработки и, соответственно, реакции на нее.

Семантическая информация

В 50-х годах XX века появились первые попытки определения абсолютного информационного содержания предложений естественного языка. Стоит отметить, что сам Шеннон однажды заметил, что смысл сообщений не имеет никакого отношения к его теории информации, целиком построенной на положениях теории вероятностей. Но его способ точного измерения информации наводил на мысль о возможности существования способов точного измерения информации более общего вида, например, информации из предложений естественного языка. Примером одной из таких мер является функция $inf(s)=-\log_2p(s)$ , где - это предложение, смысловое содержание которого измеряется, p(s) - вероятность истинности

Вот некоторые свойства этой функции-меры:

если $s_1 \Rightarrow s_2$ (из s_1 следует s_2 ) - истинно, то $inf(s_1) \ge inf(s_2)$ ;

$inf(s) \ge 0$ ;

если - истинно, то ;

$inf(s_1s_2)=inf(s_1)+inf(s_2) \xLeftrightarrow p(s_1\cdot s_2)=p(s_1)p(s_2)$ , т. е. независимости s_1 и s_2 .

Значение этой функция-меры больше для предложений, исключающих большее количество возможностей. Пример: из s_1 - " a>3 " и - "" следует, что $s_2 \Rightarrow s_1$ или $inf(s_2)\ge inf(s_1)$ ; ясно, что исключает больше возможностей, чем s_1 .

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6

НЕ нашли? Не то? Что вы ищете?

Правила пользования Сайтом
Правила публикации материалов
Политика конфиденциальности и обработки персональных данных

При перепечатке материалов ссылка на pandia.org обязательна.
Минимальная ширина экрана монитора для комфортного просмотра сайта: 1200 пикселей.
Сайт не содержит автоматически сгенерированных данных и не принимает подобные материалы.

Мы признательны за найденные неточности в материалах, опечатки, некорректное отображение элементов на странице - отправляйте на [email protected]

Теоретические основы информатики (стр. 5 )

Партнерка на США и Канаду по недвижимости, выплаты в крипто

Смысл энтропии Шеннона

Семантическая информация

Домашний очаг

Справочная информация

Техника

Общество

Образование и наука

Мир

Бизнес и финансы