Кодирование текстовой и числовой информации

Независимо от формы представления и способа передачи информация всегда передается с помощью какого-либо языка. Существует язык математики, физики, химии, язык глухонемых, в мире насчитывается около 10 000 разных языков и диалектов.

Основу любого языка составляет алфавит - конечный набор знаков любой природы, из которых формируется сообщение.

Мощность алфавита — количество символов алфавита.

Языки

формальные естественные

С появлением языка, а затем и знаковых систем расширились возможности общения между людьми. Каждый народ имеет свой язык, состоящий из набора символов, кроме того существуют различные формальные языки. Представление информации с помощью какого-либо языка часто называют кодированием.

Код – набор символов для представления информации.

Кодирование – процесс представления информации в виде кода.

Водитель передает сигнал с помощью гудка, кодом является наличие или отсутствие гудка. Светофор передает сигнал с помощью цвета, код определяю цвета – красный, желтый, зеленый. В основу естественного языка, на котором общаются люди, тоже положен код, только в этом случае он называется алфавитным. При разговоре этот код передается звуками, при письме – буквами.

По мере развития техники появлялись различные способы кодирования информации. Во второй половине XIX века американский изобретатель Самюэль Морзе изобрел удивительный код, который служит человечеству до сих пор. Кодом служат три сигнала: длинный (тире), короткий (точка) и отсутствие сигнала (пауза) для разделения букв.

НЕ нашли? Не то? Что вы ищете?

Люди всегда искали способы быстрой передачи информации – для этого посылали гонцов, использовали почтовых голубей, у народов существовали разные способы оповещения о надвигающейся опасности: барабанный бой, дым костров, флаги и т. д. Однако использование всего этого требовало предварительной договоренности о понимании принимаемого сообщения.

Знаменитый ученый еще в XVII веке предложил уникальную и простую систему представления чисел, с помощью 0 и 1. Он занялся исследованием математических законов применительно к двоичной системе счисления. Лейбницу первому пришла мысль использовать двоичную систему в вычислительном устройстве.

1816 году английский математик Джордж Буль подхватил идею Лейбница и создал универсальный логический язык, с помощью которого предложил кодировать высказывания, а затем оперировать с ними как с числами.

В 1867 году американский ученый Чарльз Сандерс Пирс применил законы математической логики для описания электрических переключательных схем.

Достижения всех ученых и изобретателей, вносивших свой вклад в развитие двоичной логики и информатики на протяжении многих лет, нашли воплощение только в середине XX века, когда была создана первая цифровая вычислительная машина.

В основе современного компьютера лежат законы математики и логики двоичной системы счисления.

С помощью двух цифр 0 и 1 можно закодировать любое сообщение: есть сигнал – 1, нет сигнала – 0. Двоичный алфавит содержит 2 символа, его мощность равна двум.

Символы двоичного кода принято называть двоичными цифрами или битами. Бит является минимальной единицей измерения объема информации.

Бит – наименьшая единица измерения объема информации.

Более крупной единицей измерения объема является 1 байт, состоящий из 8 бит. Также принято использовать следующие единицы измерения объема информации:

1 Кбайт (один килобайт) = 210 байт = 1024 байта;
1 Мбайт (один мегабайт) = 210 Кбайт = 1024 Кбайта;
1 Гбайт (один гигабайт) = 210 Мбайт = 1024 Мбайта. В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как:
1 Терабайт (Тб) = 1024 Гбайта = 240 байта,
1 Петабайт (Пб) = 1024 Тбайта = 250 байта.

Для преобразования информации в двоичные коды и обратно в компьютере должно быть организовано 2 процесса:

·  кодирование – преобразование информации в машинную форму, т. е. в двоичный код.

·  декодирование – преобразование двоичного кода в форму, понятную человеку.

Чтобы определить объем информации в сообщении при алфавитном подходе, нужно последовательно решить задачи:

1.  Определить количество информации (i) в одном символе по формуле 2i = N, где N — мощность алфавита

2.  Определить количество символов в сообщении (m)

3.  Вычислить объем информации по формуле: V = i * m.

Например, если текстовое сообщение, закодированное по двоичной системе, содержит 100 символов, то его информационный объем составляет 100 бит.

Перевод из десятичной системы счисления в двоичную:

Перевод числа из десятичной системы счисления в двоичную

Допустим, дано двоичное число 110001. Для перевода в десятичное просто запишите его справа налево как сумму по разрядам следующим образом:

1\times

Решение задач, закрепление пройденного материала

1.  Перевести число 86 из десятичной системы счисления в двоичную.

2.  Перевести число 01001110 из двоичной системы счисления в десятичную.

3.  Каков информационный объем текстового сообщения, закодированного по двоичной системе и содержащего 376 символов?

4.  На странице содержится 30 строк по 60 символов в каждой. Информация представлена в двоичном коде. Определить информационный объем страницы в битах и байтах.