Кодирование текстовой и числовой информации
Независимо от формы представления и способа передачи информация всегда передается с помощью какого-либо языка. Существует язык математики, физики, химии, язык глухонемых, в мире насчитывается около 10 000 разных языков и диалектов.
Основу любого языка составляет алфавит - конечный набор знаков любой природы, из которых формируется сообщение.
Мощность алфавита — количество символов алфавита.
![]()
Языки
формальные естественные
С появлением языка, а затем и знаковых систем расширились возможности общения между людьми. Каждый народ имеет свой язык, состоящий из набора символов, кроме того существуют различные формальные языки. Представление информации с помощью какого-либо языка часто называют кодированием.
Код – набор символов для представления информации.
Кодирование – процесс представления информации в виде кода.
Водитель передает сигнал с помощью гудка, кодом является наличие или отсутствие гудка. Светофор передает сигнал с помощью цвета, код определяю цвета – красный, желтый, зеленый. В основу естественного языка, на котором общаются люди, тоже положен код, только в этом случае он называется алфавитным. При разговоре этот код передается звуками, при письме – буквами.
По мере развития техники появлялись различные способы кодирования информации. Во второй половине XIX века американский изобретатель Самюэль Морзе изобрел удивительный код, который служит человечеству до сих пор. Кодом служат три сигнала: длинный (тире), короткий (точка) и отсутствие сигнала (пауза) для разделения букв.
Люди всегда искали способы быстрой передачи информации – для этого посылали гонцов, использовали почтовых голубей, у народов существовали разные способы оповещения о надвигающейся опасности: барабанный бой, дым костров, флаги и т. д. Однако использование всего этого требовало предварительной договоренности о понимании принимаемого сообщения.
Знаменитый ученый еще в XVII веке предложил уникальную и простую систему представления чисел, с помощью 0 и 1. Он занялся исследованием математических законов применительно к двоичной системе счисления. Лейбницу первому пришла мысль использовать двоичную систему в вычислительном устройстве.
1816 году английский математик Джордж Буль подхватил идею Лейбница и создал универсальный логический язык, с помощью которого предложил кодировать высказывания, а затем оперировать с ними как с числами.
В 1867 году американский ученый Чарльз Сандерс Пирс применил законы математической логики для описания электрических переключательных схем.

Достижения всех ученых и изобретателей, вносивших свой вклад в развитие двоичной логики и информатики на протяжении многих лет, нашли воплощение только в середине XX века, когда была создана первая цифровая вычислительная машина.
В основе современного компьютера лежат законы математики и логики двоичной системы счисления.
С помощью двух цифр 0 и 1 можно закодировать любое сообщение: есть сигнал – 1, нет сигнала – 0. Двоичный алфавит содержит 2 символа, его мощность равна двум.
Символы двоичного кода принято называть двоичными цифрами или битами. Бит является минимальной единицей измерения объема информации.
Бит – наименьшая единица измерения объема информации.
Более крупной единицей измерения объема является 1 байт, состоящий из 8 бит. Также принято использовать следующие единицы измерения объема информации:
1 Кбайт (один килобайт) = 210 байт = 1024 байта;
1 Мбайт (один мегабайт) = 210 Кбайт = 1024 Кбайта;
1 Гбайт (один гигабайт) = 210 Мбайт = 1024 Мбайта. В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как:
1 Терабайт (Тб) = 1024 Гбайта = 240 байта,
1 Петабайт (Пб) = 1024 Тбайта = 250 байта.
Для преобразования информации в двоичные коды и обратно в компьютере должно быть организовано 2 процесса:
· кодирование – преобразование информации в машинную форму, т. е. в двоичный код.
· декодирование – преобразование двоичного кода в форму, понятную человеку.
Чтобы определить объем информации в сообщении при алфавитном подходе, нужно последовательно решить задачи:
1. Определить количество информации (i) в одном символе по формуле 2i = N, где N — мощность алфавита
2. Определить количество символов в сообщении (m)
3. Вычислить объем информации по формуле: V = i * m.
Например, если текстовое сообщение, закодированное по двоичной системе, содержит 100 символов, то его информационный объем составляет 100 бит.
Перевод из десятичной системы счисления в двоичную:
![]() |
Допустим, дано двоичное число 110001. Для перевода в десятичное просто запишите его справа налево как сумму по разрядам следующим образом:

Решение задач, закрепление пройденного материала
1. Перевести число 86 из десятичной системы счисления в двоичную.
2. Перевести число 01001110 из двоичной системы счисления в десятичную.
3. Каков информационный объем текстового сообщения, закодированного по двоичной системе и содержащего 376 символов?
4. На странице содержится 30 строк по 60 символов в каждой. Информация представлена в двоичном коде. Определить информационный объем страницы в битах и байтах.



