Регистрация данных путем изменения химического состава поверхности используется в фотографии. На биохимическом уровне происходит накопление данных в природе.

Любой носитель интересует нас, т. к. связан с параметром разрешающей способности (количеством данных, записанных в принятой для носителя единице измерения) и динамическим диапазоном (логарифмическим отношением интенсивности амплитуд максимального и минимального регистрируемого сигналов).

От этих свойств носителя нередко зависят такие свойства информации, как полнота, доступность, достоверность.

Например, в базе данных на компакт-диске содержится больше информации, чем на гибком магнитном диске, поскольку плотность записи намного выше. Аналогичное сравнение можно привести, если рассматривать объем информации, который можно записать на DVD-диск и на CD-диск.

А для обычного потребителя доступность книги, может быть гораздо выше, если под рукой не находится необходимого оборудования. Наконец, просмотр слайда, визуальный эффект от него много выше, чем просмотр иллюстрации в книге.

Задача преобразования данных с целью смены носителя является одной из важнейших задач информатики. В структуре стоимости вычислительных машин устройства ввода и вывода данных, работающие
с носителями информации, составляют до половины стоимости аппаратных средств.

В ходе информационного процесса данные преобразуются из одного вида в другой с помощью методов. Обработка данных довольно сложный процесс, включающий в себя множество операций. Усложнение связей
в человеческом обществе и общие трудозатраты на обработку данных неуклонно возрастают: это связано с усложнением условий управления между производством и обществом, а также с увеличением общего объема данных, быстрыми темпами появления новых носителей данных, средств их хранения и доставки.

НЕ нашли? Не то? Что вы ищете?

В структуре возможных операций с данными можно выделить следующие основные:

сбор данных: накопление информации с целью обеспечения достаточной полноты для принятия решений;

формализация данных: приведение данных, поступающих из разных источников к одинаковой форме, чтобы сделать их сопоставимыми между собой повысить уровень их доступности;

фильтрация данных: отсеивание «лишних» данных, в которых нет необходимости для принятия решений, при этом должен уменьшаться уровень «шума», а достоверность и адекватность должны возрастать;

сортировка данных: упорядочение данных по заданному признаку
с целью удобства их использования; сортировка повышает доступность информации;

архивация данных: организация хранения данных в удобной
и легкодоступной форме; служит для снижения экономических затрат по хранению данных и повышает общую надежность информационного процесса в целом;

защита данных: комплекс мер, направленных на предотвращение утраты, воспроизведения и модификации данных;

транспортировка данных: прием и передача данных между удаленными участниками информационного процесса; при этом источник данных
в информатике принято называть сервером, а потребителя – клиентом.

преобразование данных: перевод данных из одной формы в другую или из одной структуры в другую. Преобразование данных часто связано
с изменением типа носителя: например, книги можно хранить в обычной бумажной форме, а можно использовать электронную форму, а можно
и микрофотопленку.

Необходимость в многократном преобразовании данных возникает также при транспортировке, если она осуществляется средствами
не предназначенными для этого вида данных. В качестве примера можно рассмотреть случай транспортировки цифровых потоков данных по каналам телефонных сетей (которые ориентированы только на передачу аналоговых сигналов в узком диапазоне частот). В этом случае необходимо преобразование цифровых данных в некое подобие звуковых сигналов, чем и занимаются, предназначенные для этого специальные устройства – телефонные модемы.

Приведенный здесь список операций с данными далеко не полон.
В мире миллионы людей занимаются созданием, обработкой, преобразованием и транспортировкой данных и на каждом рабочем месте выполняют свои специфические операции. Полный список составить невозможно, и даже не нужно. Важно сделать вывод, что работа
с информацией имеет огромную трудоемкость и ее надо автоматизировать.

1.4. Исторические сведения о теории кодирования. Криптография (квадрат Полибия, шифр Цезаря). Современные примеры кодирования в отдельных областях науки
и техники. Двоичное кодирование.

Преобразуя информацию, человеческий мозг и технические устройства ее кодируют. Теория кодирования и древнейшее искусство тайнописи – искусство криптографии близки друг другу.

Если обратиться к истории, то криптография возникла вместе
с письменностью. В исторических документах древних цивилизаций Индии, Египта, Месопотамии находятся примеры зашифрованных сообщений (второе тысячелетие до н. э.).

Например, в древнеиндийских рукописях содержатся 64 способа преобразования текста. Среди них написание текста не по порядку, а в разброс по некоторому правилу. Многие из приводимых способов можно рассматривать как криптографию. Кроме того, упоминается, что тайнопись является одним из 64 искусств, которое следует знать
и мужчинам и женщинам.

Особое развитие шифры получили в Древней Греции. Полководец Лисандр (из Спарты, V век до н. э.), придумал прибор, используемый для осуществления перестановочного шифрования, состоящий из цилиндра
и узкой полоски
пергамента, обматывавшейся вокруг него по спирали,
на которой писалось сообщение под названием скитала («скитала» в пер.
с греч.
«жезл») (см. рис. 2).
Античные греки и спартанцы в частности, использовали этот шифр для связи во время военных кампаний.

Рис. 2. Скитала.

Для расшифровки адресат использовал палочку такого же диаметра, на которую он наматывал пергамент, чтобы прочитать сообщение. Преимущество шифра скитала состоит в простоте и отсутствии ошибок – очень важное качество на поле боя. Однако такой шифр может быть легко взломан. Например, метод взлома скиталы был предложен ещё Аристотелем. Метод состоит в том, что не зная точного диаметра палочки, можно использовать конус, имеющий переменный диаметр и перемещать пергамент с сообщением по его длине до тех пор, пока текст не начнёт читаться – таким образом дешифруется диаметр скиталы [5].

Полководец Эней (380 лет до н. э.) изобрел способ передачи информации с помощью малозаметных пометок в тексте книги или документа, например, игольных дырок, проставленных рядом с буквами, которые в сумме образуют исходный текст секретного сообщения.
При этом сообщение будет выглядеть как что-либо иное: изображение, статья, список покупок и т. п. и не будет привлекать к себе внимание,
т. к. скрывается сам факт передачи сообщения [5].

Интересно отметить, что много позже, аналогичный шифр использовали германские шпионы в Первой мировой войне
( г. г.). Особую популярность книжные шифры приобрели у российских революционеров в начале 20-го века. Большим недостатком при этом было что в качестве текстов-ключей очень часто брались либо стихотворения известных революционеров либо одни и те же книги, что помогало полиции при дешифровке сообщений [5].

Подпись: Греческий историк, полководец и государственный деятель Полибий (III век до н. э.), живший спустя двести лет после Энея описал шифр, известный ныне как «шахматная доска» или «квадрат Полибия», где буквы алфавита обозначались парой цифр – координатами их в квадратной таблице [5]. В случае греческого алфавита буквы записываются в квадрат 5×5, при этом левая верхняя ячейка остается пустой (см. рис. 3), после чего с помощью оптического телеграфа передавались номер строки и столбца, соответствующие символу исходного текста (на каждую букву приходилось два сигнала: число факелов обозначало разряд буквы по горизонтали и вертикали). Например, для передачи буквы Z показывали сначала 2 факела, потом 1.

Идею квадрата Полибия проиллюстрируем с русскими буквами. Число букв отличается от числа букв в греческом алфавите, поэтому размер квадрата будет иной, не квадрат 5×5, а прямоугольник 8×4:

1

2

3

4

5

6

7

8

1

А

Б

В

Г

Д

Е

Ж

З

2

И

Й

К

Л

М

Н

О

П

3

Р

С

Т

У

Ф

Х

Ц

Ч

4

Ш

Щ

Ъ

Ы

Ь

Э

Ю

Я

Зашифруем слово: криптография:

2314

Из примера видно, что первым указывается номер строки, а вторым – номер столбца.

Некоторые исследователи полагают, что это можно рассматривать как первую систему, уменьшавшую (сжимавшую) исходный алфавит, и, в некотором смысле, как прообраз современной системы двоичной передачи данных [5].

Примером более простого шифра, относящегося к группе шифров простой подстановки является шифр Цезаря. По свидетельству древнеримского историка (102 или 100-44 г. г. до н. э.) использовал его для тайной переписки. В шифре Цезаря каждая буква исходного сообщения сдвигается в алфавите на фиксированное число позиций вперед, при необходимости переходя циклически на начало алфавита (см. рис. 4). Сам Цезарь использовал сдвиг на 3 позиции. В этом случае сообщение:

«возвращайтесь в Рим»

Подпись:шифруется так:

ескеугъгмхифя еулп

здесь буква в шифруется буквой е, отстоящей от буквы в на 3 позиции, буква о – буквой с и т. д. (считается, что буквы ё в алфавите нет).

Последняя буква я шифровалась бы при этом методе как в.
Для расшифровки надо сделать сдвиг на 3 позиции назад.

Шифр Цезаря определяется величиной сдвига.

Поскольку число различных сдвигов на 1 меньше, чем число букв алфавита, разгадывание шифра Цезаря не представляет большого труда. Достаточно перебрать всевозможные величины сдвига от 1 до 31 в случае русского алфавита. Сообщение будет расшифровано, когда получится осмысленный текст.

В заключение исторического обзора, заметим, что история криптографии насчитывает около 4 тысяч лет. Более подробные сведения по историческому развитию теории кодирования см. Интернет: материалы на сайте: Википедия: Свободная энциклопедия [5] и др.

Вернемся к современной, ориентированной на технику системе кодирования, т. е. выражение одних данных через данные другого типа, необходимой для автоматизации работы с данными.

Проблема универсального кодирования достаточно успешно реализуется в отдельных областях науки, техники и культуры.
В качестве примеров можно привести записи математических выражений, телеграфную азбуку, морскую флажковую азбуку, систему Брайля
для слепых и т. д.

Своя система существует и в вычислительной технике – она называется двоичным кодированием и основана всего на представлении двух знаков: 0 и 1.

Первой ориентированной на технику системой кодирования оказалась азбука Морзе, где использовалось двоичное кодирование: точка, тире (короткие и длинные импульсы).

В современной технике информация кодируется с помощью сигналов двух видов: высокое и низкое напряжение (двоичное кодирование). Принято обозначать одно физическое состояние ячейки цифрой 0 (низкое напряжение), а другое цифрой 1 (высокое напряжение). Эти цифры 0 и 1 называются битами (от англ. binary digit – двоичная цифра). Биты – это минимальные информационные элементы.

Одним битом могут быть выражены два понятия: 0 и 1 (да или нет, белое или черное, истина или ложь).

Если количество битов увеличить до двух, то уже можно выразить четыре понятия:

00

Тремя битами можно закодировать восемь понятий:

Увеличивая на единицу количество разрядов в системе двоичного кодирования, мы увеличиваем в 2 раза количество значений, которое может быть выражено в данной системе, т. е. общая формула имеет вид:

N=2m,

где N – количество независимых кодируемых значений,

m – разрядность двоичного кодирования, принятая в данной системе.

Следует различать понятия бита в теории информации
и в вычислительной технике.

Битом в теории информации называетсяколичество информации, необходимое для различения двух равновероятных событий.
В вычислительной технике битом называют наименьшую «порцию» памяти, необходимую для хранения одного из знаков «0» или «1», используемых для внутримашинного представления данных и команд.

При двоичном кодировании текстовой информации каждому символу сопоставляется его код – последовательность из фиксированного числа нулей и единиц.

Каждому символу соответствует последовательность из 8 нулей
и единиц, называемая байтом (от англ.
byte).

1 байт = 8 бит

Всего существует разных последовательностей,
где – число размещений с повторениями из 2 элементов (0 и 1)
по 8 элементов. Вычисляется по формуле: (формула комбинаторики, которая вычисляет число размещений с повторениями
из
n элементов по к элементов данного множества M). Это всякая конечная последовательность, состоящая из k членов данного множества M,
при этом элементы в последовательности могут повторяться. Два размещения считаются различными, если хотя бы на одном месте они имеют различные элементы множества
M. Размещения учитывают порядок следования элементов [5]. В результате имеем размещения с повторениями из 8 нулей и единиц от ()2 до ()2 и это позволяет закодировать любой из 256 различных символов (например, большие
и малые буквы русского и английского алфавитов, цифры, знаки препинания и т. д.).

В настоящее время используется две международные системы кодирования символьной информации (алфавит английский):

1) EBCDIC (расширенный двоично-десятичный код);

2) ASCII (американский стандартный код обмена информацией).

Для латинского и русского алфавитов используется отечественный аналог данных кодов:

1) ДКОИ-8 (двоичный код обмена информацией);

2) КОИ-8 (код обмена информацией).

Буква лат. ДКОИ-8 КОИ-8

А 11000

Когда коды различных букв различны:

Пример 2. закодировать фразу «МИРУ МИР»

Буква Код Буква Код

М И

Р У

Пробел (пустой промежуток)

Получим последовательность из 64 нулей и единиц:

,

т. е. чтобы закодировать эту фразу понадобятся 64 бита или 8 байт памяти.

Более крупные единицы информации:

1 Кбайт (1 Килобайт) = 210 байт = 1024 байт

1 Мбайт (1 Мегабайт) = 220 байт = 10242 байт

1 Гбайт (1 Гигабайт) = 230 байт = 10243 байт

1 Тбайт (1 Терабайт) = 240 байт = 10244 байт, далее

1Пбайт (1 Петабайт) = 250 байт,

1ЭБайт (1 Эксабайт) = 260 байт и т. д.

В КОИ-8 каждая буква, знак препинания, пробел – 1 байт. В байтах измеряется объем данных при хранении и передаче по каналам связи. Например, текст «Добрый день!» занимает объем равный 12 байтам
(12 символов текста, включая пробел). На странице учебника умещается
48 строк, в каждой строке примерно 60 знаков (60 байт). Таким образом, полностью заполненная страница учебника имеет информационный объем 48·60 = 2880 байт ≈ 2,9 Кбайт. А если в книге 250 страниц, то примерно 250·2,9 = 725 Кбайт ≈ 0,7 Мбайт.

Большая Советская энциклопедия содержит 120 Мбайт информации, а один цветной кадр телевизора содержит около 1 Мбайт информации, а 1,5 часовой цветной фильм (при частоте 25 кадров в секунду) – 135 Гбайт.

1.5. Понятие о системах счисления. Системы счисления, применяемые в цифровых ЭВМ. Двоичная, восьмеричная
и шестнадцатеричная системы счисления

Существуют числа и объекты. Объекты мы наблюдаем при помощи инструментов. Одним из таких инструментов является понятие системы счисления.

Под системой счисления понимается способ записи чисел с помощью определенного набора знаков (цифр). Системы счисления подразделяются на: позиционные и непозиционные.

Например, Арабская система счисления является позиционной, а Римская – непозиционной.

В 1202 г. Леона́рдо Пиза́нский (лат. Leonardo Pisano, около 1170 г., Пиза – около 1250 г., там же) – первый крупный математик средневековой Европы, наиболее известный под прозвищем Фибона́ччи (Fibonacci); описал арабскую систему счисления в свой книге
под названием: «
Liber Abacci». Фибоначчи был сыном купца, и его отец привез из арабских стран новый способ счета в Европу.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11