Решение задач на тему «Кодирование текстовой информации»
Типы задач:
1. Объем памяти, занимаемый текстом.
2. Кодирование (декодирование) текстовой информации.
3. Внутреннее представление текста в компьютере.
1. Объем памяти, занимаемый текстом.
Методические рекомендации:
В задачах такого типа используются понятия:
· алфавит,
· мощность алфавита
· символ,
· единицы измерения информации (бит, байт и др.)
Для представления текстовой (символьной) информации в компьютере используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации (28 =256). 8 бит =1 байту, следовательно, двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.
Уровень «3»
1. Сколько бит памяти займет слово «Микропроцессор»?([1], c.131, пример 1)
Решение:
Слово состоит из 14 букв. Каждая буква – символ компьютерного алфавита, занимает 1 байт памяти. Слово занимает 14 байт =14*8=112 бит памяти.
Ответ: 112 бит
2. Текст занимает 0, 25 Кбайт памяти компьютера. Сколько символов содержит этот текст? ([1], c.133, №31)
Решение:
Переведем Кб в байты: 0, 25 Кб * 1024 =256 байт. Так как текст занимает объем 256 байт, а каждый символ – 1 байт, то в тексте 256 символов.
Ответ: 256 символов
3. Текст занимает полных 5 страниц. На каждой странице размещается 30 строк по 70 символов в строке. Какой объем оперативной памяти (в байтах) займет этот текст? ([1], c.133, №32)
Решение:
30*70*5 = 10500 символов в тексте на 5 страницах. Текст займет 10500 байт оперативной памяти.
Ответ: 10500 байт
4. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия:
Певец-Давид был ростом мал, Но повалил же Голиафа! (ЕГЭ_2005. демо, уровень А)
1) | 400 бит | 2) | 50 бит | 3) | 400 байт | 4) | 5 байт |
Решение:
В тексте 50 символов, включая пробелы и знаки препинания. При кодировании каждого символа одним байтом на символ будет приходиться по 8 бит, Следовательно, переведем в биты 50*8= 400 бит.
Ответ: 400 бит
5. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения в кодировке КОИ-8: Сегодня метеорологи предсказывали дождь. (ЕГЭ_2005, уровень А)
Решение:
В таблице КОИ-8 каждый символ закодирован с помощью 8 бит. См. решение задачи №4.
Ответ: 320 бит
6. Считая, что каждый символ кодируется 16 битами, оцените информационный объем следующего предложения в кодировке Unicode:
Каждый символ кодируется 8 битами.
(ЕГЭ_2005, уровень А)
Решение:
34 символа в предложении. Переведем в биты: 34*16=544 бита.
Ответ: 544 бит
7. Каждый символ закодирован двухбайтным словом. Оцените информационный объем следующего предложения в этой кодировке:
В одном килограмме 100 грамм.
(ЕГЭ_2005, уровень А)
Решение:
19 символов в предложении. 19*2 =38 байт
Ответ: 38 байт
Уровень «4»
8. Текст занимает полных 10 секторов на односторонней дискете объемом 180 Кбайт. Дискета разбита на 40 дорожек по 9 секторов. Сколько символов содержит текст? ([1], c.133, №34)
Решение:
40*9 = 360 - секторов на дискете. 180 Кбайт : 360 * 10 =5 Кбайт – поместится на одном секторе. 5*1024= 5120 символов содержит текст.
Ответ: 5120 символов
9. Сообщение передано в семибитном коде. Каков его информационный объем в байтах, если известно, что передано 2000 символов.
Решение:
Если код символа содержит 7 бит, а всего 2000 символов, узнаем сколько бит займет все сообщение. 2000 х 7=14000 бит.
Переведем результат в байты. 14000 : 8 =1750 байт
Ответ: 1750 байт.
Уровень «5»
10. Сколько секунд потребуется модему, передающему сообщение со скоростью 28800 бит/с, чтобы передать 100 страниц текста в 30 строк по 60 символов каждая, при условии, что каждый символ кодируется одним байтом? (ЕГЭ_2005, уровень В)
Решение:
Найдем объем сообщения. 30*60*8*100 =1440000 бит. Найдем время передачи сообщения модемом. 1440000 : 28800 =50 секундОтвет: 50 секунд
11. Сколько секунд потребуется модему, передающему сообщения со скоростью 14400 бит/с, чтобы передать сообщение длиной 225 Кбайт? (ЕГЭ_2005, уровень В)
Решение:
Переведем 225 Кб в биты.225 Кб *1024*8 = 1843200 бит. Найдем время передачи сообщения модемом. 1843200: 14400 =128 секунд.Ответ: 128 секунд
2. Кодирование (декодирование) текстовой информации.
Методические рекомендации:
В задачах такого типа используются понятия:
Кодирование – отображение дискретного (прерывного, импульсного) сообщения в виде определенных сочетаний символов.
Код (от французского слова code – кодекс, свод законов) – правило по которому выполняется кодирование.
Кодовая таблица (или кодовая страница) – таблица, устанавливающая соответствие между символами алфавита и двоичными числами.
Примеры кодовых таблиц (имеются на CD диске к учебнику Н. Угринович):
· КОИ-7, КОИ-8 – кодирование русских букв и символов (семи-, восьми - битное кодирование)

1) #154 неразрывный пробел.
Рис.1 Кодировка КОИ8-Р
· ASCII –American Standard Code for Information Interchange (американский стандарт кодов для обмена информацией) – это восьмиразрядная кодовая таблица, в ней закодировано 256 символов (127- стандартные коды символов английского языка, спецсимволы, цифры, а коды от 128 до 255 – национальный стандарт, алфавит языка, символы псевдографики, научные символы, коды от 0 до 32 отведены не символам, а функциональным клавишам).

1) #32 - пробел.
Рис. 2 Международная кодировка ASCII
· Unicode – стандарт, согласно которому для представления каждого символа используется 2 байта. (можно кодировать математические символы, русские, английские, греческие, и даже китайские). C его помощью можно закодировать не 256, а 65536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов
· СР1251 - наиболее распространенной в настоящее время является кодировка Microsoft Windows, ("CP" означает "Code Page", "кодовая страница").

1) #160 неразрывный пробел,
2) #173 мягкий перенос.
Рис. 3 Кодировка CP1251
· СР866 - кодировка под MS DOS

1) #255 неразрывный пробел.
Рис. 4 Кодировка СР866
· Мас – кодировка в ПК фирмы Apple, работающих под управлением операционной системы Mac OS.

1) #202 неразрывный пробел.
Рис. 5 Кодировка Mac
· ISO 8859-5 - Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку.

1) Коды 128-159 не используются;
2) #160 неразрывный пробел,
3) #173 мягкий перенос.
Рис. 6 Кодировка ISO 8859-5
Уровень «3»
Используем кодировочные таблицы
12. Как будет выглядеть слово "диск", записанное в кодировке СР1251, в других кодировках. ([2], стр. 68 №2.63)
Решение:
Последовательность десятичных кодов слова "диск" составляем на основе кодировочных таблиц
Кодовая таблица | Коды | Слово |
СР1251 | 234 | диск |
КОI8-Р | 234 | ДХЯЙ |
СР866 | 234 | фшёъ |
Мас | 234 | диск |
ISO | 234 | фшёъ |
Используем ПО (текстовый редактор Hieroglyph, Wise Calculator)
13. Перейдите от двоичного кода к десятичному и декодируйте следующие тексты:
а) ;
б) ;
в)
([2], стр. 68 №2.60)
Решение:
1. Переведите коды из двоичной системы счисления в десятичную.
а) →
б) →
в) →114
2. Запустите текстовый редактор Hieroglyph
3. Включить клавишу Num Lock. Удерживая клавишу Alt, набрать код символа на цифровой клавиатуре. Отпустить клавишу Alt, на экране появится соответствующая буква.
а)→ Up & Down;
б)→ IBM;
в)114 → Enter
Ответ: Up & Down; IBM; Enter
14. Декодируйте следующие тексты, заданные десятичным кодом:
а) ;
б) ;
в)
([2], стр. 68 №2.61)
Решение:
Запустите текстовый редактор Hieroglyph. Включить клавишу Num Lock. Удерживая клавишу Alt, набрать код символа на цифровой клавиатуре. Отпустить клавишу Alt, на экране появится соответствующая буква.
а) → Word;
б) → DOS;
в) → Paintbrush.
Ответ: Word; DOS; Paintbrush.
Уровень «4»
Не используем кодировочные таблицы
15. Буква «I »в таблице кодировки символов имеет десятичный код 105. что зашифровано последовательностью десятичных кодов: ? ([1],пример 2, стр.132)
Решение:
Учитываем принцип последовательности кодирования и порядок букв в латинском алфавите и, можно, не обращаться к таблице кодировки символов.
Десятичный код | 105 | 106 | 107 | 108 | 109 | 110 |
Латинская буква | i | j | k | l | m | n |
Ответ: Закодировано слово «link»
16. Десятичный код (номер) буквы «е» в таблице кодировки символов ASCII равен 101. Какая последовательность десятичных кодов будет соответствовать слову:
1) file; 2) help? ([1], №35, стр.133)
Решение:
Учитываем принцип последовательности кодирования и порядок букв в латинском алфавите:
Десятичный код | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 |
Латинская буква | e | f | g | h | i | j | k | l | m | n | o | p |
Ответ:
1) 102 105 108 101
2) 104 101 108 112
17. Десятичный код (номер) буквы «о» в таблице кодировки символов равен 111. Что зашифровано с помощью последовательности десятичных кодов:
1) 115 112 111 114 116
2) 109 111 117 115 101
([1], №36, стр.133)
Решение:
Речь идет о латинской букве «о», а не о русской, так как код меньше 127. Учитывая принцип последовательности кодирования и порядок букв в латинском алфавите, имеем:
код | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 |
буква | e | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t | u |
Ответ: 1) sport, 2)mouse
18. Для 5 букв латинского алфавита заданы их двоичные коды (для некоторых букв из двух бит, для некоторых из трех). Эти коды представлены в таблице.
A | B | C | D | E |
000 | 01 | 100 | 10 | 011 |
Определить, какой набор букв закодирован двоичной строкой
1) EBCEA 2) BDDEA 3)BDCEA 4) EBAEA?
Решение:
Так как код записывается, начиная с младшего разряда, то рассмотрим двоичную строку справа налево: 0110 100 011 000. Легко увидеть, что последние три буквы будут С, Е, А. Кода 110 нет, значит рассмотрим код из двух бит. 10 – D, 01 – B. Значит, двоичной строкой закодирован набор букв 3) BDCEA. Других вариантов дешифровки заданной двоичной строки не существует.
Ответ: 3) BDCEA
Уровень «5»
Не используем кодировочные таблицы
19. С помощью последовательности десятичных кодов:зашифровано слово «computer». Какая последовательность десятичных кодов будет соответствовать этому же слову, записанному заглавными буквами? ([1],пример 3, стр.132)
Решение:
Учитываем, что разница между десятичным кодом строчной буквы латинского алфавита и десятичным кодом соответствующей заглавной буквы равна 32.
Десятичный код | Латинская буква строчная | Десятичный код | Латинская буква заглавная |
99 | c | 67 | C |
111 | o | 79 | O |
109 | m | 77 | M |
112 | p | 80 | P |
117 | u | 85 | U |
116 | t | 84 | T |
101 | e | 69 | E |
114 | r | 82 | R |
20. Десятичный код (номер) буквы «i» в таблице кодировки символов ASCII равен 105. Какая последовательность десятичных кодов будет соответствовать слову INFORMATION? ([1], №37, стр.134)
Решение:
Учитываем, что разница между десятичным кодом строчной буквы латинского алфавита и десятичным кодом соответствующей заглавной буквы равна 32, а также, что сначала в таблице записываются заглавные, а потом строчные буквы, определим код заглавной буквы «I». 105-32 =73. Учитывая принцип последовательности кодирования и порядок букв в латинском алфавите, имеем:
код | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 |
буква | A | B | C | D | Е | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t |
Ответ: 7365
21. С помощью последовательности десятичных кодов:зашифровано слово BASIC. Какая последовательность десятичных кодов будет соответствовать этому слову, записанному строчными буквами. ([1], №38, стр.134)
Решение:
Учитываем, что разница между десятичным кодом строчной буквы латинского алфавита и десятичным кодом соответствующей заглавной буквы равна 32, и то, что заглавные буквы записываются раньше строчных, имеем, код слова basic: 98 97 115 105 99
Ответ: 98 97 115 105 99
3. Внутреннее представление текста в компьютере.
Методические рекомендации:
Для решения задач учащиеся должны пользоваться кодовыми таблицами (см.[1], приложение 2, стр.295, 296) и Wise Calculator (для перевода в систему счисления кодов символов, с целью экономии времени). Учащиеся должны понимать, что информация, хранящаяся в двоичном коде чаще всего перекодируется в шестнадцатеричную форму. Шестнадцатеричный код каждого символа – двузначное число от 00 до FF (если длина двоичного кода равна 8, разбиваем на тетрады)
Уровень «3-4»
Оценка 3 ставится за кодирование, оценка 4 –за перевод в 16-ричную систему
Используем кодировочные таблицы
22. Закодируйте с помощью кодировочной таблицы ASCII и представьте в шестнадцатеричной системе счисления следующие тексты:
а) Password;
б) Windows;
в) Norton Commander.
([2], стр. 68, №2.58)
Решение:
1. Найдите в кодовой таблице ASCII коды соответствующих символов (в десятичной системе счисления)
а) Password →19 100.
б) Windows → 115.
в) Norton Commander →1 00
2. Переведите коды с помощью калькулятора в шестнадцатеричную систему счисления.
а)19 →6F 72 64
б)→E 64 6F 77 73
в)1 00 → 4E 6FF 6EF 6D 6D 61 6E
Ответ:
а)6F 72 64
б)E 64 6F 77 73
в) 4E 6FF 6EF 6D 6D 61 6E
23. Декодируйте с помощью кодировочной таблицы ASCII следующие тексты, заданные шестнадцатеричным кодом:
а) 54 6F 72 6EF;
б)C 6FF 75;
в) 32 2A 78 B 79 3D 30
([2], стр. 68 №2.59)
Решение:
1. Переведите коды с помощью калькулятора из шестнадцатеричной системы счисления в десятичную.
а) 54 6F 72 6EF →97
б)C 6FF 75 →18 17
в) 32 2A 78 2B 79 3D 30 →1 57 48
2. Найдите в кодовой таблице ASCII символы, соответствующие кодам:
а)97 → Tornado;
б)18 17 → I love you;
в)1→ 2*X+Y=0.
Ответ: а) Tornado; б) I love you; в) 2*X+Y=0.
Уровень «5»
Используем кодировочные таблицы в приложении к учебнику [1], где представлен десятичный и двоичный код символа или кодировочные таблицы на CD к учебнику Н. Угриновича. Перевод чисел в шестнадцатеричную систему производится без калькулятора.
24. Пользуясь таблицей кодировки символов, расшифруйте текст, представленный в виде шестнадцатеричных кодов символов:
1)Е 64 6FD 39 35;
2) 63 6F 6D 65 2D 4F 4E 2D 6C 69 6E 65
([1], №40, стр.134)
Решение:
1) Переведем числа в двоичную систему счисления и найдем символы в таблице:
16СС | 57 | 69 | 6Е | 64 | 6F | 77 | 73 | 2D | 39 | 35 |
2СС |
|
|
|
|
|
|
|
| 0011001 |
|
буква | W | i | n | d | o | w | s | - | 9 | 5 |
25. Представьте в форме шестнадцатеричного кода слово "БИС" во всех пяти кодировках. ([2], стр. 68 №2.62)
Решение:
Последовательности десятичных кодов слова "БИС" в различных кодировках составляем на основе кодировочных таблиц:
КОI8-Р: =
СР1251: = ;
СР866: = ;
Мас: = ;
ISO: =
Переводим с помощью калькулятора последовательности кодов из десятичной системы в шестнадцатеричную:
КОI8-Р: = = E2 E9 F3;
СР1251: = = C1 C8 D1;
СР866: = =;
Мас: = =;
ISO: = = B1 B8 C1.
Литература:
И. Семакин, Е Хеннер, Информатика. Задачник-практикум, т.1, Москва, ЛБЗ, 1999, с.131-134. Практикум по информатике и информационным технологиям. Учебное пособие для общеобразовательных учреждений / , , . – М.: Бином. Лаборатория Знаний, 20с.: ил.

