Решение задач на тему «Кодирование текстовой информации»

Типы задач:

1.  Объем памяти, занимаемый текстом.

2.  Кодирование (декодирование) текстовой информации.

3.  Внутреннее представление текста в компьютере.

1.  Объем памяти, занимаемый текстом.

Методические рекомендации:

В задачах такого типа используются понятия:

·  алфавит,

·  мощность алфавита

·  символ,

·  единицы измерения информации (бит, байт и др.)

Для представления текстовой (символьной) информации в компьютере используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации (28 =256). 8 бит =1 байту, следовательно, двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.

Уровень «3»

1. Сколько бит памяти займет слово «Микропроцессор»?([1], c.131, пример 1)

Решение:

Слово состоит из 14 букв. Каждая буква – символ компьютерного алфавита, занимает 1 байт памяти. Слово занимает 14 байт =14*8=112 бит памяти.

Ответ: 112 бит

2. Текст занимает 0, 25 Кбайт памяти компьютера. Сколько символов содержит этот текст? ([1], c.133, №31)

Решение:

Переведем Кб в байты: 0, 25 Кб * 1024 =256 байт. Так как текст занимает объем 256 байт, а каждый символ – 1 байт, то в тексте 256 символов.

Ответ: 256 символов

3. Текст занимает полных 5 страниц. На каждой странице размещается 30 строк по 70 символов в строке. Какой объем оперативной памяти (в байтах) займет этот текст? ([1], c.133, №32)

Решение:

30*70*5 = 10500 символов в тексте на 5 страницах. Текст займет 10500 байт оперативной памяти.

НЕ нашли? Не то? Что вы ищете?

Ответ: 10500 байт

4. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия:

Певец-Давид был ростом мал, Но повалил же Голиафа! (ЕГЭ_2005. демо, уровень А)

1)

400 бит

2)

50 бит

3)

400 байт

4)

5 байт

Решение:

В тексте 50 символов, включая пробелы и знаки препинания. При кодировании каждого символа одним байтом на символ будет приходиться по 8 бит, Следовательно, переведем в биты 50*8= 400 бит.

Ответ: 400 бит

5. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения в кодировке КОИ-8: Сегодня метеорологи предсказывали дождь. (ЕГЭ_2005, уровень А)

Решение:

В таблице КОИ-8 каждый символ закодирован с помощью 8 бит. См. решение задачи №4.

Ответ: 320 бит

6. Считая, что каждый символ кодируется 16 битами, оцените информационный объем следующего предложения в кодировке Unicode:

Каждый символ кодируется 8 битами.

(ЕГЭ_2005, уровень А)

Решение:

34 символа в предложении. Переведем в биты: 34*16=544 бита.

Ответ: 544 бит

7. Каждый символ закодирован двухбайтным словом. Оцените информационный объем следующего предложения в этой кодировке:

В одном килограмме 100 грамм.

(ЕГЭ_2005, уровень А)

Решение:

19 символов в предложении. 19*2 =38 байт

Ответ: 38 байт

Уровень «4»

8. Текст занимает полных 10 секторов на односторонней дискете объемом 180 Кбайт. Дискета разбита на 40 дорожек по 9 секторов. Сколько символов содержит текст? ([1], c.133, №34)

Решение:

40*9 = 360 - секторов на дискете. 180 Кбайт : 360 * 10 =5 Кбайт – поместится на одном секторе. 5*1024= 5120 символов содержит текст.

Ответ: 5120 символов

9. Сообщение передано в семибитном коде. Каков его информационный объем в байтах, если известно, что передано 2000 символов.

Решение:

Если код символа содержит 7 бит, а всего 2000 символов, узнаем сколько бит займет все сообщение. 2000 х 7=14000 бит.

Переведем результат в байты. 14000 : 8 =1750 байт

Ответ: 1750 байт.

Уровень «5»

10. Сколько секунд потребуется модему, передающему сообщение со скоростью 28800 бит/с, чтобы передать 100 страниц текста в 30 строк по 60 символов каждая, при условии, что каждый символ кодируется одним байтом? (ЕГЭ_2005, уровень В)

Решение:

Найдем объем сообщения. 30*60*8*100 =1440000 бит. Найдем время передачи сообщения модемом. 1440000 : 28800 =50 секунд

Ответ: 50 секунд

11. Сколько секунд потребуется модему, передающему сообщения со скоростью 14400 бит/с, чтобы передать сообщение длиной 225 Кбайт? (ЕГЭ_2005, уровень В)

Решение:

Переведем 225 Кб в биты.225 Кб *1024*8 = 1843200 бит. Найдем время передачи сообщения модемом. 1843200: 14400 =128 секунд.

Ответ: 128 секунд

2.  Кодирование (декодирование) текстовой информации.

Методические рекомендации:

В задачах такого типа используются понятия:

Кодирование – отображение дискретного (прерывного, импульсного) сообщения в виде определенных сочетаний символов.

Код (от французского слова code – кодекс, свод законов) – правило по которому выполняется кодирование.

Кодовая таблица (или кодовая страница) – таблица, устанавливающая соответствие между символами алфавита и двоичными числами.

Примеры кодовых таблиц (имеются на CD диске к учебнику Н. Угринович):

·  КОИ-7, КОИ-8 – кодирование русских букв и символов (семи-, восьми - битное кодирование)


 

1) #154 неразрывный пробел.

Рис.1 Кодировка КОИ8-Р

·  ASCII –American Standard Code for Information Interchange (американский стандарт кодов для обмена информацией) – это восьмиразрядная кодовая таблица, в ней закодировано 256 символов (127- стандартные коды символов английского языка, спецсимволы, цифры, а коды от 128 до 255 – национальный стандарт, алфавит языка, символы псевдографики, научные символы, коды от 0 до 32 отведены не символам, а функциональным клавишам).



1) #32 - пробел.

Рис. 2 Международная кодировка ASCII

·  Unicode – стандарт, согласно которому для представления каждого символа используется 2 байта. (можно кодировать математические символы, русские, английские, греческие, и даже китайские). C его помощью можно закодировать не 256, а 65536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов

·  СР1251 - наиболее распространенной в настоящее время является кодировка Microsoft Windows, ("CP" означает "Code Page", "кодовая страница").

1) #160 неразрывный пробел,

2)  #173 мягкий перенос.

Рис. 3 Кодировка CP1251

·  СР866 - кодировка под MS DOS



1) #255 неразрывный пробел.

Рис. 4 Кодировка СР866

·  Мас – кодировка в ПК фирмы Apple, работающих под управлением операционной системы Mac OS.

1)  #202 неразрывный пробел.

Рис. 5 Кодировка Mac

·  ISO 8859-5 - Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку.



 1) Коды 128-159 не используются;

2)  #160 неразрывный пробел,

3)  #173 мягкий перенос.

Рис. 6 Кодировка ISO 8859-5

Уровень «3»

Используем кодировочные таблицы

12. Как будет выглядеть слово "диск", записанное в кодировке СР1251, в других кодировках. ([2], стр. 68 №2.63)

Решение:

Последовательность десятичных кодов слова "диск" составляем на основе кодировочных таблиц

Кодовая таблица

Коды

Слово

СР1251

 234

диск

КОI8-Р

 234

ДХЯЙ

СР866

 234

фшёъ

Мас

 234

диск

ISO

 234

фшёъ

Используем ПО (текстовый редактор Hieroglyph, Wise Calculator)

13. Перейдите от двоичного кода к десятичному и декодируйте следующие тексты:


а) ;
б) ;
в)

([2], стр. 68 №2.60)

Решение:

1. Переведите коды из двоичной системы счисления в десятичную.
а) →
б) →
в) →114
2. Запустите текстовый редактор Hieroglyph
3. Включить клавишу Num Lock. Удерживая клавишу Alt, набрать код символа на цифровой клавиатуре. Отпустить клавишу Alt, на экране появится соответствующая буква.
а)→ Up & Down;
б)→ IBM;
в)114 → Enter

Ответ: Up & Down; IBM; Enter

14. Декодируйте следующие тексты, заданные десятичным кодом:
а) ;
б) ;
в)

([2], стр. 68 №2.61)

Решение:

Запустите текстовый редактор Hieroglyph. Включить клавишу Num Lock. Удерживая клавишу Alt, набрать код символа на цифровой клавиатуре. Отпустить клавишу Alt, на экране появится соответствующая буква.
а) → Word;
б) → DOS;
в) → Paintbrush.

Ответ: Word; DOS; Paintbrush.

Уровень «4»

Не используем кодировочные таблицы

15. Буква «I »в таблице кодировки символов имеет десятичный код 105. что зашифровано последовательностью десятичных кодов: ? ([1],пример 2, стр.132)

Решение:

Учитываем принцип последовательности кодирования и порядок букв в латинском алфавите и, можно, не обращаться к таблице кодировки символов.

Десятичный код

105

106

107

108

109

110

Латинская буква

i

j

k

l

m

n

Ответ: Закодировано слово «link»

16. Десятичный код (номер) буквы «е» в таблице кодировки символов ASCII равен 101. Какая последовательность десятичных кодов будет соответствовать слову:

1) file; 2) help? ([1], №35, стр.133)

Решение:

Учитываем принцип последовательности кодирования и порядок букв в латинском алфавите:

Десятичный код

101

102

103

104

105

106

107

108

109

110

111

112

Латинская буква

e

f

g

h

i

j

k

l

m

n

o

p

Ответ:

1) 102 105 108 101

2) 104 101 108 112

17. Десятичный код (номер) буквы «о» в таблице кодировки символов равен 111. Что зашифровано с помощью последовательности десятичных кодов:

1) 115 112 111 114 116

2) 109 111 117 115 101

([1], №36, стр.133)

Решение:

Речь идет о латинской букве «о», а не о русской, так как код меньше 127. Учитывая принцип последовательности кодирования и порядок букв в латинском алфавите, имеем:

код

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

буква

e

f

g

h

i

j

k

l

m

n

o

p

q

r

s

t

u

Ответ: 1) sport, 2)mouse

18. Для 5 букв латинского алфавита заданы их двоичные коды (для некоторых букв из двух бит, для некоторых из трех). Эти коды представлены в таблице.

A

B

C

D

E

000

01

100

10

011

Определить, какой набор букв закодирован двоичной строкой

1) EBCEA 2) BDDEA 3)BDCEA 4) EBAEA?

Решение:

Так как код записывается, начиная с младшего разряда, то рассмотрим двоичную строку справа налево: 0110 100 011 000. Легко увидеть, что последние три буквы будут С, Е, А. Кода 110 нет, значит рассмотрим код из двух бит. 10 – D, 01 – B. Значит, двоичной строкой закодирован набор букв 3) BDCEA. Других вариантов дешифровки заданной двоичной строки не существует.

Ответ: 3) BDCEA

Уровень «5»

Не используем кодировочные таблицы

19. С помощью последовательности десятичных кодов:зашифровано слово «computer». Какая последовательность десятичных кодов будет соответствовать этому же слову, записанному заглавными буквами? ([1],пример 3, стр.132)

Решение:

Учитываем, что разница между десятичным кодом строчной буквы латинского алфавита и десятичным кодом соответствующей заглавной буквы равна 32.

Десятичный код

Латинская буква строчная

Десятичный код

Латинская буква заглавная

99

c

67

C

111

o

79

O

109

m

77

M

112

p

80

P

117

u

85

U

116

t

84

T

101

e

69

E

114

r

82

R

20. Десятичный код (номер) буквы «i» в таблице кодировки символов ASCII равен 105. Какая последовательность десятичных кодов будет соответствовать слову INFORMATION? ([1], №37, стр.134)

Решение:

Учитываем, что разница между десятичным кодом строчной буквы латинского алфавита и десятичным кодом соответствующей заглавной буквы равна 32, а также, что сначала в таблице записываются заглавные, а потом строчные буквы, определим код заглавной буквы «I». 105-32 =73. Учитывая принцип последовательности кодирования и порядок букв в латинском алфавите, имеем:

код

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

буква

A

B

C

D

Е

f

g

h

i

j

k

l

m

n

o

p

q

r

s

t

Ответ: 7365

21. С помощью последовательности десятичных кодов:зашифровано слово BASIC. Какая последовательность десятичных кодов будет соответствовать этому слову, записанному строчными буквами. ([1], №38, стр.134)

Решение:

Учитываем, что разница между десятичным кодом строчной буквы латинского алфавита и десятичным кодом соответствующей заглавной буквы равна 32, и то, что заглавные буквы записываются раньше строчных, имеем, код слова basic: 98 97 115 105 99

Ответ: 98 97 115 105 99

3.  Внутреннее представление текста в компьютере.

Методические рекомендации:

Для решения задач учащиеся должны пользоваться кодовыми таблицами (см.[1], приложение 2, стр.295, 296) и Wise Calculator (для перевода в систему счисления кодов символов, с целью экономии времени). Учащиеся должны понимать, что информация, хранящаяся в двоичном коде чаще всего перекодируется в шестнадцатеричную форму. Шестнадцатеричный код каждого символа – двузначное число от 00 до FF (если длина двоичного кода равна 8, разбиваем на тетрады)

Уровень «3-4»

Оценка 3 ставится за кодирование, оценка 4 –за перевод в 16-ричную систему

Используем кодировочные таблицы

22. Закодируйте с помощью кодировочной таблицы ASCII и представьте в шестнадцатеричной системе счисления следующие тексты:
а) Password;
б) Windows;
в) Norton Commander.

([2], стр. 68, №2.58)

Решение:

1. Найдите в кодовой таблице ASCII коды соответствующих символов (в десятичной системе счисления)
а) Password →19  100.
б) Windows → 115.
в) Norton Commander →1 00
2. Переведите коды с помощью калькулятора в шестнадцатеричную систему счисления.
а)19 →6F 72 64
б)→E 64 6F 77 73
в)1 00 → 4E 6FF 6EF 6D 6D 61 6E

Ответ:

а)6F 72 64
б)E 64 6F 77 73
в) 4E 6FF 6EF 6D 6D 61 6E

23. Декодируйте с помощью кодировочной таблицы ASCII следующие тексты, заданные шестнадцатеричным кодом:
а) 54 6F 72 6EF;
б)C 6FF 75;
в) 32 2A 78 B 79 3D 30

([2], стр. 68 №2.59)

Решение:

1. Переведите коды с помощью калькулятора из шестнадцатеричной системы счисления в десятичную.
а) 54 6F 72 6EF →97
б)C 6FF 75 →18 17
в) 32 2A 78 2B 79 3D 30 →1 57 48
2. Найдите в кодовой таблице ASCII символы, соответствующие кодам:
а)97 → Tornado;
б)18 17 → I love you;
в)1→ 2*X+Y=0.

Ответ: а) Tornado; б) I love you; в) 2*X+Y=0.

Уровень «5»

Используем кодировочные таблицы в приложении к учебнику [1], где представлен десятичный и двоичный код символа или кодировочные таблицы на CD к учебнику Н. Угриновича. Перевод чисел в шестнадцатеричную систему производится без калькулятора.

24. Пользуясь таблицей кодировки символов, расшифруйте текст, представленный в виде шестнадцатеричных кодов символов:

1)Е 64 6FD 39 35;

2) 63 6F 6D 65 2D 4F 4E 2D 6C 69 6E 65

([1], №40, стр.134)

Решение:

1)  Переведем числа в двоичную систему счисления и найдем символы в таблице:

16СС

57

69

64

6F

77

73

2D

39

35

2СС

0011001

буква

W

i

n

d

o

w

s

-

9

5

25. Представьте в форме шестнадцатеричного кода слово "БИС" во всех пяти кодировках. ([2], стр. 68 №2.62)

Решение:

Последовательности десятичных кодов слова "БИС" в различных кодировках составляем на основе кодировочных таблиц:
КОI8-Р: =
СР1251: = ;
СР866: = ;
Мас: = ;
ISO: =
Переводим с помощью калькулятора последовательности кодов из десятичной системы в шестнадцатеричную:
КОI8-Р: = = E2 E9 F3;
СР1251: = = C1 C8 D1;
СР866: = =;
Мас: = =;
ISO: = = B1 B8 C1.

Литература:

И. Семакин, Е Хеннер, Информатика. Задачник-практикум, т.1, Москва, ЛБЗ, 1999, с.131-134. Практикум по информатике и информационным технологиям. Учебное пособие для общеобразовательных учреждений / , , . – М.: Бином. Лаборатория Знаний, 20с.: ил.