Актуализация и сохранение БД включают следующие основные функ­ции (рис. 22.41, в): 1 — запрос к СУБД на выполнение функций актуали­зации и сохранения БД; 2 ввод данных по запросу; 3 — ведение систем­ного журнала, обращение к системному журналу, распечатка журнала; 4 — ведение, использование и распечатка статистических данных о работе АБД; 5 — вывод БД (дампирование, распечатка); 6 — копирование и вос­становление БД; 7 — запись (корректировка) данных.

22.10. Целостность и сохранность баз данных

Эффективность АСНИ и, в конечном итоге, качество выполненных исследований, в значительной степени зависят от достоверности и целостности БД. Достоверность предполагает соответствие хранимых данных реальному состоянию исследуемой проблемы (а точнее, состоянию модели исследуемой проблемы, сведения о которой хранятся и перерабатываются в систе­ме). Под целостностью БД понимают отсутствие физических нарушений в хранимой информации.

Снижение достоверности и нарушения целостности могут быть вызваны ошибками в данных и разрушением данных. Основными источниками оши­бок и разрушения данных являются: неточные исходные данные (вводи­мая информация); искажение и потери информации при подготовке и вводе ее персоналом АСНИ; искажение информации при работе оборудования (неустойчивость характеристик, сбои, помехи); неисправность и отказы оборудования; некорректность программных средств; несанкционирован­ный и некомпетентный доступ к данным.

Основными мерами поддержания достоверности и целостности БД являются контроль информации, исправление ошибок и искажений, обес­печение сохранности БД. Эти меры реализуются следующими методами и средствами: визуальными (при подготовке, вводе и выводе информации); техническими (аппаратными); программными и организационными.

НЕ нашли? Не то? Что вы ищете?

Контроль информации. Для обнаружения ошибок существенное зна­чение имеют четыре фактора: грамматический характер ошибок, уро­вень агрегации (иерархии) контролируемых элементов, вид и форма исполь­зуемой для контроля избыточности, момент внесения избыточности в конт­ролируемые элементы.

По грамматическому характеру ошибки подразделяются на синтаксические и семантические.

Синтаксические ошибки влияют на струк­туру и лексику представления данных, например пропуск или добавление символа, внесение постороннего или запрещенного символа в реквизит, сдвиг по строкам или колонкам отформатированного документа (сообщения).

Для обнаружения синтаксических ошибок применяют сравнительно простые методы, например, проверку шаблонов и форматов.

Се­мантические ошибки искажают смысл (содержание) информации, остав­ляя правильными структуру и лексику, например, замена символов дру­гими допустимыми символами. Семантические ошибки разделяют на три вида: орфографические, смысловые и блочные.

Орфографические ошибки искажают значения символов реквизита.

Смысловые ошибки искажают содержимое (смысл) записи, например, перемена местами одноименных рек­визитов различных записей.

Блочные ошибки искажают блок записей (на­пример, отсутствие некоторых записей, их перестановки). Следовательно, можно выделить три уровня агрегации контролируемых элементов: рекви­зит, запись, блок записей (или файл).

Для контроля информации используют следующие виды избыточ­ности:

избыточные разряды (например, контроль по модулю, при кото­ром контрольные разряды определяются путем преобразования значений информационных, контроль по четности);

избыточные реквизиты, допол­няющие запись (они вычисляются как некоторая функция от значений информационных реквизитов, например, контрольное суммирование по за­писи);

избыточные записи, дополняющие блок (например, итоговое сумми­рование);

двукратную избыточность, заключающуюся в повторной фик­сации информации и сравнении ее с первоначальной (например, дубль-копирование, верификация);

естественную избыточность, основанную на свойстве конкретного вида информации иметь определенные формат, раз­мерность, диапазон разрешенных значений, а также определенным обра­зом сочетаться между собой (например, реквизит «месяц» имеет разрешен­ный диапазон 01—12).

Внесение ошибок (искажение информации) возможно на следующих основных этапах переработки данных: заполнения документов (сбора дан­ных); подготовки данных на машинных носителях; ввода данных; обра­ботки данных; записи (считывания) информации на внешние запоминающие устройства; передачи данных. На этапе заполнения возможен визуальный контроль; на этапе подготовки — визуальный, повторная подготовка и сравнение, контрольное суммирование; на этапе ввода данных — визуаль­ный (по отображению вводимой информации), технический (по четности, по модулю), программный (логический по формату, структуре, диапазону и по контрольной сумме); на этапе обработки — технический (предусмотрен­ный в аппаратуре ЭВМ) и программный (логический, двойная обработка и сравнение); на этапе записи (считывания) — в основном аппаратные средства (на четность, циклический, контрольное суммирование); на этапе передачи — аппаратные (с помощью устройств защиты от ошибок, обеспе­чивающих помехозащитное и исправляющее некоторые ошибки кодирова­ние и контроль), а также программные, если передача осуществляется в (из) ЭВМ.

На всех этапах могут применяться организационные методы контроля, заключающиеся в осуществлении, сочетании, сопоставлении ре­зультатов других методов, организации исправления ошибок, а также при­нятия решений о возможности продолжать процесс переработки данных.

Исправление ошибок и искажений. При обнаружении искажения данных в БД возможны два пути корректировки: корректировка отдельных записей (их элементов) и осуществление мер по обеспечению сохранности БД.

Исправление (корректировка) отдельных записей осуществляется, если записи локализованы и если искажена незначительная часть БД. В противном случае пользуются системой обеспечения сохранности БД.

Обеспечение сохранности БД. Основными мерами обеспечения со­хранности являются: копирование и восстановление БД; защита от несанк­ционированного и некомпетентного воздействия; организационно-методи­ческая работа.

Для копирования и восстановления БД применя­ется целый ряд общих методов.

Полное копирование томов предполагает снятие полных копий томов памяти.

Восстанов­ление заключается в перезаписи копии на том (иногда перезаписывается часть тома). Сохраняется, как правило, последняя копия. Основные не­достатки: большие временные затраты и невозможность использования БД во время копирования.

Выборочное копирование (копирование файлов) предполагает снятие копий только модифицированных файлов, которые добавляются к уже имеющимся копиям. Основной недостаток: трудоемкость учета и периоди­ческой чистки файлов.

Системная журнализация предполагает фиксацию (протоколирование) действий по модификации БД в системном журнале (специальный файл) и хранение корректур. Выполняется обычно средствами СУБД и исполь­зуется в сочетании с другими методами копирования-восстановления, об­легчая их реализацию за счет наличия предыстории модификации. Основ­ные недостатки: относительно большое время восстановления, а также трудоемкость реализации системной журнализации (при использовании уже разработанной СУБД с этими функциями данный недостаток не имеет значения).

Регенерация поколений предполагает копирование по схеме «дед — отец — сын», т. е. наличие трех текущих копий. Самая последняя копия на­зывается «сын», предыдущие — соответственно «отец» и «дед». Если происхо­дит очередное копирование, появляется новое поколение «сын», бывшее поко­ление «сын» становится «отцом», бывшее поколение «отец» — «дедом», а копия бывшего поколения «дед» уничтожается. При разрушении оригинала (копии «сын») восстановление осуществляется путем повторения процедур актуализации. Если разрушена копия «отец», то восстановление осуществ­ляется в два этапа: «дед», «отец» — «сын». Для восстановления существен­ное значение имеет системная журнализация.

Предварительное замещение ориентировано на восстановление инфор­мации, разрушенной во время сеанса актуализации БД. Предполагает создание копии модифицируемой части перед выполнением модификации, сама модификация выполняется с копией. Если информация во время мо­дификации будет разрушена, оригинал останется в сохранности.

В реальных системах информационного обеспечения наиболее эффективно использовать комбинации общих методов копирования — восстановления. Наиболее распространены три основных класса комбинированных моделей копирования-восстановления: периоди­ческой разгрузки, дублирования-регенерации поколений, периодической разгрузки-регенерации поколений.

Защита от несанкционированного и неком­петентного воздействия (запроса) основывается на системе замков и ключей, идентифицирующих пользователей. Система реализуется, как правило, в рамках СУБД.

Организационно-методические работы по обес­печению сохранности БД проводит администрация БД. В состав работ вхо­дят: анализ требований пользователей по защите данных; идентификация пользователей (назначение паролей, ключей); определение функций (опе­раций) над данными, допустимых для каждого пользователя, и фиксация этой информации в СУБД; контроль и анализ нарушений санкционирован­ного доступа; анализ системного журнала (выявление особых ситуаций, необходимости корректировки, копирования, восстановления); проверка логической непротиворечивости информации БД (запуск специальных те­стирующих программ по графику или по необходимости, анализ результатов тестирования); контроль модификаций информации, проводимых пользо­вателями в БД; организация корректировки БД (службой администрации БД и пользователями); организация копирования БД (подготовка носите­лей, запуск программ копирования по графику или внепланово, регистра­ция и учет копий); организация восстановления (подготовка носителей, за­пуск программ восстановления по графику или внепланово, протоколиро­вание восстановления); методическая работа с пользователями программ, программистами и интерактивными пользователями по повышению эффективности взаимо­действия с БД (выбору наилучших стратегий поиска), приобретению пра­вильных навыков взаимодействия с БД (повышение компетентности), под­держанию достоверности и целостности БД.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87