Актуализация и сохранение БД включают следующие основные функции (рис. 22.41, в): 1 — запрос к СУБД на выполнение функций актуализации и сохранения БД; 2 — ввод данных по запросу; 3 — ведение системного журнала, обращение к системному журналу, распечатка журнала; 4 — ведение, использование и распечатка статистических данных о работе АБД; 5 — вывод БД (дампирование, распечатка); 6 — копирование и восстановление БД; 7 — запись (корректировка) данных.
22.10. Целостность и сохранность баз данных
Эффективность АСНИ и, в конечном итоге, качество выполненных исследований, в значительной степени зависят от достоверности и целостности БД. Достоверность предполагает соответствие хранимых данных реальному состоянию исследуемой проблемы (а точнее, состоянию модели исследуемой проблемы, сведения о которой хранятся и перерабатываются в системе). Под целостностью БД понимают отсутствие физических нарушений в хранимой информации.
Снижение достоверности и нарушения целостности могут быть вызваны ошибками в данных и разрушением данных. Основными источниками ошибок и разрушения данных являются: неточные исходные данные (вводимая информация); искажение и потери информации при подготовке и вводе ее персоналом АСНИ; искажение информации при работе оборудования (неустойчивость характеристик, сбои, помехи); неисправность и отказы оборудования; некорректность программных средств; несанкционированный и некомпетентный доступ к данным.
Основными мерами поддержания достоверности и целостности БД являются контроль информации, исправление ошибок и искажений, обеспечение сохранности БД. Эти меры реализуются следующими методами и средствами: визуальными (при подготовке, вводе и выводе информации); техническими (аппаратными); программными и организационными.
Контроль информации. Для обнаружения ошибок существенное значение имеют четыре фактора: грамматический характер ошибок, уровень агрегации (иерархии) контролируемых элементов, вид и форма используемой для контроля избыточности, момент внесения избыточности в контролируемые элементы.
По грамматическому характеру ошибки подразделяются на синтаксические и семантические.
Синтаксические ошибки влияют на структуру и лексику представления данных, например пропуск или добавление символа, внесение постороннего или запрещенного символа в реквизит, сдвиг по строкам или колонкам отформатированного документа (сообщения).
Для обнаружения синтаксических ошибок применяют сравнительно простые методы, например, проверку шаблонов и форматов.
Семантические ошибки искажают смысл (содержание) информации, оставляя правильными структуру и лексику, например, замена символов другими допустимыми символами. Семантические ошибки разделяют на три вида: орфографические, смысловые и блочные.
Орфографические ошибки искажают значения символов реквизита.
Смысловые ошибки искажают содержимое (смысл) записи, например, перемена местами одноименных реквизитов различных записей.
Блочные ошибки искажают блок записей (например, отсутствие некоторых записей, их перестановки). Следовательно, можно выделить три уровня агрегации контролируемых элементов: реквизит, запись, блок записей (или файл).
Для контроля информации используют следующие виды избыточности:
избыточные разряды (например, контроль по модулю, при котором контрольные разряды определяются путем преобразования значений информационных, контроль по четности);
избыточные реквизиты, дополняющие запись (они вычисляются как некоторая функция от значений информационных реквизитов, например, контрольное суммирование по записи);
избыточные записи, дополняющие блок (например, итоговое суммирование);
двукратную избыточность, заключающуюся в повторной фиксации информации и сравнении ее с первоначальной (например, дубль-копирование, верификация);
естественную избыточность, основанную на свойстве конкретного вида информации иметь определенные формат, размерность, диапазон разрешенных значений, а также определенным образом сочетаться между собой (например, реквизит «месяц» имеет разрешенный диапазон 01—12).
Внесение ошибок (искажение информации) возможно на следующих основных этапах переработки данных: заполнения документов (сбора данных); подготовки данных на машинных носителях; ввода данных; обработки данных; записи (считывания) информации на внешние запоминающие устройства; передачи данных. На этапе заполнения возможен визуальный контроль; на этапе подготовки — визуальный, повторная подготовка и сравнение, контрольное суммирование; на этапе ввода данных — визуальный (по отображению вводимой информации), технический (по четности, по модулю), программный (логический по формату, структуре, диапазону и по контрольной сумме); на этапе обработки — технический (предусмотренный в аппаратуре ЭВМ) и программный (логический, двойная обработка и сравнение); на этапе записи (считывания) — в основном аппаратные средства (на четность, циклический, контрольное суммирование); на этапе передачи — аппаратные (с помощью устройств защиты от ошибок, обеспечивающих помехозащитное и исправляющее некоторые ошибки кодирование и контроль), а также программные, если передача осуществляется в (из) ЭВМ.
На всех этапах могут применяться организационные методы контроля, заключающиеся в осуществлении, сочетании, сопоставлении результатов других методов, организации исправления ошибок, а также принятия решений о возможности продолжать процесс переработки данных.
Исправление ошибок и искажений. При обнаружении искажения данных в БД возможны два пути корректировки: корректировка отдельных записей (их элементов) и осуществление мер по обеспечению сохранности БД.
Исправление (корректировка) отдельных записей осуществляется, если записи локализованы и если искажена незначительная часть БД. В противном случае пользуются системой обеспечения сохранности БД.
Обеспечение сохранности БД. Основными мерами обеспечения сохранности являются: копирование и восстановление БД; защита от несанкционированного и некомпетентного воздействия; организационно-методическая работа.
Для копирования и восстановления БД применяется целый ряд общих методов.
Полное копирование томов предполагает снятие полных копий томов памяти.
Восстановление заключается в перезаписи копии на том (иногда перезаписывается часть тома). Сохраняется, как правило, последняя копия. Основные недостатки: большие временные затраты и невозможность использования БД во время копирования.
Выборочное копирование (копирование файлов) предполагает снятие копий только модифицированных файлов, которые добавляются к уже имеющимся копиям. Основной недостаток: трудоемкость учета и периодической чистки файлов.
Системная журнализация предполагает фиксацию (протоколирование) действий по модификации БД в системном журнале (специальный файл) и хранение корректур. Выполняется обычно средствами СУБД и используется в сочетании с другими методами копирования-восстановления, облегчая их реализацию за счет наличия предыстории модификации. Основные недостатки: относительно большое время восстановления, а также трудоемкость реализации системной журнализации (при использовании уже разработанной СУБД с этими функциями данный недостаток не имеет значения).
Регенерация поколений предполагает копирование по схеме «дед — отец — сын», т. е. наличие трех текущих копий. Самая последняя копия называется «сын», предыдущие — соответственно «отец» и «дед». Если происходит очередное копирование, появляется новое поколение «сын», бывшее поколение «сын» становится «отцом», бывшее поколение «отец» — «дедом», а копия бывшего поколения «дед» уничтожается. При разрушении оригинала (копии «сын») восстановление осуществляется путем повторения процедур актуализации. Если разрушена копия «отец», то восстановление осуществляется в два этапа: «дед», «отец» — «сын». Для восстановления существенное значение имеет системная журнализация.
Предварительное замещение ориентировано на восстановление информации, разрушенной во время сеанса актуализации БД. Предполагает создание копии модифицируемой части перед выполнением модификации, сама модификация выполняется с копией. Если информация во время модификации будет разрушена, оригинал останется в сохранности.
В реальных системах информационного обеспечения наиболее эффективно использовать комбинации общих методов копирования — восстановления. Наиболее распространены три основных класса комбинированных моделей копирования-восстановления: периодической разгрузки, дублирования-регенерации поколений, периодической разгрузки-регенерации поколений.
Защита от несанкционированного и некомпетентного воздействия (запроса) основывается на системе замков и ключей, идентифицирующих пользователей. Система реализуется, как правило, в рамках СУБД.
Организационно-методические работы по обеспечению сохранности БД проводит администрация БД. В состав работ входят: анализ требований пользователей по защите данных; идентификация пользователей (назначение паролей, ключей); определение функций (операций) над данными, допустимых для каждого пользователя, и фиксация этой информации в СУБД; контроль и анализ нарушений санкционированного доступа; анализ системного журнала (выявление особых ситуаций, необходимости корректировки, копирования, восстановления); проверка логической непротиворечивости информации БД (запуск специальных тестирующих программ по графику или по необходимости, анализ результатов тестирования); контроль модификаций информации, проводимых пользователями в БД; организация корректировки БД (службой администрации БД и пользователями); организация копирования БД (подготовка носителей, запуск программ копирования по графику или внепланово, регистрация и учет копий); организация восстановления (подготовка носителей, запуск программ восстановления по графику или внепланово, протоколирование восстановления); методическая работа с пользователями программ, программистами и интерактивными пользователями по повышению эффективности взаимодействия с БД (выбору наилучших стратегий поиска), приобретению правильных навыков взаимодействия с БД (повышение компетентности), поддержанию достоверности и целостности БД.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 |


