Глава 8. Основы технологий баз данных

В комплексе информационных технологий, используемых в разработках современных информационных систем, одно из центральных мест принадлежит технологиям баз данных. В этой главе вводятся основные понятия, рассматриваются ключевые подходы и возможности инструментальных средств, используемых в технологиях баз данных, обсуждаются перспективы их развития.

8.1. Истоки технологий баз данных

Термин база данных впервые прозвучал в начале 60-х годов прошлого века, когда был создан ряд программных систем, воплотивших некоторые принципы технологий баз данных.

Рождению технологий баз данных предшествовал период, когда средства вычислительной техники уже позволяли решать задачи, связанные с обработкой больших объемов данных, для хранения которых использовались устройства внешней памяти на магнитных лентах.

Для управления данными, хранимыми во внешней памяти, использовались системы управления файлами. Такие системы стали разрабатываться как функциональные компоненты операционных систем практически для всех аппаратных платформ. Для выполнения нужной операции над файлом прикладная программа должна с помощью соответствующей команды обратиться к системе управления файлами точно так же, как она обращается к другим компонентам операционной системы, для выполнения операций ввода-вывода данных, распределения памяти и т. д.

Единицей доступа программы к данным, содержащимся в файле, является запись – содержимое некоторой последовательности ячеек памяти.  При использовании магнитных лент в качестве носителей данных во внешней памяти применяется последовательный доступ к записям файла. При этом они просматриваются и обрабатываются последовательно одна за другой в порядке их размещения в файле. Значительные затраты времени доступа связаны с необходимостью механической перемотки магнитной ленты для поиска ее участка, где хранятся записи нужного файла.

НЕ нашли? Не то? Что вы ищете?

Кроме того, важно отметить, что файловой системе неизвестна структура записей файла. Сведения об их содержании известны программисту, создающему прикладные программы, в которых данный файл используется, и он «зашивает» эти свои знания в программы. При изменении организации записей файла возникает необходимость вносить соответствующие изменения  в программный код. Это обстоятельство порождало дополнительные сложности, когда изменялась организация файла, используемого в нескольких программах.

Наиболее распространенным в рассматриваемый период классом задач, в которых предусматривалась обработка больших объемов данных, хранимых во внешней памяти, были задачи обработки экономической информации – учет запасов на складе, прием и обработка заказов, обработка товарно-транспортных накладных и т. п. При решении таких задач необходимо обеспечивать ввод записей в файлы, обновление содержащихся в них значений элементов данных, удаление записей, слияние файлов с записями одинаковой структуры, отбор записей в файле по заданному критерию, сортировку и группировку таких записей данных, генерацию на основе записей файла сведений для пользователя (отчетов), как правило, табличной формы, возможно, с агрегированием данных, с промежуточными итогами по некоторым элементам данных для групп записей и с полными итогами по всему отчету.

Активизации этого направления использования вычислительной техники в значительной мере способствовало появление в 1961 г. языка программирования Кобол, который стал основой систем автоматизации программирования задач указанного вида. 

Однако, несмотря на их активное использование на практике, технологии, основанные на использовании магнитных лент с их последовательным доступом в качестве внешней памяти компьютеров того времени, а также ограниченные возможности управления данными, обеспечиваемые системами управления файлами, существенно сдерживали развитие средств решения подобных задач.

Появление в начале 60-х годов устройств памяти прямого доступа на магнитных дисках открыло принципиально новые возможности. Были разработаны более тонкие методы управления большими объемами данных во внешней памяти, которые обеспечивали возможности поддержки  более сложных структур данных, минимизацию избыточности данных и эффективный доступ к ним благодаря свойствам таких устройств памяти. Именно на этом этапе родилась концепция базы данных, и стали разрабатываться основы технологий баз данных, появились первые программные средства для управления базами данных.

Ранние механизмы управления данными, основанные на концепции базы данных, первоначально разрабатывались с ориентацией, главным образом, на указанный выше класс задач, а реализующее их программное обеспечение было предназначено для обеспечения доступа прикладных программ к представленным во внешней памяти данным. Однако за прошедшие четыре десятилетия интенсивного развития сформировались развитые технологии баз данных, обеспечивающие возможности эффективного использования их инструментария во многих сферах применения, позволяющие оперировать данными в базах данных не только прикладным программам, но и непосредственно в интерактивном режиме специалистам в конкретных областях деятельности. Разработана теория систем баз данных. Сформировалась мощная индустрия производства программного обеспечения для разработки, поддержки и использования баз данных.

Технологии баз данных стали необходимым инструментом разработки широкого класса информационных систем.

Контрольные вопросы 

Какой функциональный компонент компьютерных операционных систем позволяет осуществлять управление данными, хранимыми во внешней памяти вычислительной машины?

Что представляют собой файлы и для чего они необходимы?

В чем заключается ограниченность средств управления данными, предоставляемых системой управления файлами?

На каком носителе информации были основаны устройства внешней памяти вычислительных машин до начала 60-х годов?

Какова специфика запоминающих устройств на магнитных лентах? 

Какой класс задач, связанный с обработкой больших объемов данных, хранимых во внешней памяти, был наиболее популярным в начале 60-х годов?

Когда была предложена концепция базы данных?

Благодаря каким новым возможностям средств вычислительной техники открылись возможности для создания технологий баз данных?

8.2. Предметная область и ее моделирование

Еще на ранней стадии развития информационных систем, предшествующей времени зарождения технологий баз данных, было принято различать два класса информационных систем – документальные и фактографические системы.

К числу документальных информационных систем ранее относили значительно более узкий класс систем, чем в настоящее время. Эти системы, называемые теперь текстовыми системами, служат для работы с документами на естественных языках – с библиографическими описаниями публикаций, с полными текстами журнальных статей,  монографий, научных отчетов, диссертаций, законодательных актов и т. д. В настоящее время понятие документальной системы трактуется более широко. Предполагается, что системы этого класса оперируют не только текстовыми документами, но и информационными ресурсами, представленными в других средах, например, изображениями, видео, аудио и т. п.

Фактографические информационные системы оперируют фактами, представленными с помощью структурированных различными способами данных. Ранние системы этого класса были предназначены, главным образом для выполнения простейших поисковых функций – поиска объектов по заданному набору их свойств или поиска свойств заданных объектов. Именно в информационных системах этого класса нашли применение технологии баз данных. Технологии баз данных в довольно короткий период времени вытеснили другие подходы в разработках фактографических информационных систем и радикальным образом обогатили их функции. Термин «фактографическая информационная система» постепенно вышел из употребления. Ему на смену пришел термин «система базы данных». Смысл этого термина мы определим позднее, а прежде рассмотрим некоторые вопросы, связанные с системами, которые основаны на технологиях баз данных.

Ключевой момент заключается в том, что назначение каждой такой информационной системы заключается в поддержке динамической информационной модели некоторой части реального мира, которую принято называть предметной областью системы.

Однако натурные измерения или наблюдения не всегда могут быть осуществлены в отведенное для них время вообще или в полном объеме в связи с большой их трудоемкостью, высокой стоимостью, недоступностью объекта измерения (наблюдения) и по различным другим причинам. В таких ситуациях на помощь приходят компьютерные динамические информационные модели реальности. Информационные модели отличаются от моделей других видов – физических, математических и т. д. тем, что такая модель материализуется в виде совокупности информационных ресурсов. При использовании технологий баз данных такую модель можно было бы назвать «данновой» моделью.

Информационная модель, адекватно (относительно информационных потребностей пользователей) отражающая состояние реальности, позволяет получать многие необходимые сведения с ее помощью, избавляя тем самым от необходимости натурных измерений. При этом обычно не только уменьшаются затраты времени, но часто снижается также и стоимость получения нужных сведений. Базы данных в информационных системах являются основными компонентами таких компьютерных моделей.

При разработке информационной системы предметная область рассматривается, прежде всего, как некоторая совокупность реальных сущностей (объектов реальности), которые представляют интерес для пользователей данной системы.

Представление предметной области в терминах конкретных сущностей оказывается чаще всего громоздким, необозримым, не позволяет четко выкристаллизовать ее структуру. Поэтому в большинстве случаев прибегают к типизации сущностей предметной области. При этом все потенциальное множество сущностей предметной области разбивается на именованные группы сущностей, однородных по их структуре и поведению (относительно рамок рассматриваемой предметной области), называемые типами сущностей. При этом естественно предположить, что все "экземпляры" сущностей одного типа (далее для краткости называемые просто "сущностями") обладают одинаковыми наборами свойств (атрибутов), и таким образом условно считать эти их свойства свойствами типа.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99