Лекция N4. Этапы моделирования базы данных
1. Модели данных
2. Проектирование баз данных
3. Создание даталогической и физической модели базы данных
Вопрос №1. Модели данных
В базе данных отражается информация об определенной предметной области (Предметная область – часть реального мира, представляющая интерес для данного использования). В автоматизированных информационных системах отражения предметной области представлено моделями данных нескольких уровней. Это обусловлено прежде всего стремлением как можно полнее отразить в базе данных нюансы предметной области.
Для разработки баз данных необходимо как можно полнее описать предметную область. Для этого может быть использован и естественный язык, но его применение имеет много недостатков, основными их которых являются громоздкость описания и неоднозначность трактовки. Поэтому обычно для этих целей используют искусственные формализованные языковые средства, которые и позволяют построить модель предметной области.
Под инфологической моделью – понимают описание предметной области, выполненное с использованием специальных языковых средств, не зависящих от используемых в дальнейшем программных средств.
Инфологическая модель строит в независимости от типа используемого СУБД.
На рис.1. представлена взаимосвязь основных этапов проектирования БД. Из рис.1. наглядно видно, что инфологическая модель предметной области строится первой. Предварительная инфологическая модель строится еще на предпроектной стадии и затем уточняется на более поздних стадиях проектирования. Затем на основе инфологической модели стоится даталогическая модель, а затем идет физическая модель (используется для конкретной привязки даталогической модели к среде хранения).
Даталогическая модель логического уровня представляет собой отображение логических связей между элементами данных безотносительно к их содержанию и среде хранения. (следующая лекция).
Рис.1. Взаимосвязь этапов проектирования
Требования, предъявляемые к инфологическим моделям.
1. Адекватное отображение предметной области. В связи с этим язык для представления ИЛМ должен обладать даталогическими выразительными возможностями для отображения явлений предметной области.
2. Инфологическая модель должна быть непротиворечива. Она является единым интегрированным описанием предметной области и отражает взгляды и потребности всех пользователей систем. (не должно быть неоднозначной трактовки модели)
3. Модель инфологическая конечна. Модель должна удовлетворять свойству конечности, т. к. предметная область ограничена.
4. Инфологическая модель должна обладать свойством расшираяемости. Должен обеспечиваться ввод новых данных и удаление старых данных.
5. Инфологическая модель должна обеспечивать свойство композиции и декомпозиции. Реальные СУБД очень большие ® должна обеспечивать возможности композиции и декомпозиции.
6. Инфологическая модель должна легко восприниматься разными категориями пользователей.
Компоненты инфологической модели.
Центральное место в инфологической модели отводится описанию объектов предметной области и связи между ними. (ER-модель).
![]() |
Рис.2. Компоненты инфологической модели.
Описание предметной области всегда представлено в какой-то знаковой системе. Поэтому кроме отношений, присущих предметной области, возникают еще и отношения, обусловленные особенностями отображения ПО в языковой среде. Поэтому при построении инфологической модели должна учитываться лингвистика.
Кроме того, в инфологическое модели должны быть отображены и алгоритмические зависимости между показателями. (для этого используются графы). Расчетные формулы, а также алгоритмы вычислений в какой-то мере должны входить в ИЛМ.
Следующим компонентом инфологической модели является описание информационных потребностей пользователей. Здесь должны отражаться тип запроса, режим использования данных. Важная характеристика предметной области является ограничение целостности.
Вопрос №2. Проектирование баз данных
Основными элементами ИЛМ являются объект (сущность), атрибуты и связи (отношения).
В предметной области в процессе её исследования и анализа выделяют классы объектов.
Объектом называется предмет, который может быть четко идентифицирован (Чен в 1976г.).
Сущность –это реальный или представляемый объект, информация о котором должна сохраняться и быть доступной.
В диаграммах ER-модели сущность представляется в виде прямоугольника, содержащего имя сущности.
|
Рис 3. Сущность покупатель.
На рис 3 приведена сущность “покупатель”.В состав этой сущности могут входить :
· Люди (Иванов, Петров, Сидоров…)
· Фирмы, ОЛО…
· Предприятия…
Сущности (а их в предметной области может быть несколько) должны иметь наименование с четким смыслом – существительным в единственном числе (это облегчает понимание )
С точки зрения БД (физической модели ) сущность – это таблица, атрибуты-колонки, экземпляр сущности – строка в таблице
Так если предметной областью является училище, то сущностями являются :
· Курсанты (совокупность экземпляров, обладающих одинаковыми свойствами)
· Преподаватели
· Аудитории, и т. д.
При отражении в информационной системе любого объекта (экземпляра ) в сущности представляется идентификатором, который отличает один объект (экземпляр) сущности от другого (как в таблице не может быть двух одинаковых строк) .
Сущности бывают
· Правильные (эти сущности могут существовать и без других сущностей );
· Слабые (сущность не может существовать если существует другая сущность : “подчиненные” и “начальник” )
Каждая сущность должна обладать определенными свойствами – называемыми атрибутами. Все элементы (объекты ) одной сущности обладают одинаковыми
атрибутами : (сущность “преподаватели”- ФИО, год поступления на кафедру, зарплату …)
каждое свойство – ограничено и имеет конечное множество значений (в БД это называлось заменой )
Имена атрибутов могут заносится в эллипсы с названием свойств, соединенных сплошной линией с соответствующим объектом (сущностью). Если свойство составное, то составляющие показываются в виде новых эллипсов со связями. Ключевые свойства как правило подчеркивают
Рис 4. Атрибуты сущности “курсант”.
Другой составной частью являются связи (отношения) .
Связь - является логическим отношением между сущностями.
Объекты (сущности ) вк5люченные в данную связь называются участниками . количество участников в связи называются степенью ( отличается от систем в БД )
Связь должна именоваться глаголом ( глагольной фразой) . Имя в данном виде облегчает понимание
Например:
· Каждый преподаватель кафедры <преподает> предметы.
· Каждый курсант <изучает> предмет(ы) на кафедре.
Рис 5. Связь в инфологической модели.
Связи в ER модели могут быть следующих типов :
· Один – к – одному;
· Один – ко – многим;
· Многие – к – одному;
· Многие – ко – многим.
Это мощность связи , которая служит для обозначения отношения числа экземпляров в родительской сущности к числу экземпляров вдочерней сущности.
Связь “один к одному” (1:1) предполагает, что в каждый момент времени элементу А соответствует 0 или 1 элементов В.
|
|
|
|

![]()



![]()
![]()


![]()
Имеет
|
|
|
|
|
| ||||||
Связь “один ко многим” (1:М) состоит в том, что в каждый момент времени каждому элементу А соответствует несколько элементов В. В качестве примера в казарме живут курсанты :
![]() |

![]()
Живут
Связь “многие к одному” предполагает, что в каждый момент времени многжеству элементов А соответствует 1 элемент В.
Курсанты объединяются в группы:
![]() |
Связь “многие ко многим ” состоит в том, что в любой момент времени множеству элементов А соответствует множество элементов В.
Курсанты изучают предметы
Педагоги преподают предметы (практ. Занятия)
![]() |
Вопрос №3. СОЗДАНИЕ ДАТАЛОГИЧЕСКОЙ И ФИЗИЧЕСКОЙ
МОДЕЛЕЙ БАЗЫ ДАННЫХ
Даталогическая и физическая модели данных создаются с использованием нотации ER. При этом действуют все те же соглашения о представлении модели, что и при инфологическом моделировании, однако необходимо
учитывать некоторые особенности, присущие каждому типу моделей и руководствоваться правилами преобразования одной модели в другую.
Как уже отмечалось выше, даталогическая модель отражает структуру
БД с учетом особенностей модели данных. Т. к. на сегодняшний день наиболее популярной является реляционная модель данных, рассмотрим правила
преобразования инфологической модели в реляционную даталогическую.
Переход к даталогической модели сводится к изменению тех отношений между сущностями, которые существуют только на логическом уровне.
Это прежде всего отношения типа многие-ко-многим и иерархия наследования.
Для преобразования отношения типа многие-ко-многим необходимо
создать третью сущность, в качестве первичного ключа которой будут вы-
ступать ключевые атрибуты сущностей, связанных отношением многие-ко-
многим. Имя новой сущности выбирается исходя из ее смыслового значения,
а неключевые атрибуты могут мигрировать из одной из связанных сущностей
или быть добавлены отдельно.
Например, в случае, изображенном на рис.52, преобразование связи
многие-ко-многим, существующей в инфологической модели, приводит к
созданию третьей сущности, в которую копируются ключевые атрибуты
сущностей «Материал» и «Расход материала».

Между исходными сущностями и связующей устанавливаются идентифицирующие связи «один-ко-многим». Результат операции приведен на
рис.53.
На рис.53 видно, что в третьей сущности представлена информация,
отражающая состав израсходованных материалов. Следовательно, логично
будет назвать сущность «Состав расхода материалов», а поскольку необходимо хранение информации о количестве и цене израсходованных материалов, следует ввести в состав сущности «Состав расхода материалов» атрибуты «Количество» и «Цена».

В случае использования категориальной связи, преобразование необходимо проводить одним из трех возможных путей:
1. Для каждой сущности иерархии наследования инфологической мо-
дели создается соответствующая сущность в даталогической модели. При
этом происходит перенос атрибутов сущности ИМД в соответствующую
сущность ДМД. Категориальная связь между сущностями заменяется отношением «многие-ко-многим».
2. Все атрибуты сущностей потомков переносятся в состав атрибутов
сущности предка. При этом в ДМД включается только сущность предок, со-
держащая все возможные атрибуты своих потомков.
123
3. Все атрибуты сущности предка переносятся в состав всех атрибутов
сущностей потомков. Связь между сущностями разрывается, а в ДМД включаются независимые друг от друга сущности, получившиеся в результате переноса.
Предположим, в ИМД существует категориальная связь, изображенная
на рис.54.
В данном случае видно, что сотрудник может быть как постоянным работником, так и совместителем или консультантом. Различие между ними заключается в типе сотрудника, что отражено на диаграмме с помощью дискриминанта «Тип». Сущности «Постоянный сотрудник», «Совместитель»,
«Консультант» являются зависимыми от сущности «Сотрудник», поэтому на
диаграмме изображены в виде прямоугольников со скругленными углами, а
их ключевыми атрибутами являются ключевые атрибуты родительской сущности «Сотрудник».
Для перехода к ДМД необходимо воспользоваться одним из трех пере-
численных выше способов.

Если применить первый способ преобразования, получим результат,
изображенный на рис.55. В результате мы получили четыре сущности, связанные отношениями «многие-ко-многим» с сущностью «Сотрудник». Вид-
но, что в данном случае «Постоянный сотрудник» и «Сотрудник» являются
полностью идентичными, т. к. «Постоянный сотрудник» не содержит дополнительных атрибутов, отличающих его от «Сотрудника».

Следовательно, сущность «Постоянный сотрудник» можно удалить.
Кроме этого, очевидно, что преобразование подобного рода целесообразно
проводить тогда, когда родовые потомки отличаются от своего предка большим количеством признаков.
Если применить второй способ преобразования к модели, изображен-
ной на рис.54, получим результат, изображенный на рис.56.
В данном случае все атрибуты были собраны в одной сущности «Со-
трудник». При работе с такой сущностью часть атрибутов будет оставаться
незаполненной, а отличия между экземплярами сущности будут определятся
значением атрибута «Тип». Такое преобразование целесообразно проводить в
случае, когда количество атрибутов в родовых предках сущности невелико.

Если применить третий способ преобразования к модели, изображен-
ной на рис.54, получим следующий результат (рис.57).

В данном случае, мы получили три независимые сущности, содержащие часть одинаковых атрибутов, унаследованных от родового предка и отличающихся атрибутами, присущими сущностям потомкам. Этот способ
удобно применять в случае, когда сущности-потомки отличаются друг от
друга большим количеством атрибутов.
Следует отметить, что выбор способа преобразования, применяемого к
категориальной связи инфологической модели данных целиком зависит от
проектировщика и определяется его опытом и знаниями. Каждый способ
преобразования имеет свои плюсы и минусы и проектировщику необходимо
оценивать их в зависимости от конкретной ситуации, возникающей в процессе создания БД.
После того как создана даталогическая модель данных (т. е. проведено
преобразование связей «многие-ко-многим» и категориальных связей, необходимо создать физическую модель данных (ФМД). Для этого необходимо
выбрать СУБД, в которой планируется создавать БД, изучить ее особенности,
возможности и правила создания таблиц и отношений между ними. Особенно пристальное внимание необходимо обратить на типы данных, поддерживаемые СУБД и принятые правила именования таблиц и атрибутов. Переход
к физической модели данных заключается в преобразовании имен сущностей
и их атрибутов в соответствии с принятыми в СУБД правилами, а также определение и присвоение типов данных, поддерживаемых выбранной СУБД,
каждому атрибуту сущности.






