Партнерка на США и Канаду по недвижимости, выплаты в крипто
- 30% recurring commission
- Выплаты в USDT
- Вывод каждую неделю
- Комиссия до 5 лет за каждого referral
http://www.citforum.ru/database/osbd/contents.shtml
Основы современных баз данных
, информационно-аналитические материалы
Центра Информационных Технологий
Предисловие
Предметом курса являются системы управления базами данных (СУБД). Это очень важная тема, без основательного знакомства с которой в наше время невозможно быть не только квалифицированным программистом, но даже и грамотным пользователем компьютеров.
Заметим, что литературы на русском языке, посвященной тематике СУБД, очень мало. Невозможно порекомендовать одну или несколько книг, содержание которых покрывало бы материал данного курса. К числу лучших относятся книги К. Дейта "Введение в системы баз данных" (Наука, 1980) и "Руководство по реляционной СУБД DB2" (Финансы и статистика, 1988), а также книга Дж. Ульмана "Основы систем баз данных" (Финансы и статистика, 1983). Хотя эти книги несколько устарели (на английском языке вышло уже несколько дополненных изданий), их стоит читать.
Основное назначение данного курса - систематическое введение в идеи и методы, используемые в современных реляционных системах управления базами данных. В курсе не рассматривается какая-либо одна популярная СУБД; излагаемый материал в равной степени относится к любой современной системе. Как показывает опыт, без знания основ баз данных трудно на серьезном уровне работать с конкретными системами, как бы хорошо они не были документированы.
В вводной части курса рассматриваются основные различия между файловыми системами и системами управления базами данных. На основе анализа возможностей современных файловых систем выделяются области приложений, в которых достаточно использовать файлы, а также те, для которых необходимы базы данных. В этой же части курса обсуждаются базовые функции и приводится типовая организация СУБД. В заключении вводной части кратко рассматриваются основные характеристики ранних, дореляционных систем.
Вторая часть курса содержит необходимый теоретический базис, на котором основывается дальнейшее изложение. Вводятся основные понятия реляционной модели данных, обсуждаются основные свойства отношений, рассматриваются два базовых механизма манипулирования данными: реляционная алгебра и реляционное исчисление. Далее излагаются принципы нормализации, на которых основан классический подход к проектированию реляционных баз данных. Наконец, описывается более современный подход к проектированию баз данных, основанный на использовании семантических моделей данных.
В третьей части курса обсуждаются два классических примера экспериментальных проектов реляционных СУБД, которые, фактически, служат основой всех современных коммерческих СУБД. Рассматриваются проекты System R и Ingres. Идея состоит в том, чтобы продемонстрировать сбалансированные наборы решений, примененных в этих двух существенно различающихся системах.
Четвертая часть курса посвящается внутренней организации современных многопользовательских реляционных СУБД. Рассматриваются методы организации внешней памяти баз данных и применяемые структуры данных. Вводится понятие транзакции и анализируются известные способы управления асинхронно выполняемыми транзакциями. Обсуждаются потребности в журнализации изменений баз данных и связь алгоритмов журнализации с политикой управления буферами оперативной памяти. Наконец, рассматриваются способы применения журнальной и архивной информации для восстановления баз данных после различных сбоев.
В пятой части курса подробно рассматривается язык реляционных баз данных SQL. Исходные понятия SQL обсуждаются на основе версии языка, разработанной в рамках проекта System R. Затем кратко описывается история SQL после System R и, в частности, международная деятельность по его стандартизации. После этого систематически излагается наиболее распространенный стандарт языка - SQL-89. Обсуждаются способы использования SQL при программировании прикладных систем. Пятая часть курса завершается рассмотрением наиболее важных свойств, появившихся в последнем стандарте языка SQL-92.
Шестая часть курса посвящена проблемам, которые решаются в компиляторах языка SQL. Эти проблемы концентрируются вокруг необходимости получения эффективных программ, выполняющих операторы, которые изначально формулируются на декларативном языке SQL. Для решения проблем в компиляторах SQL приходится применять разнообразные оптимизирующие приемы, знание которых помогает понять работу любой конкретной системы.
В седьмой части курса рассматривается применение архитектуры "клиент-сервер" в современных СУБД. Рассматриваются принципы взаимодействия между клиентскими и серверными частями системы, и, в частности, важность применения протоколов удаленного вызова процедур для обеспечения организации неоднородных организаций "клиент-сервер". Обсуждаются типичное разделение функций между клиентами и серверами и следующие из этого требования к аппаратным возможностям.
В восьмой части рассматриваются специфические проблемы распределенных баз данных. Анализируются категории распределенных систем, вопросы именования, администрирования, поддержания надежности и доступности данных, особенности управления транзакциями и компиляции запросов.
Наконец, завершающая курс девятая часть посвящена направлениям и состоянию исследовательских работ в области баз данных. Рассматриваются проекты и исследования, относящиеся к так называемым системам баз данных следующего поколения; основные принципы организации систем объектно-ориентированных баз данных; системы баз данных, основанные на правилах, включая активные и дедуктивные базы данных.
Содержание
Введение- Лекция 1. Базы данных и файловые системы
- 1.1. Файловые системы
- 1.1.1. Структуры файлов 1.1.2. Именование файлов 1.1.3. Защита файлов 1.1.4. Режим многопользовательского доступа
- 2.1. Основные функции СУБД
- 2.1.1. Непосредственное управление данными во внешней памяти 2.1.2. Управление буферами оперативной памяти 2.1.3. Управление транзакциями 2.1.4. Журнализация 2.1.5. Поддержка языков БД
- 3.1. Основные особенности систем, основанных на инвертированных списках
- 3.1.1. Структуры данных 3.1.2. Манипулирование данными 3.1.3. Ограничения целостности
- 3.2.1. Иерархические структуры данных 3.2.2. Манипулирование данными 3.2.3. Ограничения целостности
- 3.3.1. Сетевые структуры данных 3.3.2. Манипулирование данными 3.3.3. Ограничения целостности
- Лекция 4. Общие понятия реляционного подхода к организации БД. Основные концепции и термины
- 4.1. Базовые понятия реляционных баз данных
- 4.1.1. Тип данных 4.1.2. Домен 4.1.3. Схема отношения, схема базы данных 4.1.4. Кортеж, отношение
- 4.2.1. Отсутствие кортежей-дубликатов 4.2.2. Отсутствие упорядоченности кортежей 4.2.3. Отсутствие упорядоченности атрибутов 4.2.4. Атомарность значений атрибутов
- 4.3.1. Общая характеристика 4.3.2. Целостность сущности и ссылок
- 5.1. Реляционная алгебра
- 5.1.1. Общая интерпретация реляционных операций 5.1.2. Замкнутость реляционной алгебры и операция переименования 5.1.3. Особенности теоретико-множественных операций реляционной алгебры 5.1.4. Специальные реляционные операции
- 5.2.1. Кортежные переменные и правильно построенные формулы 5.2.2. Целевые списки и выражения реляционного исчисления 5.2.3. Реляционное исчисление доменов
- 6.1. Проектирование реляционных баз данных с использованием нормализации
- 6.1.1. Вторая нормальная форма 6.1.2. Третья нормальная форма 6.1.3. Нормальная форма Бойса-Кодда 6.1.4. Четвертая нормальная форма 6.1.5. Пятая нормальная форма
- 6.2.1. Семантические модели данных 6.2.2. Основные понятия модели Entity-Relationship (Сущность-Связи) 6.2.3. Нормальные формы ER-схем 6.2.4. Более сложные элементы ER-модели 6.2.5. Получение реляционной схемы из ER-схемы
- Лекция 7. System R: общая организация системы, основы языка SQL
- 7.1. Используемая терминология 7.2. Основные цели System R и их связь с архитектурой системы 7.3. Организация внешней памяти в базах данных System R 7.4. Интерфейс RSS 7.5. Синхронизация в System R 7.6. Журнализация и восстановление в System R
- 8.1. История СУБД Ingres 8.2. Ingres как UNIX-ориентированная СУБД. Динамическая структура системы: набор процессов 8.3. Структуры данных, методы доступа, интерфейсы доступа к данным 8.4. Общая характеристика языка QUEL. Язык программирования EQUEL 8.5. Общий подход к организации представлений, ограничениям целостности и контролю доступа
- Лекция 9. Cтруктуры внешней памяти, методы организации индексов
- 9.1. Хранение отношений 9.2. Индексы
- 9.2.1. B-деревья 9.2.2. Хэширование
- 10.1. Транзакции и целостность баз данных 10.2. Изолированность пользователей 10.3. Сериализация транзакций
- 11.1. Синхронизационные захваты
- 11.1.1. Гранулированные синхронизационные захваты 11.1.2. Предикатные синхронизационные захваты 11.1.3. Тупики, распознавание и разрушение
- 12.1. Журнализация и буферизация 12.2. Индивидуальный откат транзакции 12.3. Восстановление после мягкого сбоя 12.4. Физическая согласованность базы данных 12.5. Восстановление после жесткого сбоя
- Лекция 13. Язык SQL. Функции и основные возможности
- 13.1. SEQUEL/SQL СУБД System R
- 13.1.1. Запросы и операторы манипулирования данными 13.1.2. Операторы определения и манипулирования схемой БД 13.1.3. Определения ограничений целостности и триггеров 13.1.4. Представления базы данных 13.1.5. Определение управляющих структур 13.1.6. Авторизация доступа к отношениям и их полям 13.1.7. Точки сохранения и откаты транзакции 13.1.8. Встроенный SQL 13.1.9. Динамический SQL
- 14.1. Типы данных 14.2. Средства определения схемы
- 14.2.1. Оператор определения схемы 14.2.2. Определение таблицы 14.2.3. Определение столбца 14.2.4. Определение ограничений целостности таблицы 14.2.5. Определение представлений 14.2.6. Определение привилегий
- 15.1. Структура запросов
- 15.1.1. Спецификация курсора 15.1.2. Оператор выборки 15.1.3. Подзапрос
- 15.2.1. Раздел FROM 15.2.2. Раздел WHERE 15.2.3. Раздел GROUP BY 15.2.4. Раздел HAVING
- 15.3.1. Семантика агрегатных функций 15.3.2. Результаты запросов
- 16.1. Язык модулей или встроенный SQL? 16.2. Язык модулей
- 16.2.1. Определение процедуры
- 16.4.1. Операторы, связанные с курсором 16.4.2. Одиночные операторы манипулирования данными
- 16.5.1. Оператор подготовки 16.5.2. Оператор получения описания подготовленного оператора 16.5.3. Оператор выполнения подготовленного оператора 16.5.4. Работа с динамическими операторами SQL через курсоры
- 17.1. Оператор выделения памяти под дескриптор 17.2. Оператор освобождения памяти из-под дескриптора 17.3. Оператор получения информации из области дескриптора SQL 17.4. Оператор установки дескриптора 17.5. Оператор подготовки 17.6. Оператор отказа от подготовленного оператора 17.7. Оператор запроса описания подготовленного оператора 17.8. Оператор выполнения подготовленного оператора 17.9. Оператор подготовки с немедленным выполнением 17.10. Оператор объявления курсора над динамически подготовленным оператором выборки 17.11. Оператор определения курсора над динамически подготовленным оператором выборки 17.12. Оператор открытия курсора, связанного с динамически подготовленным оператором выборки 17.13. Оператор чтения строки по курсору, связанному с динамически подготовленным оператором выборки 17.14. Оператор закрытия курсора, связанного с динамически подготовленным оператором выборки 17.15. Оператор позиционного удаления по курсору, связанному с динамически подготовленным оператором выборки 17.16. Оператор позиционной модификации по курсору, связанному с динамически подготовленным оператором выборки 17.17. Подготавливаемый оператор позиционного удаления 17.18. Подготавливаемый оператор позиционной модификации 17.19. Сводка новых возможностей SQL-3
- 17.19.1. Типы данных 17.19.2. Некоторые другие свойства SQL-3
- Лекция 18. Компиляторы SQL. Проблемы оптимизации
- 18.1. Общая схема обработки запроса 18.2. Синтаксическая оптимизация запросов
- 18.2.1. Простые логические преобразования запросов 18.2.2 Преобразования запросов с изменением порядка реляционных операций 18.2.3 Приведение запросов со вложенными подзапросами к запросам с соединениями
- 18.3.1. Преобразования запросов на основе семантической информации 18.3.2. Использование семантической информации при оптимизации запросов
- 18.4.1. Генерация планов 18.4.2. Оценка стоимости плана запроса 18.4.3. Более точные оценки
- Лекция 19. Архитектура "клиент-сервер"
- 19.1. Открытые системы 19.2. Клиенты и серверы локальных сетей 19.3. Системная архитектура "клиент-сервер" 19.4. Серверы баз данных
- 19.4.1. Принципы взаимодействия между клиентскими и серверными частями 19.4.2. Преимущества протоколов удаленного вызова процедур 19.4.3. Типичное разделение функций между клиентами и серверами 19.4.4. Требования к аппаратным возможностям и базовому программному обеспечению клиентов и серверов
- Лекция 20. Распределенные БД
- 20.1. Разновидности распределенных систем 20.2. Распределенная система управления базами данных System R*
- 20.2.1. Именование объектов и организация распределенного каталога 20.2.2. Распределенная компиляция запросов 20.2.3. Управление транзакциями и синхронизация
- Лекция 21. Системы управления базами данных следующего поколения
- 21.1. Ориентация на расширенную реляционную модель 21.2. Абстрактные типы данных 21.3. Генерация систем баз данных, ориентированных на приложения 21.4. Оптимизация запросов, управляемая правилами 21.5. Поддержка исторической информации и темпоральных запросов
- 22.1. Связь объектно-ориентированных СУБД с общими понятиями объектно-ориентированного подхода 22.2. Объектно-ориентированные модели данных 22.3. Языки программирования объектно-ориентированных баз данных
- 22.3.1. Потеря соответствия между языками программирования и языками запросов в реляционных СУБД 22.3.2. Языки программирования ООБД как объектно-ориентированные языки с поддержкой стабильных (persistent) объектов 22.3.3. Примеры языков программирования ООБД
- 22.4.1. Явная навигация как следствие преодоления потери соответствия 22.4.2. Ненавигационные языки запросов 22.4.3. Проблемы оптимизации запросов
- 22.5.1. Проект ORION 22.5.2. Проект O2
- 23.1. Экстенсиональная и интенсиональная части базы данных 23.2. Активные базы данных 23.3. Дедуктивные базы данных
Введение
Лекция 1. Базы данных и файловые системы
На первой лекции мы рассмотрим общий смысл понятий БД и СУБД. Начнем с того, что с самого начала развития вычислительной техники образовались два основных направления ее использования. Первое направление - применение вычислительной техники для выполнения численных расчетов, которые слишком долго или вообще невозможно производить вручную. Становление этого направления способствовало интенсификации методов численного решения сложных математических задач, развитию класса языков программирования, ориентированных на удобную запись численных алгоритмов, становлению обратной связи с разработчиками новых архитектур ЭВМ.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 |


