Главная Обратная связь

Дисциплины:






Избыточное дублирование и аномалии



Различают простое (неизбыточное) и избыточное дублирование данных. Первое из них допускается в БД, а второе приводит к проблемам обработки данных. Пример неизбыточного дублирования:С_Т

Сотрудник Телефон
Иванов И.М.  
Петров М.И.  
Сидоров Н.Г.  
Егоров В.В.  
   

Рис. 6.1. Неизбыточное дублирование

Для сотрудников, находящихся в одном помещении, номера телефонов совпадают, хотя для каждого служащего номер телефона уникален. Поэтому ни один из номеров не является избыточным.

Пример избыточного дублирования (избыточности):С_Т_К

Сотрудник Телефон Комната
Иванов И.М.    
Петров М.И.    
Сидоров Н.Г.    
Егоров В.В.    

Рис. 6.2. Избыточное дублирование

Аномалияминазывают такую ситуацию в таблицах базы данных, которая приводит к противоречиям в БД либо существенно усложняет обработку данных.

Выделяют три вида аномалий: аномалии модификации, аномалии удаления и аномалии добавления.

Аномалии модификации проявляются в том, что изменение значения одного данного может повлечь за собой просмотр всей таблицы и изменение других записей таблицы (изменение номера телефона в к. 111 в отношении С_Т_К влечет изменение в трех кортежах).

Аномалии удаления состоят в том, что при удалении какого-либо данного из таблицы может пропасть и другая информация, которая не связана напрямую с удалением (удаление записи о сотруднике Иванове в табл. С_Т_К приводит к потере данных о номере телефона, установленного в к. 109).

Аномалии добавления возникают в случаях, когда информацию в таблицу нельзя поместить до тех пор, пока она не полная, либо вставка новой записи требует дополнительного просмотра таблицы. При добавлении нового сотрудника в табл. С_Т_К противоестественным является заполнение данных о комнате и номере телефона до внесения сведений о сотруднике, особенно, если поле Сотрудник является ключевым. При добавлении новых записей может оказаться, что у сотрудников, сидящих в одной комнате, имеются разные телефоны, т.е. не ясно, то ли в комнате несколько телефонов, то ли какие-то из номеров ошибочные.

25. Понятие функциональной зависимости.Пусть R – это отношение. С одной стороны, оно имеет конкретное (постоянное) значение в данный момент времени. С другой стороны, это переменная, которая в каждый момент времени может принять некоторое новое значение.Понятие ФЗ можно применить и к первому, и ко второму случаю.

Нормализация таблиц.Процесс уменьшения избыточности информации в базе данных называется нормализацией. В теории нормализации баз данных разработаны достаточно формализованные подходы по разбиению данных, обладающих сложной структурой, среди нескольких таблиц. Эти вопросы детально освещаются в специальной литературе. Мы остановимся на некоторых практических аспектах нормализации таблиц, не рассматривая их теоретическое обоснование. Нормализация информационной модели выполняется в несколько этапов. Теория нормализации баз данных оперирует с пятью нормальными формами таблиц (от первой до пятой включительно). Эти формы предназначены для уменьшения избыточной информации от первой до пятой нормальной формы. Поэтому каждая последующая нормальная форма должна удовлетворять требованиям предыдущей формы и некоторым дополнительным условиям. При практическом проектировании баз данных четвертая и пятая формы, как правило, не используются, поэтому мы ограничимся рассмотрением первых трех нормальных форм. Отношения обладают следующими свойствами



Отношение называется нормализованным, если каждая компонента кортежа является простым, атомарным значением, не состоящим из группы значений. Это не позволяет заменять значение атрибута другим: отношением (что привело бы к сетевому или иерархическому отношению).

Метод нормальных форм. 1НФ, 2НФ, 3НФ. Структура отношений может затруднять или делать невозможными операции включения, исключения и обновления информа­ции. Одни и те же данные могут группироваться в таблицы по-разному. Желательна группировка, упрощающая обработку и сводящая к минимуму дублирование инфор­мации. Это достигается рациональной разбивкой атрибутов по частным отношениям. При распределении информации существенна зависимость атрибутов отношения друг от друга. Практически она обнаруживается внимательным анализом семантики атри­бутов (это задача администрации БД).

Существует несколько последовательных уровней нормализации схем отноше­ний, причем каждый последующий вложен в предыдущий. Отношение R находится в первой нормальной форме, если все входящие в него домены содержат только атомар­ные (неделимые) значения. Для второй нормальной формы дополнительно требуется функциональная зависимость каждого неключевого (не входящего в составной ключ) атрибута от первичного ключа. В третьей нормальной форме каждый атрибут дол­жен нетранзитивно зависеть от первичного ключа.





sdamzavas.net - 2019 год. Все права принадлежат их авторам! В случае нарушение авторского права, обращайтесь по форме обратной связи...