| ||||||
|
| |||||
Глоссарий
АГРЕГАЦИЯ ДАННЫХ. Абстракция, позволяющая трактовать связь между элементами модели как новый элемент. АДМИНИСТРИРОВАНИЕ БД. Управление базой данных (БД) как единым информационным ресурсом организации с целью эффективного обслуживания коллектива пользователей. Администрирование БД предполагает выполнение комплекса мероприятий, обеспечивающих точность, непротиворечивость, полноту, защиту и доступность данных в нужной форме, в нужном месте и в нужное время. Это касается вопросов обеспечения информацией как пользователей, так и приложений, работающих с БД. В рамках администрирования БД обеспечивается безопасность БД, осуществляется восстановление БД, производится ее обслуживание, осуществляется обучение пользователей, обеспечивается резервное копирование данных, организуется сопровождение БД, производится тестирование системы, организуется управление доступом пользователей к данным, обеспечивается целостность данных. Ответственность за поддержанием ресурсов БД может быть поделена между администратором данных и администратором базы данных. В некоторых организациях не проводится различия между этими двумя ролями администрирования БД. АДМИНИСТРАТОР БД (АБД). Специалист, отвечающий за управление техническими аспектами системы управления базы данных. Он отвечает за определение данных, разработку программ, ввод данных в БД, удаление данных, поддержание целостности и защиты данных, управление операциями БД. Кроме того, АБД участвует в планировании и разработке БД, в обучении пользователей всех категорий. Для АБД необходимо знание конкретной СУБД и системного окружения. АДМИНИСТРАТОР ДАННЫХ (АД). Специалист, отвечающий за определение и реализацию общей политики по планированию и управлению данными в соответствии со стратегическим планом развития информационной системы корпорации. К обязанностям АД относится планирование развития базы данных, разработка и сопровождение нормативов и стандартов по представлению данных, разработка бизнес-правил и "деловых" процедур, определение процедур сбора и обработки данных, непосредственно не зависящих от систем управления базой данных, концептуальное и логическое проектирование. АД консультирует и дает свои рекомендации руководству корпорации, контролирует соответствие общего направления развития базы данных целям корпорации. АНОМАЛИИ ОПЕРАЦИЙ НАД ДАННЫМИ. Ситуации, которые приводят к противоречивости данных, их непреднамеренной потере, невозможности ввода данных. Различают аномалии обновления, удаления, ввода данных. Аномалия обновления - это противоречивость данных, вызванная их избыточностью и частичным обновлением. Такого рода аномалия может возникнуть, если одни и те же данные хранятся в нескольких таблицах. При обновлении такого рода данных в одной из таблиц эти данные могут быть не обновлены в других таблицах. Аномалия удаления - непреднамеренная потеря данных, вызванная удалением других данных. Если, например, при удалении записей из таблицы ЗАКАЗЫ КЛИЕНТОВ удаляются заказы какого-либо клиента, то может возникнуть ситуация, когда потеряются нужные данные - информация о клиенте. Аномалия ввода - невозможность ввести данные в таблицу, вызванная отсутствием других данных. Например, если в таблице ЗАКАЗЫ КЛИЕНТОВ установлена необходимость наличия заказа, то не представляется возможным добавить в эту таблицу информации о новом клиенте, если он пока не сделал заказ. Исключение возможных аномалий операций над данными обеспечивается разбиением таблиц, в которых могут произойти аномалии, на две или более таблиц. Для этого используются нормальные формы или правила структурирования таблиц. АРХИТЕКТУРА БАЗЫ ДАННЫХ (АРХИТЕКТУРА ANSI-SPARC). Архитектура базы данных, состоящая из концептуального, внешнего и внутреннего уровней. Три уровня абстракции представления БД позволяют реализовать идею отделения логической структуры и манипуляции данными, как они понимаются пользователями, от физического представления, требуемого компьютерным оборудованием. На концептуальном уровне осуществляется концептуальное проектирование БД. Оно включает анализ информационных потребностей пользователей и определение необходимых им элементов данных. Внешний уровень составляет пользовательское представление данных БД. Каждая пользовательская группа получает свое представление данных в БД. Каждое представление данных дает ориентированное на пользователя описание элементов данных и отношений между ними. Внутренний уровень отражает представление БД на физическом уровне. За этот уровень отвечают разработчики БД. На этом уровне определяются индексы, указатели, методы доступа. Выгода трехуровневой архитектуры БД является независимость физического и логического представления данных. Трехуровневый подход к построению архитектуры БД был предложен в 1975 году Комитетом планирования стандартов и норм SPARC (Standards Planning and Requirements Committee) Национального Института Стандартизации США (American National Standard Institute -ANSI). АТОМАРНОСТЬ ДАННЫХ. Свойство данных, означающее их неделимость для операций используемой модели представления и обработки данных. Т.е. данные рассматриваются, адресуются и обрабатываются как единое целое (как одно значение). АТРИБУТ. Поименованная характеристика сущности. Например, сущность ГРАЖДАНИН может включать в себя следующие характеристики (атрибуты): НОМЕР ПАСПОРТА, ФАМИЛИЯ, ИМЯ, ОТЧЕСТВО, ГОД РОЖДЕНИЯ и др. С помощью атрибутов может быть идентифицирован экземпляр сущности. Атрибут может быть использован для представления связей между сущностями. Например, сущности ГРАЖДАНИН и ЗАКАЗ могут быть связаны между собой посредством атрибута НОМЕР ПАСПОРТА. При этом атрибут НОМЕР ПАСПОРТА должен быть включен в сущность ЗАКАЗ. Атрибуты могут быть ключевыми и описательными. Ключевой атрибут идентифицирует сущность. Описательный атрибут описывает одну из его характеристик. В рассматриваемом примере оправданно выбрать в качестве ключевого атрибута атрибут НОМЕР ПАСПОРТА, а в качестве описательных атрибутов все остальные. Каждый атрибут имеет набор свойств. Так например: размер, формат, маска ввода, значение по умолчанию, условие на значение, обязательность для ввода, список допустимых значений.
БАЗА ДАННЫХ (БД). Совокупность специальным образом организованных, логически связанных данных, предназначенных для обеспечения информационных потребностей организации. Другими словами БД это множество взаимосвязанных единиц данных, которые могут обрабатываться одной или несколькими прикладными системами. БД наряду с системой управления базой данных (СУБД), оборудованием и пользователями БД входит в состав системы баз данных. По сфере применения БД подразделяются на специальные и универсальные. По месту расположения данных БД подразделяются на локальные (персональные), общие (интегрированные) и распределенные. При проектировании и реализации БД используются модели данных - концептуальные способы структурирования данных. Наиболее известными моделями данных являются иерархическая, сетевая и реляционная. Процесс проектирования БД может быть представлен следующими этапами: формулировка и анализ требований, концептуальное (инфологическое) проектирование, проектирование реализации (датологическое проектирование), физическое проектирование. БАЗОВАЯ ТАБЛИЦА. Таблица базы данных, содержащая реально хранимые на носителе данные. Структура и взаимосвязь базовых таблиц разрабатывается на этапах проектирования БД. На основе одной или нескольких базовых таблиц СУБД может формировать виртуальные таблицы (представления, хранимые запросы). В отличии от базовой таблицы, виртуальная таблица данных реально на носителе не хранится. Хранится лишь сам запрос, который создает виртуальную таблицу по требованию пользователя. Базовая таблица данных хранится на носителе. БАЗОВЫЙ ЯЗЫК. Язык программы, в которую могут быть включены команды структурированного языка запросов SQL. Для каждой СУБД в качестве базового языка могут выступать различные языки : си, паскаль, бейсик и др. БАЗЫ ДАННЫХ КЛИЕНТ/СЕРВЕР. База данных, функционирующая в локальной сети, состоящей из клиентских компьютеров, которые обслуживает компьютер-сервер. На серверном компьютере запускается программа - сервер базы данных. Эта программа обслуживает доступ клиентов к базе данных. На клиентских компьютерах запускаются прикладные программы, которые выполняют запросы к БД, установленной на сервере БЕЗОПАСНОСТЬ ДАННЫХ. Свойство БД, которое характеризуется сведением к минимуму неправильного использования и повреждения данных пользователями. Администратор базы данных разрабатывает процедуры контроля, предотвращающие неправильное использование данных. Он назначает права исходной группе пользователей. Затем владельцы данных могут предоставлять доступ к данным другим пользователям. Доступы различаются: доступ только к некоторой части данных, доступ только для чтения, доступ с правом обновления. Доступ к БД контролируется специальным механизмом, например с использованием паролей. Таким образом снижается риск того, что данные одной группы пользователей будут повреждены другой группой. С обеспечением безопасности данных связана проблема целостности данных - точности и непротиворечивости данных, хранящихся в БД. Целостность данных обеспечивается написанием и использованием программ, контролирующих ввод данных в БД. В случае отказа оборудования для обеспечения безопасности данных предусматривают использование процедур резервного копирования и восстановления БД. В процессе параллельной обработки данных при многопользовательском режиме данные могут быть повреждены. В связи с этим необходимо реализовать мероприятия, не допускающие повреждения данных в процессе их параллельной обработки. Для неуязвимости данных со стороны несанкционированного доступа к ним используются средства шифровки данных. БЛОКИРОВКА ЗАПИСЕЙ. Предотвращает доступ к записи другой транзакции, пока первая транзакция не выполнит своих действий. Средства блокировки обеспечивают безопасность данных в случае параллельной обработки данных. БРОУЗЕР (WEB-броузер). Специальное клиентское программное обеспечение для WEB-среды, которое обеспечивает доступ к набору Интернет-сервисов. В ВОЗМОЖНЫЙ КЛЮЧ. Это атрибут или совокупность атрибутов, которые являются идентифицирующими атрибутами сущности и могут выступать в качестве первичного ключа для сущности после соответствующего их описания. ВОССТАНОВЛЕНИЕ БД. Приведение БД в состояние, существовавшее незадолго до ее отказа. База данных приводится в состояние, которое она имела на момент начала незавершенных транзакций, а затем выполняются эти транзакции. В восстановлении после отказов ключевую роль играет протокол, в котором фиксируются все изменения вносимые в БД, а также состояние каждой транзакции. ВТОРАЯ НОРМАЛЬНАЯ ФОРМА. Отношение приведено ко второй нормальной форме, если каждый неключевой атрибут функционально полно зависит от ключевого атрибута. Под функциональной зависимостью понимают ситуацию, когда значение атрибута в кортеже однозначно определяет значение другого атрибута в кортеже. Например, отношение ВЕДОМОСТЬ=(СТУДЕНТ, ДИСЦИПЛИНА, ПРЕПОДАВАТЕЛЬ, ОЦЕНКА) не находится во второй нормальной форме, т.к. атрибут ПРЕПОДАВАТЕЛЬ не находится в функционально полной зависимости от составного ключа СТУДЕНТ+ ДИСЦИПЛИНА. Атрибут ПРЕПОДАВАТЕЛЬ зависит только от атрибута ДИСЦИПЛИНА и не находится в функционально полной зависимости от составного ключа. Для приведения отношения ВЕДОМОСТЬ ко второй нормальной форме его надо разбить на два отношения УСПЕВАЕМОСТЬ и ПРЕПОДАВАТЕЛЬ. ВТОРИЧНЫЙ КЛЮЧ. Это атрибут или совокупность атрибутов, которые используются в операции поиска требуемых данных в таблице. Д ДАННЫЕ. Информация, фиксированная в определенной форме, пригодной для хранения, обработки и передачи. Примером компонентов первичных данных являются знаки естественного языка. Для использования в автоматизированных информационных системах эти знаки кодируются. Элементом данных является наименьшая семантически значимая единица информации. Данные после их интерпретации становятся информацией. Офисная информационная система хранит данные, которые обычно относятся к управлению. Это различные управленческие документы, счета, электронная почта и т.п. Однако современные системы могут работать и с такими данными, как электронные таблицы, фотографии, голосовые комментарии к тексту, диаграммы, аудио- и видеозаписи, географические данные и др. ДАТОЛОГИЧЕСКОЕ ПРОЕКТИРОВАНИЕ БД. Построение моделей данных и их взаимосвязей в терминах инструментальных средств проектирования БД. Строится на базе информационно-логической модели данных. В качестве моделей данных выступают сами данные, их структурная композиция, правила построения. При построении модели используются форматы данных и состав операций конкретной СУБД. В процессе датологического проектирования используются две группы конструкций языка: декларативного и процедурного типов, Совокупность операций языка определяет модель данных и является формализмом для описания структур данных и процессов изменения их состояний для моделирования реальных процессов. При датологическом проектировании строятся схемы данных. В процессе датологического проектирования определяется состав БД, проверяется адекватность модели предметной области, оценивается эффективность предложенных структур данных. ДЕКОМПОЗИЦИЯ СХЕМ ОТНОШЕНИЙ. Операция замены схемы отношения совокупностью ее подсхем, причем таких, что их объединение вновь приводит к исходной схеме. ДЕЛЕНИЕ ОТНОШЕНИЙ. Реляционный оператор, результатом выполнения которого является отношение, содержащее только те атрибуты делимого, которых нет в делителе. Деление отношений - бинарный оператор. Атрибуты отношения делителя должны содержаться в отношении - делимом и базироваться на одинаковых доменах. Например, если в качестве делимого используется отношение ЭКЗАМЕЦИОННЫЕ ВЕДОМОСТИ, в которой представлены атрибуты ФАМИЛИЯ, ДИСЦИПЛИНА и ОЦЕНКА, а в качестве делителя отношение ОЦЕНКИ с атрибутами ДИСЦИПЛИНА и ОЦЕНКА, то результатом деления будет третье отношение с единственным атрибутом ФАМИЛИЯ. В этом отношении будут присутствовать фамилии студентов, получивших оценки по дисциплинам, которые представлены в отношении делителе. Ж ЖИЗНЕННЫЙ ЦИКЛ БАЗЫ ДАННЫХ. Процесс проектирования, реализации и поддержание системы баз данных. З ЗАПИСЬ Блок данных. Различают логические и физические записи. Логическая запись представляет собой поле или набор полей. Физическая запись - физический блок данных. Понятие записи используется на всех уровнях проектирования баз данных с различной степенью детализации их описания. Запись является минимальной доступной единицей данных. Обычно физические записи хранятся в одном из следующих четырех форматов: фиксированной длины, деблокированные; фиксированной длины, блокированные; переменной длины, деблокированные; переменной длины , блокированные. Если записи блокированы, то каждая физическая запись состоит более чем из одной логических записей. Для записей переменной длины и блокированных предусмотрены соответственно области длина записи и длина блока. ЗАПРОС. Средство просмотра, анализа и изменения данных из одной или нескольких таблиц. Сам запрос не содержит данных, но позволяет выбирать данные из таблиц и выполнять над ними ряд операций. Результатом выполнения запроса могут быть вновь созданные таблицы, измененные таблицы, выборка из одной или более таблиц. Запросы, связанные с изменениями таблиц, позволяют удалять записи по какому-либо критерию, добавлять записи в таблицы из других таблиц, модифицировать значения полей. Запросы на выборку позволяют: выводить отсортированную информацию по значению любых полей таблицы; фильтровать выводимую информацию с использованием в качестве фильтра математических выражений, в которых могут быть задействованы значения полей и параметров; группировать выводимые данные по различным полям; преобразовывать представление выводимой информации к виду удобному для ее восприятия. В современных СУБД для создания типовых запросов используются средства создания по образцу. Пользователю предоставляется специальные бланки, в которых он указывает таблицы и запросы на основе которых формируется запрос, выводимые поля, способ сортировки, условие отбора, тип запроса и др. В реляционных базах данных и некоторых других приложениях для создания запросов предусмотрено использование специального языка запросов SQL - структурированного языка запросов. И ИЗБЫТОЧНОСТЬ ДАННЫХ. Дублирование данных в базе данных. Избыточность данных может возникнуть при непродуманном проектировании реляционных таблиц. Например, в таблице КНИГИ хранится информация об издательствах, в которых изданы книги. Так как каждое издательство выпустило не одну книгу, то информация об одном и том же издательстве в таблице КНИГИ будет дублироваться столько раз сколько книг это издательство выпустило. В результате этого неоправданно расходуется память компьютера. Для исключения избыточности данных в приведенном примере необходимо спроектировать вторую таблицу ИЗДАТЕЛЬСТВА, а затем связать две таблицы между собой. Для исключения избыточности данных выполняется процесс нормализации отношений. В некоторых случаях избыточность может вводиться искусственно при проектировании БД с целью повышения скорости обработки запросов пользователей, или с целью повышения надежности системы в условиях работы со сбоями. ИЕРАРХИЧЕСКАЯ МОДЕЛЬ ДАННЫХ. Модель данных, в которых связи между данными имеют вид древовидной иерархической структуры. Например, база данных КЛИЕНТЫ может строиться на основе следующей модели. На верхнем уровне иерархии данные о КЛИЕНТАХ. КЛИЕНТУ подчинены его СЧЕТА, СЧЕТАМ в свою очередь подчинены СТРОКИ СЧЕТОВ. В иерархической базе данных эти файлы связываются между собой физическими указателями, или полями данных, добавленных к отдельным записям. Каждая запись о клиенте содержит указатель первой записи счета этого клиента. В свою очередь, записи счетов содержат указатели на другие записи счетов и на записи строк счетов. ИНФОРМАЦИЯ. Сведения о каком-либо событии, явлении, процессе или объекте. Во всех предметных областях основополагающую роль играют операции сбора, передачи, хранения и переработки информации. Количественными аспектами информации занимается теория передачи информации Качественными аспектами информации занимается теория информационных систем. В последнем случае важен смысл информации, ее содержание. Информация представляет собой содержание данных, которому придается смысл в определенном контексте. Информация кодируется с помощью данных. ИНФОРМАЦИОННАЯ СИСТЕМА. Автоматизированная система, организующая данные в целях получения информациии. Под информационной системой можно обозначать любые совокупности данных и методов их обработки. Примерами информационных систем являются прикладные программы, текстовые процессоры, электронные таблицы, системы доказательства теорем, информационно-поисковые системы, системы баз данных и др. К КОНЦЕПТУАЛЬНОЕ ПРОЕКТИРОВАНИЕ БД. Создание модели предметной области в форме, доступной для понимания пользователем, Эта модель служит для достижения взаимопонимания между различными группами пользователями, а также между пользователями и разработчиками БД. Такая модель строится без учета физического представления данных в конкретной СУБД и называется инфологической моделью предметной области. Для описания инфологической модели могут быть использованы различные средства, в том числе и естественный язык. Но из-за громоздкости описания модели на естественном языке и неоднозначности его трактовки обычно используются формализованные языки. Так как модель должна обеспечивать ввод новых данных без изменения существующих, то она должна обладать свойством расширяемости. Инфологическая модель обычно строится совместно потенциальными пользователями и разработчиками БД. На этапе ее построения осуществляется структуризация данных и описание связей между ними. Представление информационной структуры обычно реализуется в графической форме. Инфологическая модель БД строится на основе этапа формулировки и анализа требований к БД. В свою очередь она используется для этапа даталогического проектирования БД. КЛИЕНТ БД. Это так называемый "клиентский" процесс, требующий для своей работы определенных ресурсов, в том числе, как правило, и сетевых (однако, в некоторых случаях клиентский процесс может выполняться на том же компьютере, что и серверный процесс). В контексте базы данных клиент БД управляет пользовательским интерфейсом и логикой приложения. Клиент БД принимает от пользователя запрос, проверяет синтаксис и генерирует запрос к базе данных в соответствии с логикой приложения. Затем передает запрос серверному процессу и ожидает ответа. Сервер принимает запрос от клиента, обрабатывает поступивший к базе данных запрос и затем посылает ответ на запрос обратно клиенту. Клиент БД, получив ответ, форматирует поступившие от сервера данные и представляет их пользователю. КЛЮЧ ПЕРВИЧНЫЙ. Первичный ключ - это набор атрибутов, однозначно определяющих каждую строку реляционной таблицы. Ключ состоящий более чем из одного атрибута называется составным ключем. Первичный ключ должен удовлетворять требованиям уникальности и минимальности. Уникальность - для любой пары кортежей рассматриваемого отношения найдется хотя бы один атрибут, значение которого в этой паре кортежей различны. Минимальность - ни один из атрибутов не может быть удален из ключа без нарушения требования уникальности. В реляционной таблице может оказаться более одного набора атрибутов, который можно выбрать в качестве первичного ключа. Такой набор называется потенциальным или возможным ключом. Один из возможных ключей объявляется первичным, остальные альтернативными. Первичный ключ это потенциальный ключ, выбранный для преимущественного использования в целях однозначного определения строк таблицы. Внешний ключ это набор атрибутов одной таблицы, являющийся первичным ключом другой таблицы. Внешний ключ используется для организации логических связей между таблицами. Они используются для того, чтобы связать данные одной таблицы с данными в другой таблице. В некоторых СУБД допускается, что атрибуты внешнего ключа не обязательно должны иметь те же имена, что атрибуты первичного ключа, которым они соответствуют, но они должны базироваться на одних и тех же доменах. КОНСТРУКТОРЫ ОБЪЕКТОВ БД. Инструментальные средства, позволяющие описывать и редактировать объекты БД. В инструментальных средствах СУБД предусматриваются визуальные средства, которые позволяют проектировать таблицы, связи между таблицами, формы, запросы, отчеты, макросы без использования языков описания данных и манипулирования данными. При этом могут быть задействованы соответствующие панели инструментов и панели элементов, использование которых обеспечивает оперативное и удобное описание элементов объектов БД, описание их свойств. КОНТРОЛЬ ДОСТУПА. Комплекс средств и мероприятий, позволяющих избежать несанкционированный доступ к данным. Средства контроля особенно важны при совместном использовании данных. КОНТРОЛЬ ПАРАЛЛЕЛЬНОЙ ОБРАБОТКИ. Средства поддержания целостности данных при многопользовательском режиме работы. Возможны ситуации, когда двое пользователей одновременно обращаются к одной записи, чтобы произвести над ней некоторые транзакции. СУБД должна ограничить доступ одного из пользователей, пока транзакция второго не завершиться. Без таких средств нарушается точность и непротиворечивость данных М МАКРОС. Небольшая программа на языке макрокоманд системы. С помощью макросов можно определять реакцию приложения на различные события в формах и отчетах. Например, на такие события, как нажатие кнопок, изменение данных, открытие и закрытие форм, получение фокуса элементом управления и др. Макрос в СУБД представляет собой структуру из одной или более макрокоманд, которые выполняются последовательно, либо в порядке, заданном определенными условиями. Использование макросов во многих случаях позволяет избежать программирования на языках управления данными. Каждая макрокоманда имеет имя и, возможно, один или несколько аргументов, которые задаются разработчиком БД. Использование макросов оправдано тем, что их легко создавать и во многих случаях отпадает необходимость в использовании языков программирования. МАСТЕРА СОЗДАНИЯ ОБЪЕКТОВ БД. Инструментальные средства, которые упрощают выполнение типовых операций при разработке баз данных. Используются для проектирования таблиц, форм, запросов, отчетов. Разработчику объекта БД предлагается выполнить последовательность шагов, при выполнении которых описывается состав и свойства объекта. На каждом шаге необходимо выбрать или ввести варианты ответов. Мастера позволяют существенно сократить время проектирования типовых объектов, свести к минимуму возможность внесения ошибок. МНОГОЗНАЧНАЯ ЗАВИСИМОСТЬ. Пусть задана некоторая схема отношения R, а X и Y - подмножества R. Говорят, что существует многозначная зависимость Y от X, если при заданных значениях атрибутов Х существует множество, состоящее из нуля или более ассоциированных значений атрибутов Y, и это множество не связано каким либо образом со значениями атрибутов (R-X-Y). МОДЕЛЬ ПРЕДМЕТНОЙ ОБЛАСТИ. Формализованное описание предметной области. Модель используется для исследования и проектирования объектов предметной области и связи между ними. При построении модели необходимо абстрагироваться от свойств объектов, не существенных с точки зрения задач, решаемых на основе использования модели. Основным требованием к модели является адекватное отображение предметной области. Модель в полной мере должна отображать предметную область без учета несущественных для решаемой проблемы свойств предметной области. В связи с этим средства представления модели должны обладать достаточными выразительными возможностями для отображения предметной области и явлений и процессов, имеющих в ней место. Модель должна быть непротиворечивой. Она должна быть единым интегрированным описанием предметной области и однозначно отражать взгляды и потребности всех пользователей системы, для построения которой разрабатывается модель. Н НОРМАЛИЗАЦИЯ ОТНОШЕНИЙ. Процесс преобразования реляционных таблиц в стандартную форму. Одни и те же данные могут группироваться в отношения различными способами. Определенный набор отношений обладает лучшими свойствами при хранении и обработке данных, если он приведен к нормальным формам. Таблица может быть представлена в виде нескольких таблиц, а затем при необходимости из этих таблиц с помощью операций реляционной алгебры можно восстановить первоначальную таблицу. Нормализация отношений - формальный аппарат ограничений на формирование отношений, который позволяет устранить дублирование данных, обеспечить их непротиворечивость, уменьшить затраты на ведение БД. НОРМАЛЬНЫЕ ФОРМЫ. Совокупность требований к отношениям, выполнение которых обеспечивает их нормализацию. Как правило, для нормализации отношений используются 4-е нормальные формы. В тех случаях, когда необходимо получить отношение без зависимости от соединения, используется 5-я нормальная форма (проектно - соединительная нормальная форма).. О ОПЕРАЦИИ С ДАННЫМИ. Любая СУБД позволяет выполнить четыре простейшие операции с данными: добавить в таблицу одну или несколько записей, удалить из таблицы одну или несколько записей, обновить значения некоторых полей в одной или нескольких записях, найти одну или несколько записей, удовлетворяющих заданному условию. Для выполнения этих операций используется механизм запросов. ОДНОПОЛЬЗОВАТЕЛЬСКИЕ БД. Базы данных установленные и используемые на одном компьютере. Такие БД используются в случае отсутствия необходимости доступа к данным с других компьютеров, а также из за соображений обеспечения секретности хранимой в БД информации. Проектирование однопользовательских БД менее трудоемко по сравнению с проектирование распределенных БД или БД типа клиент-сервер. ОТНОШЕНИЯ. В реляционной модели данных отношение это подмножество декартова произведения доменов. Домен - некоторое множество элементов (например, множество целых чисел или множество допустимых значений, которые может принимать объект по некоторому свойству и т.п.). Каждому атрибуту в реляционной модели ставится в соответствие множество его значений - домен атрибута. Т.е. можно сказать, что отношение это структура данных, построенная на доменах атрибутов. Над отношениями выполняются реляционные операции. Отношение состоит из заголовка и тела. Заголовок включает фиксированное множество атрибутов. Тело отношения состоит из конечного множества кортежей - множества пар вида (атрибут-значение атрибута). Число кортежей в отношении и их содержимое может меняться. Степенью отношения называется число атрибутов в отношении. Мощностью отношения называется количество кортежей в отношении. Для отношения определяется первичный (и, если есть, возможный) ключ отношения. ОТЧЕТ. Представление пользователям БД необходимой информации, оформленной в виде отчетных документов. Эти документы можно просматривать и выводить на печать. Источником данных для отчета может служить таблица или запрос. Наряду с данными, полученными из таблиц или запросов, в отчете могут отображаться результаты вычислений над исходными данными. В отчетах, как правило, могут быть задействованы области заголовка и примечания отчета, области верхнего и нижнего колонтитулов, области заголовка и примечания групп. П ПАРАЛЛЕЛЬНАЯ ОБРАБОТКА. Возникает, когда два или более пользователя требуют доступа к одной и той же записи БД примерно в одно и тоже время. ПЕРВАЯ НОРМАЛЬНАЯ ФОРМА. Отношение приведено к первой нормальной форме, если все его атрибуты атомарны. Другими словами, ни один из элементов отношения сам не должен быть отношением. Например, если в процессе описания отношения ПОСТАВКА один из его атрибутов ПОСТАВЩИК является в свою очередь отношением, включающим атрибуты ФИО, ТЕЛЕФОН, то такое отношение не приведено к первой нормальной форме. Для приведения отношения к первой нормальной форме нужно избавиться от сложного атрибута ПОСТАВЩИК и заменить этот атрибут на два простых ФИО ПОСТАВЩИКА и ТЕЛЕФОН ПОСТАВЩИКА. ПОЛЕ. Столбец таблицы. Таблицы можно представить как реализацию отношения. Они представляют собой набор столбцов и строк. Записи - это строки таблицы, которые включают в себя одно или более значений полей. Поля описывают те характеристики таблицы, которые разработчики БД считают важными. ПРЕДМЕТНАЯ ОБЛАСТЬ (ПО). Часть реального мира, которая представляет интерес для исследования, использования. В качестве предметной области могут выступать люди организации, явления природы, исторические сведения и многое другое. На начальным этапе проектирования БД проводиться анализ предметной области, осуществляется выделение ее объектов и связей между ними. ПРОИЗВЕДЕНИЕ ОТНОШЕНИЙ. Бинарный реляционный оператор. Произведение отношений - множество всех кортежей, полученных объединением одного кортежа первого из исходных отношений и и одного кортежа второго отношения. Степень результирующего отношения равна сумме степеней отношений операндов, мощность результирующего отношения равна произведению мощностей исходных отношений. Атрибуты отношений операндов не должны совпадать. Например, в качестве исходных отношений используются отношения СТУДЕНТ = (ФАМИЛИЯ) и СПИСОК КНИГ = (НАЗВАНИЕ КНИГИ). Результатом выполнения операции произведения над этими отношениями будет отношение КНИГИ ВЫДАННЫЕ СТУДЕНТУ = (ФАМИЛИЯ, НАЗВАНИЕ КНИГИ). Количество кортежей результирующего отношения будет равно произведению числа кортежей исходных отношений. Таким образом в результирующем отношении каждому студенту будут поставлены в соответствие все книги отношения КНИГИ ВЫДАННЫЕ СТУДЕНТУ. ПРОЕКЦИЯ ОТНОШЕНИЙ. Бинарный реляционный оператор. Результатом его выполнения является вычеркивание из исходной таблицы столбцов, соответствующим указанным атрибутам, которые не входят в указанный набор. Если после вычеркивания некоторые строки оказались совпадающими, то повторяющиеся строки вычеркиваются. Например, если выполняется оператор проекции к отношению СОТРУДНИК=(ОТДЕЛ, ФАМИЛИЯ. ПРОЕКТ) по набору атрибутов ОТДЕЛ, ПРОЕКТ, то в результате будет получено новое отношение РАСПРЕДЕЛЕНИЕ ПРОЕКТОВ ПО ОТДЕЛАМ=(ОТДЕЛ, ПРОЕКТ). В результирующем отношении отсутствуют фамилии сотрудников и одинаковые кортежи. Р РАСПРЕДЕЛЕННЫЕ БД. Система, у которых данные размещены на нескольких компьютерах. В распределенных БД не все данные хранятся централизовано, они распределены по сети узлов. Каждый узел имеет свою БД и он может обращаться к данным, хранящихся на других узлах. Программное обеспечение БД организует согласованное взаимодействие данных при работе пользователей. Использование БД такого рода позволяет добиваться быстрого доступа к наиболее часто используемым данным, повышает надежность хранения данных и независимость от сбоев работы других компьютеров. РЕЗЕРВНОЕ КОПИРОВАНИЕ И ВОССТАНОВЛЕНИЕ ДАННЫХ. Средства обеспечивающие восстановление БД в случае отказа системы. РЕЛЯЦИОННАЯ МОДЕЛЬ ДАННЫХ. Модель данных, представляющие данные в виде таблиц. В основе построения модели лежит идея, что данные нужно связывать в соответствии с их внутренними логическими взаимоотношениями, а не физическими указателями. Внешнее представление данных и простота проектирования БД наилучшим образом реализуется когда данные представлены в виде отношений (реляционное представление). Реляционная таблица обладает следующими свойствами: каждый элемент таблицы представляет собой один элемент данных; все элементы в столбце имеют одинаковый тип; каждый столбец имеет уникальное имя; одинаковые строки в таблице отсутствуют; порядок следования столбцов и строк может быть произвольным. В реляционной модели целые файлы могут обрабатываться одной командой. Сегодня реляционные БД рассматриваются как стандарт для современных коммерческих систем работы с данными. РЕЛЯЦИОННЫЕ ОПЕРАТОРЫ. Набор операторов, которые описывают изменение состояния отношений. Операндами реляционных операторов является одно или два отношения. Они называются соответственно унарным и бинарным операторами. Результатом применения реляционного оператора является единственное отношение. С СВЯЗИ СУЩНОСТЕЙ. Отображение взаимодействия сущностей между собой. Например сущности СТУДЕНТ и СТИПЕНДИЯ могут взаимодействовать между собой посредством связи СТУДЕНТ ПОЛУЧАЕТ СТИПЕНДИЮ. По классу принадлежности связи подразделяются на обязательные, необязательные и возможные. В обязательной связи существование обеих сущностей зависит от связи. Для необязательных связей существование обеих сущностей в связи не зависит от связи. Для возможной связи существование одной из сущностей в связи зависит от связи. Связи характеризуются по степени связи. Эта характеристика показывает сколько элементов одной сущности и сколько элементов другой сущности связаны между собой. По степени связи различают четыре типа связей. Связь "один ко одному" такой тип связи между сущностями, когда каждому экземпляру одной сущности соответствует один и только один экземпляр другой сущности и наоборот. Связь "один ко многим" такой тип связи, когда одному экземпляру первой сущности может соответствовать 0, 1 или несколько экземпляров второй сущности. Связь "многие к одному" тип связи обратный связи "один ко многим". Связь "многие ко многим" такой тип связи, когда с одним экземпляром первой сущности может быть связано 0, 1 или несколько экземпляров второй сущности. И наоборот когда с одним экземпляром второй сущности может быть связано 0, 1 или несколько экземпляров первой сущности. СЕЛЕКЦИЯ ОТНОШЕНИЙ. Унарный реляционный оператор. Результатом выполнения селекции является вычеркивание из исходного отношения тех строк, для которых не выполнятся поставленное условие. Результатом выполнения оператора селекция является отношение, для каждого кортежа которого выполняется поставленное условие. Например, если для отношения СОТРУДНИКИ в качестве условия будет указано ВОЗРАСТ > 60, то в результирующем отношении будут представлены сотрудники старше 60 - лет. СЕРВЕР БД. Компьютер, обслуживающий клиентов и обеспечивающий их доступ к БД расположенной на сервере. СЕТЕВАЯ МОДЕЛЬ ДАННЫХ. Модель поддерживающее такое отношение между данными, когда каждая запись может быть подчинена записям более чем из одного файла. В отличии от иерархической модели данных, в которой у каждой подчиненной записи в иерархии может быть только одна подчиняющая запись в иерархии, в сетевой модели данных к у каждой подчиненной записи в иерархии может быть несколько подчиняющих записей в иерархии. СИСТЕМЫ УПРАВЛЕНИЯ БАЗАМИ ДАННЫХ (СУБД). Программное обеспечение, осуществляющее управление базой данных. СУБД - средство, с помощью которого прикладные программы или пользователи работают с данными базы. При выборе СУБД следует исходить из ее возможностей и ограничений. Степень их важности определяется прикладными аспектами разрабатываемой БД. В частности при выборе СУБД следует обращать внимание на следующие возможности: контроль доступа, контроль параллельной обработки, средства резервного копирования и восстановления, средства шифровки. СКОРОСТЬ ОБМЕНА ДАННЫМИ. Скорость, с которой данные могут считываться в оперативную память, или скорость, с которой данные записываются из оперативной памяти на диск. СЛОВАРЬ ДАННЫХ. Часть СУБД, определяющая структуру пользовательских данных и то, как они могут использоваться. Подсистема словаря следит за определением всех элементов данных базы. Словарь отслеживает отношения, существующие между различными группами данных. Кроме того, он поддерживает индексы, служащие для быстрой сортировки и обращения к данным. Словарь отслеживает установки формата вывода данных. СОЕДИНЕНИЕ ОТНОШЕНИЙ. Бинарный реляционный оператор. В каждом исходном отношении выделяется атрибут, базирующийся на одном домене, по которому будет производится соединение. Соединением является множество всех кортежей, каждый из которых получен объединением одного кортежа из первого отношения и одного кортежа второго отношения таких, что выполняется условие соединения. Если условие соединение равенство, то соединение называется эквисоединением. Например, в качестве исходных отношений выступают отношения СОТРУДНИК = (ФАМИЛИЯ, НОМЕР, ДОЛЖНОСТЬ) и ВИД ДЕЯТЕЛЬНОСТИ = (ПРОЕКТ, НОМЕР). В качестве условия соединения возьмем равенство атрибутов НОМЕР. В результате выполнения операции соединения этих отношений сформируется отношение УЧАСТНИКИ ПРОЕКТА = (ФАМИЛИЯ, НОМЕР, ДОЛЖНОСТЬ, ПРОЕКТ). В результирующем отношении представлены только те кортежи первого и второго отношений, в которых значения атрибута НОМЕР совпадают. СТРУКТУРИРОВАННЫЙ ЯЗЫК ЗАПРОСОВ SQL. Язык, предназначенный для взаимодействия с реляционными БД. SQL принят в качестве стандарта языка коммуникации реляционных БД. Конкретные реализации SQL несколько отличаются друг от друга и используют расширение стандарта. Типы команд SQL: язык определения данных, язык манипулирования данными, язык запросов, язык управления данными. В SQL задействованы команды администрирования данных, команды управления транзакциями. Команды определения данных используются для определения структур БД, позволяют создавать, изменять удалять таблицы. Команды манипулирования данными используются для манипулирования информацией внутри объектов реляционной БД. Язык запросов служит для выборки данных. Это наиболее известный язык для разработчиков БД. Язык управления данными позволяет управлять доступом к информации находящейся в БД. Команды администрирования данных позволяют осуществлять контроль за действиями выполняемыми пользователями, могут использоваться для анализа производительности системы. Команды управления транзакциями используются для сохранения результатов транзакции, отмены результатов транзакции, создания внутри транзакции точек отката. СТРУКТУРЫ ДАННЫХ. Представления данных, используемые на различных уровнях проектирования БД. Различают 4-е логические структуры: поле, запись, файл, набор файлов. Структуризация данных базируется на концепциях агрегация и обобщение. Понятие агрегации используется для комбинирования полей в запись. Понятие обобщение используется для представления экземпляров записей файлами. СУЩНОСТЬ. Основное содержание явления или процесса, о котором собирается информация. Сущности выделяются в процессе анализа предметной области. Сущность это предмет интереса разрабатываемой и используемой БД, то о чем можно собирать информацию. Например, если в качестве предметной области рассматривается предприятие, то в ней можно выделить следующие сущности: сотрудники, подразделения, помещения и др. Сущности могут быть реальными и абстрактные. Например, направления деятельности предприятия абстрактные сущности. Тип сущности это понятие, которое относится к набору однородных объектов. Экземпляр сущности - конкретный объект в наборе. Сущность характеризуется набором свойств, атрибутов. Например, сущность СОТРУДНИК может характеризоваться атрибутами ТАБЕЛЬНЫЙ НОМЕР, ФАМИЛИЯ, ДОЛЖНОСТЬ и др. Сущность часто отождествляют с объектом. СХЕМА ДАННЫХ. Описание структуры данных на формальном языке. Схема данных описывает статические свойства данных. Т ТАБЛИЦА. Способ реализации объекта реляционной модели. В таблице данные расположены в виде полей и записей, соответственно в виде столбцов и строк. В процессе описания таблиц в СУБД им присваивают имена и определяют структуру, т.е. определяют поля, из которых состоит таблица. Для каждого поля определяются его свойства: размер, формат, маска ввода, начальное значение, обязательность ввода и др. Определяют индексные и ключевые поля. ТИПЫ ОБЪЕДИНЕНИЯ ТАБЛИЦ. В процессе проектировании БД при описании связей между таблицами задается тип объединения таблиц. Он используется по умолчании при создании запросов на основе связанных таблиц. Тип объединения таблиц может задаваться и при описании запросов на основе нескольких таблиц. Причем это справедливо как для запросов создаваемых по образцу, так и для запросов создаваемых на основе использования языка SQL. Различают три типа объединения таблиц: внутреннее объединение - объединение только тех записей таблиц, в которых связанные поля обеих таблиц совпадают; левое внешнее объединение - объединение всех записей первой таблицы и только тех записей второй таблицы, в которых связанные поля совпадают; правое внешнее объединение - объединение всех записей второй таблицы и только тех записей первой таблицы, в которых связанные поля совпадают. Как видно из определения, правое внешнее объединение становиться левым внешним, если таблицы поменять местами. ТРАНЗАКЦИЯ. Программа, исполнение которой не нарушает непротиворечивости БД. Транзакции взаимодействуют с распределенными БД. В этом случае транзакция не сводится к одному процессу, контролируемому одним программным модулем. Она может вызывать несколько процессов в различных узлах, контролируемыми независимыми программными модулями. Каждый из процессов, взаимодействующий внутри транзакции называется агентом. Транзакция, состоящая из одного агента, называются локальными транзакциями. Транзакции, для которых необходимо несколько агентов, называются глобальными транзакциями. Если БД непротиворечива до выполнения транзакции, то она должна оставаться непротиворечивой и после ее выполнения. Для выполнения этого условия транзакции должны быть неделимыми. Это означает, либо все действия, связанные с транзакцией, выполняются до конца, либо ни одно из них не выполняется. Например, создана транзакция для выполнения двух действий: фиксация факта продажи товара покупателю и отражения соответствующего уменьшение количества товара на складе. Если второй шаг не выполнился, то баланс счетов не сойдется. Такая транзакция называется прерванной. Для исключения такого рода ситуаций во время выполнения транзакции все записанные операции задерживаются до тех пор, пока не будет выполнено последнее действие транзакции. Результаты обновления записываются в протокол транзакций. Когда все действия выполнены, информация об обновлении из протокола используется для переноса информации в соответствующие записи данных. Если система дает отказ до завершения выполнения транзакции, то информация из протокола не переносится в эти записи. ТРЕТЬЯ НОРМАЛЬНАЯ ФОРМА. Отношение приведено к третьей нормальной форме, если устранены транзитивные зависимости между атрибутами отношения. Транзитивная зависимость имеет место в том случае, если один неключевой атрибут зависит от другого неключевого атрибута. Например, отношение СПИСОК СОТРУДНИКОВ=(СРТРУДНИК, ДОЛЖНОСТЬ, ПОДРАЗДЕЛЕНИЕ, ТЕЛЕФОН) не приведено к третьей нормальной форме, т.к. атрибут ТЕЛЕФОН зависит от неключевого атрибута ПОДРАЗДЕЛЕНИЕ. Для приведения отношения к третьей нормальной форме отношение СПИСОК СОТРУДНИКОВ нужно разбить на два отношения СОТРУДНИКИ и ПОДРАЗДЕЛЕНИЯ. ТРИГГЕР. Программа, которая автоматически выполняется, когда предпринимается попытка обновления содержимого определенной таблицы. Для каждой таблицы можно определить три типа триггеров: триггеры ввода, добавления и удаления. Триггеры могут использоваться для выполнения каких-либо расчетов в таблицах. Основное назначение триггеров - обеспечение целостности данных. В этом случае они используются для поддержания единственности значений первичных ключей и целостности на уровне ссылок. Каждый раз, когда над таблицей выполняется операция добавления, изменения или удаления данных, создаются новые управляемые системой версии таблиц. Такие таблицы, которые отражают введенные в таблицу и удаленные из не строки при каждом обновлении соответствующей БД называются триггерными таблицами. Ф ФИЗИЧЕСКОЕ ПРОЕКТИРОВАНИЕ БД. Этап проектирования БД, на котором модели, построенные на предыдущих этапах проектирования, привязываются к среде хранения. В качестве исходных данных для этапа физического проектирования используются результаты датологического проектирования. На этапе физического проектирования БД определяются используемые запоминающие устройства, способы физической организации данных. На этом этапе выбираются форматы хранимых записей, разрабатываются методы доступа, методы сжатия информации, решаются вопросы безопасности данных. ФОРМА. Настраиваемые диалоговые окна, сохраняемые в БД в виде объектов специального типа. Формы используются в приложениях для ввода и отображения данных. Формы могут содержать элементы управления, с помощью которых осуществляется доступ к данным в таблицах. Элементами управления являются текстовые поля для ввода и правки данных, кнопки, флажки, переключатели, списки, надписи, рамки объектов для отображения графики и объектов OLE. В формах может выполнятся проверка корректности данных при вводе, осуществляться вычисления на основе данных отражаемых в открытых формах, реализоваться доступ к данным в связанных таблицах. ФОРМУЛИРОВЕА И АНАЛИЗ ТРЕБОВАНИЙ. Начальный этап проектирования БД. На этом этапе на основе анализа предметной области определяются цели разрабатываемой БД и требования к ней. Проводится экспертирование специалистов предметной области, определяется семантика информационной модели, выделяются информационные потоки. Создается информационная схема организации, в которой должна функционировать разрабатываемая БД. На основе анализа этой схемы определяются сферы применения БД на протяжении ее всего жизненного цикла. Осуществляется сбор информации об использовании данных и определяются их функции. Преобразуются требования к информации в форму приемлемую для использования на последующих этапах проектирования БД. ФУНКЦИОНАЛЬНАЯ ЗАВИСИМОСТЬ. Описывает связь между атрибутами отношения. Если в отношении R атрибут Y функционально зависит от атрибута Х, то каждое значение атрибута Х связано только с одним значением атрибута Y. Ц ЦЕЛОСТНОСТЬ ДАННЫХ. Состоит в обеспечение правильности данных и их сохранности в любой момент времени. При этом имеется в виду как физическая сохранность данных в таблицах, так и возможность доступа к ним средствами СУБД. Ограничения целостности - утверждения о допустимых значений отдельных информационных единиц и связей между ними. Для реляционных баз данных формулируются два правила целостности данных: целостность сущностей и целостность согласования. ЦЕЛОСТНОСТЬ СУЩНОСТЕЙ. Никакой ключевой атрибут строки не может быть пустым. Ключ реляционной таблицы однозначно определяет каждую строку. Таким образом, если пользователь хочет извлечь конкретную строку таблицы или выполнить с ней манипуляции, он должен знать значения ключа этой строки. Поэтому запись не должна записываться в БД пока значения ее ключевых атрибутов не будут определены. ЦЕЛОСТНОСТЬ СОГЛАСОВАНИЯ. Значение непустого внешнего ключа должно быть равно одному из текущих значений первичного ключа другой таблицы. Все связи между отношениями должны быть реальными. Каждый вторичный ключ должен ссылаться на существующий первичный ключ другого отношения. ЦЕНТРАЛИЗОВАННАЯ БАЗА ДАННЫХ. База данных физически сосредоточенная в одном месте. Ч ЧЕТВЕРТАЯ НОРМАЛЬНАЯ ФОРМА, Отношение приведено к четвертой нормальной форме если устранены многозначные зависимости. Первая нормальная форма запрещает иметь неатомарные атрибуты. Однако на практике возникают ситуации требующих использования многозначных атрибутов. Например, один преподаватель может проводить занятия по нескольким дисциплинам, и наоборот занятия по одной дисциплине могут проводить несколько преподавателей. Например, для устранения многозначной зависимости между отношениями ПРЕПОДАВАТЕЛИ и ДИСЦИПЛИНЫ вводится третье отношение, в котором хранятся ключевые поля отношений ПРЕПОДАВАТЕЛИ и ДИСЦИПЛИНЫ, а затем с помощью этого отношения связываются исходные таблицы. Ш ШИФРОВКА ДАННЫХ. Кодирование данных, делающее их бессмысленными для несанкционированных пользователей. Э ЭТАПЫ ПРОЕКТИРОВАНИЯ БАЗ ДАННЫХ. В процессе проектирования БД можно выделить несколько этапов. В частности: формулировка и анализ требований, концептуальное проектирование, проектирование реализации, физическое проектирование. На каждом этапе разрабатываются модели, которые используются для формального представления данных и связей между ними. Эти модели позволяют решать задачи проектирования БД характерные для каждого этапа, а также выступают в качестве исходных для следующих этапов. В литературе по БД могут встречаться другие этапы проектирования БД или наоборот некоторые названные этапы объединены в один. Тем не менее проблемы, которые необходимо решать в ходе проектирования БД одни и те же. Я ЯЗЫК ОПРЕДЕЛЕНИЯ ДАННЫХ. Язык, применяемый для определения схемы базы данных. ЯЗЫК МАНИПУЛИРОВАНИЯ ДАННЫМИ. Язык, применяемый для запоминания данных и манипуляции ими.
| ||||||
| ||||||
Сайт создан по технологии «Конструктор сайтов e-Publish» |