МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ
Федеральное государственное образовательное учреждение
высшего образования
«ДАГЕСТАНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
Информатики
и информационных технологий
Курс
лекции
по
дисциплине
Теория экономических информационных систем
Кафедра
Информационных технологий и моделирования экономических процессов
факультет
Информатики и информационных технологий
Уровень высшего образования
Бакалавриат
Махачкала 2016
Оглавление
ЛЕКЦИЯ 1.
ЭКОНОМИЧЕСКАЯ ИНФОРМАЦИЯ КАК ЧАСТЬ ИНФОРМАЦИОННОГО РЕСУРСА ОБЩЕСТВА.
Данные,
информация, знания; экономическая информация
Формы
существования информации
Семиотический
аспект рассмотрения информации
Свойства
данных, информации и знаний
Динамика
роли информации в обеспечении функционирования компании
ЛЕКЦИЯ
2. ПОНЯТИЕ ЭКОНОМИЧЕСКИХ ИНФОРМАЦИОННЫХ СИСТЕМ.
Понятие
экономических информационных систем.
Принципы их
построения и функционирования
Критерии
оценки ЭИС. Классификация ЭИС.
ЛЕКЦИЯ 3. КОМПОНЕНТЫ ЭКОНОМИЧЕСКИХ ИНФОРМАЦИОННЫХ СИСТЕМ.
Лекция 4. КЛАССИФИКАЦИЯ И ОСНОВНЫЕ
СВОЙСТВА ЕДИНИЦ ИНФОРМАЦИИ.
Общие
понятия и задачи проектирования информационного обеспечения
Имя,
структура и значение единиц информации. Экономические показатели и документы.
Операции над
единицами информации
Классификация
и кодирование информации
ЛЕКЦИЯ 5.
МОДЕЛИ ДАННЫХ. РЕЛЯЦИОННАЯ МОДЕЛЬ ДАННЫХ.
ЛЕКЦИЯ
6. МОДЕЛИ ДАННЫХ:
НОРМАЛИЗАЦИЯ ОТНОШЕНИЙ. 1НФ.
Функциональные зависимости
и ключи
1.
Данные, информация, знания; экономическая информация.
2.
Формы существования информации.
3.
Семиотический аспект рассмотрения информации.
4.
Свойства данных, информации и знаний. Экономика
информации. Информационные ресурсы.
5.
Динамика роли информации
в обеспечении функционирования компании. Информационное общество.
Фундаментальное
и принципиальное понятие ”информация”
- ключевое для понимания
процессов, происходящих в современном обществе. Рассмотрим в лекции этот термин
сначала с наиболее общих позиций, а затем с точки зрения экономики.
Существующие
определения понятия "информация" после тщательного анализа обычно
признаются неудовлетворительными. Вряд ли возможно сформулировать одно точное определение
этого понятия. Распространенным является взгляд на информацию как на ресурс,
аналогичный материальным, трудовым и денежным ресурсам.
В качестве
примера можно рассмотреть (философское)
определение Н.Винера: “Информация – это обозначение
содержания, полученного из внешнего мира в процессе нашего приспособления к
нему и приспособления к нему наших чувств”.
Другой пример (прагматический) - Закон РФ
“Об информации, информационных технологиях и защите
информации ”: “Информация – сведения о лицах,
предметах, фактах, событиях, явления и процессах независимо от формы их
представления”.
Будем
рассматривать этот термин с точки зрения приложений в экономике: данные,
(собственно) информация и знания.
Данные – фиксированные
сведения о событиях и явлениях; представляют собой набор утверждений, фактов
и/или цифр, лексически и синтаксически взаимосвязанных между собой.
Информация – это
обработанные данные, которые представлены в виде, пригодном для принятия
получателем решений или проведения анализа (элемент новизны, полезности).
Информация
неотделима от процесса информирования, поэтому необходимо рассматривать
источник информации и потребителей информации. Информация - новые сведения, принятые, понятые и
оцененные конечным потребителем как полезные. Информацией являются сведения,
расширяющие запас знаний конечного потребителя.
Знания – это
обработанная информация, использованная и используемая для принятия решений и
решения задач, а также сведения о способах обработки информации для приведения
ее к виду, пригодному для принятия решений.
Пример: Данные об остатках наличных средств в
филиалах банка.
Фазы существования
информации:
1.
Ассимилированная
информация - представление сообщений в сознании человека, наложенное на систему
его понятий и оценок.
2.
Документированная
информация - сведения, зафиксированные в знаковой форме на каком-то физическом
носителе.
3.
Передаваемая
информация - сведения, рассматриваемые в
момент их передачи от источника
к приемнику.
Чтобы
определить понятие «экономическая
информация», надо очертить рамки экономических процессов. В наиболее общей
форме экономическими процессами являются производство, распределение, обмен и
потребление материальных благ. Информация об указанных процессах называется экономической
информацией.
Важнейшие
признаки классификации экономической информации (данных):
1.
Отношение к данной системе - входные, внутренние и выходные.
2.
Признак времени -
перспективные (плановые и прогнозные) и ретроспективные (учетные
данные). По времени поступления -
периодические и непериодические.
3.
Функциональные признаки - по
функциональным подсистемам экономического объекта (трудовые ресурсы,
производственные процессы, финансы и т. п.).
Данные могут
существовать в виде упорядоченной
последовательности значений конкретного показателя (таблицы). Например,
сведения о котировках акций. Такие данные называются структурированными.
Но
данные не всегда можно представить в виде упорядоченной последовательности
значений конкретных параметров – если мы берем их из текстов статей, с
изображений, из TV- и
радиопрограмм и т.д. Такие данные называют неструктурированными.
Вспомним, что
информация – это, прежде всего, результат анализа данных в связи с поставленной
задачей. А знания появляются в результате многократного использования
информации для принятия решения и могут существовать в двух формах: формальной
(регламентные документы, методы, методики, стандарты, нормативы) и неформальной (знания и опыт квалифицированных
специалистов, их интуиция, умение работать в команде и пр.).
Несмотря на то,
что неформальные знания – менее
конкретны, они очень важны в подготовке и принятии решения.
Основная часть
экономических сведений собирается, хранится, передается и обрабатывается в
форме знаков – цифр, букв, символов. Поэтому описание экономической информации
может осуществляться в терминах семиотики – науки, исследующей
свойства знаков и знаковых систем (естественных и искусственных языков).
В
рассматриваемом контексте с помощью знаков
передается информация с учетом соглашения
об их смысловом содержании между источниками и приемниками. Набор знаков, для
которых существует указанное соглашение, называется знаковой системой. При обработке информации на ЭВМ наличие точного
перечня знаков обязательно.
Семиотика предполагает рассмотрение объекта с
трех точек зрения - синтаксической, семантической и прагматической.
1.
Синтаксический аспект отражает
физические характеристики информации: способ представления, скорость передачи,
тип носителя, способ кодирования, используемые каналы и пр. К тому же в
последовательности знаков могут быть обнаружены цепочки, относительно которых
отсутствует соглашение о придании им смысла. Информация, рассматриваемая только
с этой точки зрения – это, фактически, данные (не учитывается содержание).
2.
Содержательная
сторона характеризует семантический аспект
информации (состав содержащихся сведений и связь между ними):
·
отсутствие новизны в получаемом сообщении,
т.е. сообщение не расширяет знаний потребителя;
·
прохождение ложного сообщения через
синтаксический фильтр;
·
существенные для семантического фильтра
взаимосвязи устанавливаются предметными науками: бухгалтерским учетом,
экономической статистикой и др.
3.
Прагматический аспект информации связан с
ценность информации для пользователя при принятии им решения (полнота
информации, ее своевременность, компактность, употребимость, доступность).
На
пути от источника к потребителю семантические и прагматические свойства
сообщений отступают на второй план ввиду отдаленности потребителя, поэтому понятие
информация заменяется на менее ограничительное понятие "данные". Данные
безразличны к семантическому и прагматическому аспекту. В тех случаях, когда
различия между информацией и данными нет необходимости подчеркивать, они
употребляются как синонимы.
Информационные
системы соединяют в себе три составляющие: технологии, люди, экономика
(бизнес). Технологии имеют дело с информацией в синтаксическом смысле,
специалисты имеют дело с семантикой информации, а бизнес интересует только
прагматический аспект. Т.е. необходимо измерить
информацию в трех разных аспектах.
Для определения
меры информации необходимо ввести понятие “мера
неопределенности” системы
– энтропию H().
При
получении сообщения
энтропия системы - H ().
Тогда
количество
информации I ()
, содержащееся
в сообщении
о системе :
I ()
= H () - H ()
Понятно,
что величина I () может быть положительной, отрицательной
или равняться нулю. Т.о. количество информации оценивается по энтропии системы
(см. курс “Теория информации”, формула
К.Шеннона: - ∑Pi
log Pi ).
Рассмотрим
количество информации с позиций семиотики.
Синтаксической
мерой информации является количество
обрабатываемых знаков - объем данных (бит,
байт, килобайт и др.). Понятно, что эта мера не может характеризовать – что
представляет собой этот объем информации. Эта
величина отражает только внешнюю
сторону информационных процессов.
Для измерения
смыслового содержания информации, т.е. ее количества на семантическом уровне,
введем понятие “тезаурус получателя информации”. Тезаурус – это
совокупность сведений и связей между ними, которыми располагает получатель
информации (накопленные знания получателя). Т.о. для принятия решения
необходима определенная исходная база (тезаурус) и некоторая (новая)
информация, которой в тезаурусе нет, и которой он пополнится.
Максимальное
количество семантической информации из сообщения получатель приобретет при
согласовании смыслового содержания сообщения с его тезаурусом (компетентный/некомпетентный
пользователь). Т.о. количество семантической информации в сообщении, получаемом
пользователем, является величиной персонифицированной – в отличие от
синтаксической информации, измеряется в тех же единицах информации (бит, байт,
килобайт и др.).
Прагматическая
мера информации определяет
полезность информации для достижения получателем поставленной цели и является
величиной относительной, субъективной, оценивается (численно) двумя
показателями:
1. Приращение вероятности достижения цели:
Если до получения сообщения вероятность достижения
цели была р0, а после получения р1, то
ценность информации, полученной
из сообщения, принято
оценивать Ip = log(p1/p0).
2. Прагматическая мера (ценность) информации - оценивается
величиной изменения целевой функции в связи с получением новой информации,
измеряется в единицах измерения целевой функции.
Информация
в семантическом и прагматическом аспектах не имеет объективной меры.
Рассмотри
свойства информации во всех трех ее разновидностях, что характеризует
возможности ее использования для подготовки и принятия решения.
Свойства данных:
·
Репрезентативность данных – способность
собранных данных адекватно отображать свойства описываемого ими явления:
-
правильный отбор объектов для сбора данных;
- определение
набора существенных признаков для измерения;
- достаточное
количество объектов;
-
соответствие
данных цели решаемой задачи.
·
Точность данных:
-
формальная точность;
- реальная точность;
-
максимальная точность, которая может быть получена при конкретных
условиях сбора информации;
-
необходимая точность решаемой задачи.
·
Достоверность данных
- способность
представлять описываемые объекты с заданной в задаче точностью. Достоверность –
ключевой показатель данных, на него влияют:
-
точность измерения данных;
-
методика измерения или расчета;
-
искажение данных на этапах информационного процесса.
·
Если
погрешность определяется факторами, степень влияния которых можно оценить, то
такие данные называют надежными.
Такие
“хорошие” данные – необходимое
условие получения полезной “информации”, свойства которой проанализируем ниже.
Если данные соответствовали синтаксическому аспекту рассмотрения информации, то
для собственно информации характерен
семантический аспект.
Свойства
информации:
·
Актуальность информации – определяется
степенью ее пригодности для принятия решения, зависит от того, в течение какого
периода времени репрезентативны данные, использованные для получения этой информации,
иначе необходима их актуализация.
·
Своевременность информации – получена без
опоздания к моменту принятия решения, но при этом информация должна быть
актуальна.
“Между”
информацией и данными находятся методы обработки. Если методы адекватны и данные
“хорошие”, то свойства данных переносятся на информацию (точность, надежность).
Положительные
свойства данных и информации сохраняются в знаниях.
Свойства знаний
(новые) - знания могут существовать в следующих видах:
·
предметный;
·
концептуальный /
обобщенный;
·
метазнания.
Экономика
информации
Информация
становится равноправным фактором хозяйственной деятельности (как труд, земля,
капитал и пр.). Характеристика информации в качестве экономической категории:
·
получение
и передача информации требуют определенных издержек (экономическая ценность);
·
асимметрия
информации (разные индивиды располагают разной информацией – разные тезаурусы,
разные формальные и неформальные знания).
Основу
экономической информации составляют трансакционные данные[1].
Обработанные трансакционные данные порождают трансакционную и аналитическую
информацию (привести примеры).
Аналитическая
информация основана на обобщенных трансакционных данных, ее единицей является
показатель (будет рассматриваться в более поздней лекции). В экономике принято
выделять макро- (характеризуют экономику в целом) и микроэкономические показатели (описывают состояние отдельных экономических
единиц).
Аналитическая
информация обычно представляется в виде рядов информации: временных,
пространственных/географических и пространственно-временных.
Отметим понятие
“трансакционные издержки” – затраты на информационные процессы, сопутствующие и
определяющие трансакцию (сбор, хранение, обработка, передача,
представление/документирование информации по конкретной трансакции).
Трансакции
отличаются по сложности, следовательно, отличаются их трансакционные издержки.
4.
Информационные ресурсы
Ресурс –
запас, источники чего-нибудь (С.И.Ожогова).
В индустриальном обществе
основные виды ресурсов (уже
классические экономические категории):
·
материальные,
·
природные,
·
трудовые,
·
финансовые,
·
энергетические.
В информационном обществе
акцент смещается с традиционных видов ресурсов на информационный ресурс (существовал всегда,
но не рассматривался ни как экономическая, ни как иная категория) – разные
мнения и определения в зависимости от научных школ. Федеральный закон “Об
информации, информатизации и защите информации” (не научная, а, скорее,
прагматическая позиция потребителя информации):
Информационные ресурсы: отдельные документы и отдельные массивы
документов, документы и массивы документов в ИС (библиотеках, архивах, фондах,
банках данных и пр.).
Документы
и массивы информации не существуют сами по себе. В них представлены знания,
которыми обладали люди, создававшие их. Т.о. информационные ресурсы –
это знания, подготовленные людьми для
социального использования в обществе и зафиксированные на материальном
носителе. Информационные ресурсы
общества, если их понимать как знания, отчуждены от тех людей, которые их накапливали, обобщали,
анализировали и пр. Эти знания материализовались в виде документов, БД, БЗ, алгоритмов,
компьютерных программ и пр. В настоящее
время не разработана методология
количественной и качественной оценки информационных ресурсов.
Сегодня
предприятия для сохранения и улучшения своего положения на рынке должны иметь
эффективную информационную систему, автоматизирующую информационные процессы
внутри организации и обеспечивающую доступ к внешним информационным ресурсам. В
зависимости от того, насколько совершенна информационная система, зависит слаженность
работы экономики.
Отличие информации от материальных ресурсов:
·
неуничтожаемость
в процессе потребления (использования), возможность многократного потребления и
не одним, а многими потребителями (пользователями);
·
трудность
однозначной фиксации потребителя при свободном распространении информации;
·
невозможность
точной стоимостной оценки полученной информации (в общем случае);
·
этические
и правовые проблемы приобретения информационных продуктов/ресурсов (спрос-предложение,
легальная-контрафактная);
·
неопределенность
полезности информации (необходима организация рабочего пространства памяти
компьютера);
·
иной
механизм старения информации по сравнению с классическими ресурсами (особая
роль поисковых систем; СПАМ).
Развитие мировых
информационных ресурсов позволило:
·
превратить
деятельность по оказанию информационных услуг в глобальную человеческую
деятельность;
·
сформировать
мировой и внутригосударственный рынок информационных услуг;
·
повысить
обоснованность и оперативность принимаемых решений в фирмах, банках, биржах и
пр. ;
·
замещать
информацией другие факторы производства, прежде всего труд и капитал.
Информационные
продукты и услуги
Информационные
ресурсы - база, для создания информационных
продуктов. информационный продукт – результат интеллектуальной
деятельности человека.
Информационный продукт - cовокупность
данных, cформированная производителем для распространения в вещественной или
невещественной форме. Информационный продукт может распространяться таким же
способом, как и любой другой
материальный продукт, с помощью услуг.
Информационная услуга – получение и
предоставление в распоряжение пользователя
информационных продуктов. В узком смысле информационная услуга
воспринимается как услуга, получаемая с помощью компьютера. Информационные
услуги возникают только при наличии БД в компьютерном или некомпьютерном
варианте. С появлением компьютеров существенно увеличиваются объемы хранимых
БД, соответственно, расширяется круг информационных услуг.
Классификация БД
с позиций их использования:
1.
библиографические (вторичная информация о документах);
2.
небиблиографические
(справочные, первичная информация, финансовые, юридические и пр.)
Классификация информационных услуг (исходя из
возможных видов информационных продуктов, БД, ресурсов):
1.
выпуск
информационных изданий,
2.
ретроспективный
поиск информации,
3.
предоставление
первоисточников,
4.
традиционные
услуги НТИ (переводы, обзоры),
5.
дистанционный
доступ к удаленным БД,
6.
подготовка
и оказание информационных услуг (ПО, информационные системы, связь, обработка
данных и пр.).
Рынок
информационных продуктов и услуг :
·
Где
находятся инф. ресурсы?
·
Cколько
они стоят?
·
Кто
ими владеет?
·
Кто
в них нуждается?
·
Насколько
они доступны?
Рынок информационных продуктов и услуг (информационный рынок) - система
экономических, правовых и организационных отношений по торговле продуктами
интеллектуального труда на коммерческой основе.
Информационный
рынок характеризуется определенной номенклатурой продуктов и услуг, условиями и механизмами их предоставления,
ценами. Здесь в качестве предмета
продажи и обмена выступают
информационные системы, информационные технологии, лицензии, патенты, ноу-хау,
инженерно-технические услуги и пр.
История
развития рынка информационных услуг
C cередины 50-х годов началось
формирование устойчивого рынка
информационных услуг. Основными поставщиками являлись : информационные службы
академических, профессиональных и научно-технических обществ, учебных
заведений. Основные потребители: ученые
и специалисты.
C начала 60-х
годов начал формироваться рынок услуг
электронной обработки и передачи информации.
C cередины 70-х
годов - с созданием национальных и глобальных сетей - ведущим видом услуг стал диалоговый поиск информации в удаленных
от пользователя БД.
Начиная
с 70-х годов информационная индустрия приобретает большое влияние на
экономическую и социальную жизнь общества. Активно обслуживает процессы
глобализации в экономике.
Совокупность средств,
методов и условий, позволяющих
использовать информационные ресурсы, составляет информационный потенциал общества.
Важнейшие cоставляющие рынка:
1.
техническая
и технологическая;
2.
нормативно-правовая
(законы):
· “Об информации,
информатизации и защите информации” ,
· ”Об авторском
праве и смежных правах”
· ”О правовой
охране программ для ЭВМ и БД ”
· ” О правовой
охране топологий интегральных схем”
3.
информационная;
4.
организационная.
Информационный рынок
существует, значит, можно говорить о бизнесе информационных продуктов,
услуг (торговля, посредничество, производство).
·
До
прихода в экономику ЭВМ предоставление информации являлось бюрократической
обузой;
·
В
конце 60-х – начале 70-х годов ХХ века (с применением ЭВМ и управленческих информационных систем)
предоставление информации (отчетов, запросов) автоматизируется, что позволяет
улучшить управляемость компании / бизнеса; информация превращается в ресурс
управления компанией;
·
В
начале 90-х годов ХХ века с появлением ПК и локальных сетей, а затем и
Интернета информация становится стратегическим ресурсом предприятия /
организации в конкурентной борьбе за потребителя. Информационная борьба за
потребителя, по сути, - главное содержание современного электронного бизнеса.
Информация становится базовой составляющей практически всех аспектов
функционирования компании, что требует существенных расходов.
Изменяется
концепция информации в обеспечении функционирования компании, следовательно, и
роль ИС.
Информационное общество (ИО)
Деятельность
отдельных людей, групп, организаций сейчас все в большей степени начинает
зависеть от их информированности. C середины 20-го века – лавинообразность потока
информации – с одной стороны, с другой – информационный кризис:
·
противоречие
между ограниченными возможностями человека по восприятию и переработке
информации и существующими потоками хранящейся информации.
Общая сумма знаний с 1900 г.
удваивалась каждые 50 лет:
- к 1950 г. – удвоение каждые 10 лет,
- к 1970 г. -
каждые 5 лет,
- с 1990 г. -
ежегодно;
·
наличие
большого потока избыточной информации;
·
наличие
определенных экономических, политических и других социальных барьеров,
препятствующих распространению информации.
Информационный
кризис поставил общество перед
необходимостью поиска путей выхода из создавшегося положения. Внедрение ЭВМ, современных средств
переработки и передачи информации стало началом нового эволюционного процесса,
называемого информатизацией общества.
Информационное
общество (постиндустриальное общество) - общество, в котором большинство работающих
занято производством, хранением, переработкой и реализацией информации,
особенно высшей ее формы – знаний.
“Информационное
общество – организованный социально-экономический
и научно-технический процесс создания оптимальных условий для удовлетворения
информационных потребностей и реализации прав граждан, органов государственной
власти, органов местного самоуправления, организаций, общественных объединений
на основе формирования и использования информационных ресурсов”.
В ИО изменится
не только производство, но и весь уклад жизни, система ценностей. В США уже
сейчас 27 млн.работающих могут осуществлять свою деятельность, не выходя из
дома.
Характерные
черты ИО:
·
решена
проблема информационного кризиса;
·
приоритет
информации по сравнению с другими ресурсами;
·
автоматизация
генерации, хранения, обработки и использования знаний;
·
единое
информационное пространство цивилизации;
·
власть
постепенно переходит к меритократии, т.е. высококвалифицированным профессионалам;
·
свободный
доступ каждого человека к мировым информационным ресурсам.
Прогнозируемые опасные тенденции:
·
все
большее влияние на общество средств массовой информации;
·
информационные
технологии могут разрушить частную жизнь людей и организаций;
·
проблема
отбора качественной и достоверной информации;
·
разрыв
между ”информационной элитой” и потребителями.
В информационном обществе человеку необходимо иметь
информационную культуру (знания из кибернетики,
информатики, теории
информации, математики, теории проектирования БД и т.д.):
·
навыки
использования ТС и ПП;
·
умение
извлекать информацию из различных источников и использовать ее;
·
владение
основами аналитической переработки информации и т.д.
1.
Понятие Экономических информационных
систем.
2.
Принципы их построения и
функционирования
3.
Критерии оценки ЭИС. Классификация
ЭИС.
Изучение ЭИС можно декомпозировать следующим образом:
·
компоненты
ЭИС,
·
как
работают ЭИС,
·
динамика
развития ЭИС,
·
как
управляются ЭИС,
·
для
чего применяются ЭИС,
·
какую
выгоду приносят ЭИС,
·
сколько
стоят.
В теории ЭИС изучаются проблемы
организации информации в системе и вопросы эффективной эксплуатации ЭИС. Сегодня
обработка экономической информации стала самостоятельным научно-техническим
направлением. Изучение ЭИС опирается на понятия "информация" и
"система", которые являются простейшими фундаментальными категориями,
не выражаемыми через более общие понятия.
Понятие “информация” (и производные от него понятия) были рассмотрены в
предыдущей лекции. Понятие “система” – в
“Теории систем и системном анализе”.
Под информационной
системой понимается система, в которой протекают информационные процессы,
составляющие полный жизненный цикл информации: генерация, преобразование,
передача, прием, хранение, обработка (использование), уничтожение.
Информационные технологии, информационные системы
могут функционировать и с применением технических средств, и без такого
применения. Это вопрос экономической целесообразности. Возрастание объемов
информации в информационной системе организаций, потребность в ускорении и
более сложных способах ее обработки вызывают необходимость автоматизации
обработки информации - в настоящее время сложилось мнение об информационной
системе как о системе, реализованной только с помощью компьютерной техники.
Поэтому определим информационную систему следующим образом.
Информационная
система (ИС) –
связанный набор аппаратных и программных средств, информационных ресурсов, а
также управленческого сервиса, осуществляющих информационные процессы для
обеспечения подготовки и принятия решений.
Информационная
система представляет собой систему, функционирование которой
во времени заключается в сборе, хранении, обработке и распространении
информации о деятельности какого-то объекта реального мира. Информационная
система создается для конкретного объекта и должна в определенной мере
копировать взаимосвязи его элементов.
В случае рассмотрения экономического объекта
реального мира систему будем называть экономической информационной системой (ЭИС).
Будем считать, что термины “информационная система, ИС”, “
экономическая информационная система,
ЭИС ”, “автоматизированная
информационная система, АИС ” в контексте рассматриваемой дисциплины - синонимы.
АИС можно рассматривать как человеко-машинную
систему с автоматизированной технологией получения результатной информации,
необходимой для информационного обеспечения персонала и оптимизации процесса
управления в предметной деятельности. В силу сложности структуризации информации
и формализации процессов ее обработки автоматизация всех информационных
процедур организации затруднена. Степень автоматизации различных информационных
процессов колеблется от 10 до 20%.
Существует многообразие типов таких управленческих информационных систем, применяемых
при подготовке и принятии экономических решений (рассмотрим позже).
Экономические информационные системы предназначены
для решения задач обработки данных, автоматизации офисных работ, выполнения
поиска информации и т.д.
1. Соответствие. АИС должна
обеспечивать функционирование объекта с заданной эффек-тивностью.
2. Экономичность. Затраты на обработку
информации в АИС должны быть меньше экономического выигрыша на объекте при
использовании этой информации.
3. Регламентность. Большая часть
информации в АИС поступает и обрабатывается со строгой периодичностью.
4. Самоконтроль. Непрерывная работа
АИС по обнаружению и исправлению ошибок в данных и процессах их обработки.
5. Интегральность. Однократный ввод
информации в АИС и ее многократное использование.
6. Адаптивность.
Способность АИС изменять свою структуру и закон поведения для достижения
оптимального результата при изменяющихся внешних условиях.
7. Масштабируемость. Способность АИС
наращивать свой функционал.
8. Модульность. Реализация АИС в виде
взаимосвязанных модулей.
Среди других особенностей АИС следует назвать
обработку больших объемов информации по сравнительно простым алгоритмам,
высокий удельный вес логической обработки данных (сортировка, группировка,
поиск, корректировка) и представление большей части информации в виде
документов.
Основная
цель разработки и применения ЭИС - создание современной
информационной инфраструктуры для управления компанией. В управлении компанией
принято выделять три уровня: стратегический, тактический (управленческий),
оперативный (операциональный) - см. рис.1.
Основные
задачи ИС:
·
на
стратегическом уровне – обеспечение высшего руководства информацией о долгосрочных
тенденциях в развитии бизнеса, лучших технологиях, методах управления и
способах изменения бизнеса для выработки долгосрочной стратегии компании, обеспечивающей
ее конкурентное преимущество;
·
на тактическом
уровне – максимально
быстрое и качественное обеспечение специалистов среднего и высшего звеньев
руководства оперативной и аналитической информацией, способствующей подготовке
и принятию наилучших решений;
·
на оперативном
уровне – качественное
и быстрое выполнение рутинных операций, связанных с обеспечением информационных
процессов по вводу и обработке первичной информации и представлению необходимых
документов.
Рис.1. Пирамида иерархии уровней управления
компанией
Принятие
решения – это выбор наилучшего в определенном смысле варианта решения из множества допустимых - на
основании имеющейся информации.
На самом деле основная работа экономиста и
бизнесмена состоит в постоянном выборе наиболее подходящего решения. Принятие
решения связано с многочисленными рисками и они тем меньше, чем более быстро и
полно будет подготовлена информация, необходимая для принятия решения. В этом и заключается одна из главных функций ЭИС: оперативная
поставка достоверной информации в процесс принятия решения.
ЭИС для подготовки и принятия решения могут использовать:
·
отдельные
пользователи,
·
предприятия
(компании, фирмы, учреждения – будем считать их синонимами в данном курсе),
·
отрасли,
·
национальная
экономика в целом.
На уровне предприятия АИС позволяет решить широкий
класс задач, обеспечивая решение задач всех других уровней – что обеспечивает
данным АИС приоритетное внимание. В реальности компания может использовать
несколько информационных систем, которые могут работать независимо друг от
друга. Но, как правило, в этом случае создается интегрированная система управления, их объединяющая и
обеспечивающая единое информационное
пространство. Типичным примером организации
единого информационного
пространства на небольшом предприятии является использование нескольких
простых специализированных учетных систем - бухгалтерской, складской и базы
данных по клиентам. Поскольку каждая из этих систем дает представление только о
каких-то своих аспектах деятельности предприятия, то для получения сводной
картины данные из них вводятся в общую систему, которая позволяет руководителям
предприятия видеть общую картину состояния предприятия и прогнозировать
динамику его развития.
При создании информационной системы возникает
задача объективной оценки качества ее функционирования. Такая оценка
особенно актуальна, так как современные информационные системы - это сложные и
дорогостоящие проекты.
Критериями
оценки функционирования ЭИС могут быть:
·
отношение
объема информации в базе данных к объему информации на объекте управления;
·
время
обработки информации в ЭИС;
·
время,
которое потребители расходуют на запрос информации и ее использование;
·
сумма
капитальных вложений и текущих затрат на создание, эксплуатацию и развитие ЭИС;
·
отношение
объемов входной и выходной информации;
·
доля
избыточной информации в общем объеме данных.
Классификация ЭИС (базовая)
ЭИС классифицируются по
многим аспектам. Рассмотрим базовую классификацию ЭИС по
функциональному признаку, режиму работы ЭИС и способу распределения вычислительных
ресурсов.
Среди ЭИС выделяются информационные системы для управления технологическими процессами
на предприятии и системы административно - организационного типа
(для обслуживания коллектива специалистов, осуществляющих управление
предприятием).
В данном курсе будем рассматривать административно-организационные
системы.
1)
С
функциональной
точки зрения можно выделить такие классы ЭИС:
·
системы
обработки данных (СОД),
·
автоматизированные
системы управления (АСУ),
·
информационно-поисковые
системы (ИПС).
Многие реальные
ЭИС обладают чертами нескольких из названных классов.
Для СОД
характерно наличие математических соотношений, которые позволяют вычислять
значения элементов выходной информации по известным значениям входной информации
без применения методов оптимизации процессов управления экономическим объектом.
Пример:
программы расчета заработной платы сотрудников предприятия, формирования
статистической отчетности и т.п.
СОД производит
информационное обслуживание специалистов, принимающих управленческие решения.
Решение, принятое на основе представленной информации, передается на
управляемый объект, минуя СОД. Можно трактовать СОД как систему, которая преобразует
поток входной информации в поток выходной информации.
Если СОД способна выполнять выбор управленческих
решений (автономно или с участием специалистов), то она становится
автоматизированной системой управления - АСУ.
Принятие решений системой может производиться на основе
экономико-математических методов, либо путем моделирования действий специалиста
по принятию управленческого решения.
Пример:
программы оптимального управления запасами материалов и полуфабрикатов на
складах предприятия - АСУ прогнозирует поступление материалов и их расход на
основное производство, а в случае несоблюдения норм запаса материалов формирует
заявки предприятиям-поставщикам.
Информационно-поисковые системы (ИПС)
предназначены для отыскания в множестве документов тех, которые посвящены
указанной в запросе теме или содержат необходимые сведения.
При вводе в ИПС каждый документ индексируется:
• определяются темы, которые отражаются в данном
документе,
• запись в виде поисковых образов на языке, принятом
в ИПС.
Чтобы при помощи ИПС можно было отыскать документы
по запросу, сам запрос также должен быть проиндексирован. Процесс поиска
осуществляется путем сопоставления поисковых образов документов с поисковым
образом запроса. При полном или частичном совпадении образов документ считается
соответствующим запросу и выдается пользователю.
2)
В
ЭИС могут применяться два режима решения задач - пакетный и диалоговый.
При пакетном режиме обработки данные в
системе накапливаются до тех пор, пока не наступит заданный момент времени, или
объем данных не превысит некоторый предел. Затем имеющаяся информация
обрабатывается. При пакетном режиме обработки данных потребитель информации
обособлен от процесса ее обработки. Пакетная система снижает оперативность
принятия решений.
Пример:
система сбора и группировки статистической отчетности предприятий.
При диалоговом
(интерактивном) режиме работы происходит обмен сообщениями между
пользователем и системой. Роль «активного» элемента пользователь и система выполняют
попеременно. Последовательность команд, задаваемых пользователем в диалоговом
режиме работы, не является фиксированной заранее, как правило, зависит от
результатов ранее выполненных команд.
Необходимость диалога с системой возникает при
решении экономических задач с многовариантной логикой.
Пример: расчеты по распределению ресурсов между
несколькими потребителями.
3)
По
способу
распределения вычислительных ресурсов выделяются локальные и распределенные
(сетевые, корпоративные) ЭИС.
Локальная система использует одну
ЭВМ, а в распределенной системе организуется взаимодействие нескольких ЭВМ,
соединенных между собой каналами связи. Отдельные компоненты информационной системы могут быть
территориально удалены друг от друга.
Каждый из процессов в распределенной информационной
системе может обрабатывать локальные данные, принимая соответствующие решения и
по другим информационным процессам обмениваться информацией через сеть с целью
обработки данных, расположенных в других узлах сети.
Экономическая информационная система имеет функциональные
и обеспечивающие подсистемы.
Функциональные
подсистемы обеспечивают выполнение задач и назначение
информационной системы, реализуют
функциональное управление, т.е. управление, основанное на четком определении
выполняемых материальной системой задач различного уровня иерархии, на
принципах разделения труда и назначения для их осуществления исполнителей.
Обычно в информационной системе функциональная часть
разбивается на подсистемы по функциональным признакам:
·
уровень
управления предприятием (стратегический, тактический, оперативный);
·
вид
управляемого ресурса (материальные, трудовые, финансовые и т. п.);
·
сфера
применения (банковские, для фондового рынка и т. п.);
·
функции
управления и период управления.
Функциональные подсистемы соответствуют видам
производственно-хозяйственной деятельности предприятия. Каждый производственный
объект осуществляет, во-первых, основное производство. Для функционирования
основного производства возникает вспомогательное производство. Кроме того,
необходимо организовать процессы снабжения и сбыта и т.п. Каждый из этих
процессов представляет собой самостоятельный объект управления. Таким образом,
в состав функциональных подсистем входят, как правило, следующие подсистемы:
·
технико-экономическое
планирование;
·
оперативное
управление основным производством;
·
управление
технической подготовкой производства;
·
управление
материально-техническим снабжением;
·
управление
сбытом и реализацией продукции;
·
управление
качеством;
·
бухгалтерский
учет;
·
кадры
и др.
В отличие от обеспечивающих подсистем функциональные подсистемы имеют четкую
специализацию. При этом у них есть еще и общая задача: максимально быстро и
точно предоставлять информацию о положении дел в организации (в соответствии со
своими задачами).
Функциональные подсистемы составляют
интеллектуальную основу ЭИС и имеют, как правило, интерактивный характер,
поэтому эффективность их работы во многом определяется деятельностью связанных
с ними работников. Именно компоненты функциональных подсистем служат достижению
целей организации.
Целью
обеспечивающих подсистем является обеспечение решения задач функциональных
подсистем ЭИС, т.е. представляют собой фундамент для функциональных
подсистем. Состав обеспечивающих подсистем не зависит от вида ЭИС.
Обеспечивающие подсистемы включают
информационное обеспечение, техническое, программное, математическое, технологическое,
обеспечение информационной безопасности, лингвистическое, организационное, правовое и эргономическое.
Информационное обеспечение (ИО) представляет собой совокупность проектных решений по
объемам, размещению, формам организации информации. Оно включает в себя совокупность
показателей, справочных данных, классификаторов и кодификаторов информации,
унифицированные системы документации, специально организованные для
автоматизированного обслуживания, файлы информации на соответствующих носителях,
а также персонал, обеспечивающий надежность хранения, своевременность и качество
технологии обработки информации.
Техническое обеспечение (ТО) – компьютерно-сетевое обеспечение - представляет собой
комплекс технических средств (технические средства сбора, регистрации, передачи,
обработки, отображения, размножения информации, оргтехника и др.), обеспечивающих
работу ЭИС. Центральное место среди всех технических средств занимает ПЭВМ.
Структурными элементами технического обеспечения наряду с техническими
средствами являются также методические и руководящие материалы, техническая документация
и обслуживающий эти технические средства персонал.
Программное обеспечение (ПО) включает совокупность программ, реализующих функции и
задачи ЭИС и обеспечивающих устойчивую работу комплексов технических средств. В
состав программного обеспечения входят общесистемные и специальные программы, а
также инструктивно-методические материалы по применению средств программного
обеспечения и персонал, занимающийся его разработкой и сопровождением на весь
период жизненного цикла ЭИС.
Математическое обеспечение (МО) — это совокупность математических методов, моделей и
алгоритмов обработки информации, используемых при решении функциональных задач
в пределах разрабатываемой ЭИС. Математическое обеспечение включает средства
моделирования процессов управления, методы и средства решения типовых задач
управления, методы оптимизации исследуемых управленческих процессов и принятия
решении (методы многокритериальной оптимизации, математического программирования,
математической статистики, теории массового обслуживания и т.д.). Техническая
документация по этому виду обеспечения содержит описание задач,
экономико-математические модели задач, контрольные примеры их решения. Персонал
составляют специалисты по организации управления объектом, проектировщики задач
управления, специалисты по вычислительным методам.
Технологическое обеспечение (ТхО) – реализует информационные процессы в информационных
системах организационного управления с помощью ЭВМ и других технических
средств. ТхО отражает особенности и
специфику работы ЭИС, может быть представлено описанием взаимосвязанных
действий системы по преобразованию исходных данных в информацию,
предназначенную для конечного пользователя.
Обеспечение информационной безопасности (ОИБ) – организация комплекса мер по использованию специальных
средств, методов и мероприятий с целью предотвращения потери информации,
сегодня ОИБ активно развивается.
Лингвистическое обеспечение (ЛО) объединяет совокупность языковых средств для формализации
естественного языка, составления информационных единиц в ходе общения персонала
со средствами ВТ. ЛО включает информационные языки для описания структурных
единиц информационной базы (документов, показателей, реквизитов); языки
управления/манипулирования данными информационной базы; языковые средства
информационно-поисковых систем; языковые средства автоматизации проектирования;
систему терминов и определений процесса разработки и функционирования ЭИС.
Организационное обеспечение (ОО) представляет собой комплекс документов, регламентирующих
деятельность персонала в условиях функционирования ЭИС. Организационное обеспечение реализуется в
различных методических и руководящих материалах по стадиям разработки,
внедрения и эксплуатации ЭИС.
Правовое обеспечение (ПрО) представляет собой совокупность правовых норм,
регламентирующих правоотношения при создании и внедрении ЭИС. Правовое обеспечение
на этапе разработки включает нормативные акты, связанные с договорными отношениями
разработчика и заказчика.
Эргономическое обеспечение (ЭО) как совокупность методов и средств, используемых на
разных этапах разработки и функционирования ЭИС, предназначено для создания
оптимальных условий высокоэффективной и безошибочной деятельности человека, для
ее быстрейшего освоения.
Итак, функциональные
и обеспечивающие подсистемы существенно зависят друг от друга: существование
функциональных подсистем без обеспечивающих подсистем невозможно, а
обеспечивающих подсистем без функциональных
– бессмысленно.
Все, что
происходит в процессе функционирования материальных систем окружающего нас
мира, может быть описано в форме сообщений. Сообщение представляет собой
информационное отображение материальных процессов.
Сообщение может
быть выражено на естественном языке, часто применяют форматированные сообщения,
где выделяются опорные свойства происходящего события и приводятся названия
свойств и их значения.
Пример сообщения
На склад
№2 1.02.10 поступили генераторы от завода «Динамо»
в количестве 50 шт. по цене 200 руб.
Форматированный
вариант этого сообщения :
Название
параметра Значение
параметра
Получатель Отправитель Изделие Дата Цена Количество |
Склад №2 Завод «Динамо» Генератор 01.02.10 200руб. 50шт. |
Таких
сообщений о поступлении изделий на склады предприятия формируется достаточно
много. Они совпадают по названиям параметров и различаются по их значениям. В
этом случае удобно их представление в виде таблицы.
Форматированные сообщения – это наиболее массовый
вид сообщений, хранимых и обрабатываемых в ЭИС. Существует
экономическая информация, которую практически невозможно форматировать,
например, приказы по предприятию.
Рассмотрим одно из возможных определений базы данных –
определение через набор сообщений, т.е. исходя из того, что назначение
БД – информационное отображение предметной области.
База данных (БД) – это набор
сообщений, которые
•
являются истинными для соответствующей материальной системы,
•
непротиворечивы по отношению друг к другу и к концептуальной схеме.
Сообщения в БД
обычно хранятся в виде единиц информации.
Единицей
информации называется набор символов, которому придается определенный смысл.
Если в сообщении
«На склад №2 01.02.10 поступили генераторы от завода «Динамо» в
количестве 50 шт. по цене 200 руб.» названия параметров фиксированы, то набор
символов «склад № 2, з-д «Динамо», генератор, 01.02.10, 200 руб., 50 шт.»
является единицей информации. «01.02.10» также является единицей информации.
Минимально
необходимы две единицы информации – атрибут и составная единица
информации (СЕИ).
Атрибутом
называется информационное отображение отдельного свойства некоторого объекта,
процесса или явления. Информационное
отображение любого явления представляет собой набор соответствующим образом
подобранных атрибутов.
Составная
единица информации представляет собой набор из атрибутов и, возможно,
других СЕИ. Простейшими
СЕИ являются таблицы. СЕИ позволяет создавать произвольные комбинации из
атрибутов.
Хранимые
представления данных очень часто не соответствуют первоначальному множеству
форматированных сообщений. Однако сейчас при рассмотрении БД будем считать, что
сообщения хранятся в виде таблиц.
Более детальное
рассмотрение баз данных будет продолжено позже.
При решении
задач с использованием ЭВМ требуется компоненты:
•
исходная
и справочная информация,
•
метод
(алгоритм) решения задачи, записанный в виде программы,
•
ЭВМ,
•
пользователи.
Для
функционирования ЭИС необходимы аналогичные компоненты, но с более сложной
организацией.
Компоненты информационной системы – это база
данных, концептуальная схема и информационный процессор, образующие вместе
систему хранения и манипулирования данными.
Концептуальная схема представляет
собой описание структуры и свойств всех единиц информации, хранящихся в БД. Под
структурой понимается вхождение одних
единиц информации в состав других единиц информации.
Информационный процессор – вычислительная система и система
управления базой данных – СУБД, которая в ответ на получение команды выполняет
операции с БД и концептуальной схемой.
Такая компонентная дифференциация информационной
системы подчеркивает роль БД в рамках ЭИС.
Предметной областью называются элементы материальной
системы, информация о которых хранится и обрабатывается в ЭИС.
Информационным
отображением всей предметной области (экономического объекта) является
информационная база ЭИС. Информационная
база состоит из одной или нескольких баз данных.
Для описания предметной области необходимо ввести термины: объект,
свойство объекта, взаимодействие (связь) объектов, свойство взаимодействия.
· Объектом называется любой элемент некоторой
системы.
В экономике
понятие объекта сужается до понятия физического объекта, под которым понимается
любой предмет, занимающий место в пространстве. Следует различать отдельный физический объект и объект - понятие, которое охватывает множество физических объектов.
Отдельный объект часто называют экземпляром объекта, а различные множества объектов,
образованные по заданному принципу, называются типами объектов. Объекты экономической сферы группируются в три крупных типа - средств производства, предметов труда и
исполнителей.
Первоначальная группировка экземпляров в некоторые
множества (классы) называется классификацией.
·
Свойством
объекта называется некоторая величина, которая
характеризует состояние объекта в любой момент времени. Отдельный экземпляр
объекта можно точно описать, если указать достаточное количество значений его
свойств. Два экземпляра объектов являются различными, если они отличаются по
значению хотя бы одного свойства.
Объекты одного класса описываются одноименными свойствами.
Объекты, входящие в некоторый тип,
содержат ряд свойств, характерных для типа в целом. Этот принцип называется
наследованием свойств. Так, все
экземпляры объектов, образующих тип «основные фонды», характеризуются свойством
балансовая стоимость, которое
отсутствует у других типов, например, у типа «исполнители».
· Взаимодействием
объектов
называется участие нескольких объектов в каком-либо процессе, которое протекает
во времени и в пространстве.
· Свойством взаимодействия называется
такое свойство, которое характеризует совместное поведение объектов, но не
относится ни к одному объекту в отдельности.
Проблема полноты
отображения объектов и процессов предметной области в хранимые данные решается
в ЭИС следующим образом. Представление объекта или процесса сводится к указанию
его свойств. Информационным отображением свойств служат атрибуты и,
следовательно, экземпляр объекта или экземпляр процесса представлен в базе
данных как набор пар
<Имя
атрибута>,<3начение атрибута>,
где имена атрибутов различны и
соответствуют названиям свойств объекта или процесса. Количество
свойств должно быть таково, чтобы всегда можно было отличить объект одного
класса от объекта другого класса, а также любые два объекта одного и того же
класса.
Среди свойств,
описывающих объект, необходимо выделить идентифицирующие
свойства, т.е. свойства, по
значению которых можно однозначно отличить данный экземпляр объекта от любого
другого.
Обобщенно под
предметной областью можно понимать не конкретную материальную систему или
процесс, а множество таких систем, которые имеют общее назначение, похожий
функционал и т.д. Например, страховые компании, коммерческий банк, оптовая
торговля и пр. Тогда конкретную
материальную систему, для которой проектируется ЭИС, назовем объектом автоматизации.
Описание
хранимой и обрабатываемой информации в ЭИС делается с разной степенью
детализации:
1.
Внешний
уровень - описание информационных потребностей конечного пользователя.
2.
Концептуальный
уровень - описание информационных потребностей на уровне понятий ЭИС.
3.
Внутренний
уровень - описание способа хранения информации в памяти ЭВМ и методов доступа к
ней.
Внешний уровень
наиболее близок к пользователям, внутренний уровень наиболее близок к
физической памяти ЭВМ, а концептуальный уровень занимает промежуточное
положение.
Внешнее представление может
пользоваться любым аппаратом понятий. Единственное требование состоит в
возможности преобразования его в концептуальное представление. Внешнее
представление оказывается достаточным для применения ряда прикладных программ,
например, генераторов отчетов, преобразующих поток входной информации в
выходной поток.
Концептуальное представление описывает
полное информационное содержание базы данных в более абстрактной форме по
сравнению со способом физического хранения данных. В концептуальном описании
необходимы не только сведения о структуре обрабатываемой информации, но и
сведения о технологии ее обработки.
Концептуальный
уровень описания оказывается достаточным для использования программной
поддержки в виде систем управления базами данных. Концептуальное описание при
этом необходимо адаптировать к требованиям конкретной СУБД.
|
Внутреннее описание данных
определяет организацию данных в памяти ЭВМ и методы доступа к данным. В ряде
случаев применение СУБД не позволяет реализовать все требования к ЭИС. Тогда
требуется разработка уникальных программ доступа к данным.
Декомпозиция ЭИС
на подсистемы была рассмотрена ранее. Отметим еще несколько вариантов возможной
детализации информационных систем.
Элементарным процессом при пакетной
обработке данных является задание, при
диалоговой обработке - транзакция (взаимодействие).
Задание содержит одну или несколько программ,
выполняемых в определенной последовательности. Транзакция обычно представляет
собой одну команду информационного процессора.
Задачу можно
рассматривать с точки зрения ее экономического содержания и метода решения на
ЭВМ. Экономическая задача является процессом, реализующим некоторую функцию
управления в конкретном подразделении системы управления. С точки зрения
решения на ЭВМ задача представляет собой определенную последовательность
программ, реализующих формирование фиксированного потока выходной информации.
Задачи группируются в подсистемы
в соответствии с принятой классификации основных функций управления
экономическим объектом.
Пользователей
ЭИС условно можно разделить на следующие группы:
·
параметрические
пользователи, которые работают с ЭИС регулярно по регламентированным
процедурам,
·
случайные
пользователи, взаимодействие которых с ЭИС не обусловлено их служебными
обязанностями,
·
аналитики
и исследователи, информационные потребности которых непредсказуемы,
·
прикладные
программисты - разрабатывают ЭИС для параметрических пользователей,
·
системные
программисты и администратор базы данных -
координатор процесса сбора информации, проектирования и эксплуатации базы
данных, обеспечения защиты и целостности данных.
Проектированием
ЭИС
называется процесс составления описания еще не существующей системы (на
разных языках) с различной степенью детализации, в ходе которого осуществляется
оптимизация проектных решений.
Проектирование
системы - описание системы по определенным правилам, которое дает представление
о сущности и логике работы с информацией.
Выполнение
данной работы требует знания теоретических основ ЭИС:
·
свойства,
особенности и структура экономической информации;
·
условно-постоянная
информация, ее роль и назначение;
·
средства
формализованного описания информации;
·
алгоритм,
его свойства и формы представления;
·
назначение
контроля входной и выходной информации, способы контроля;
·
состав
и назначение устройств ЭВМ; носители информации;
·
состав
программных средств, назначение операционных систем, пакетов прикладных
программ, интегрированных пакетов программ и др.
Этапами
проектирования
и разработки ЭИС – укрупнено - являются:
·
обоснование
создания ЭИС,
·
техническое
и рабочее проектирование,
·
ввод
ЭИС в действие.
Более детально:
1. Обследование предметной области:
· перечень
объектов предметной области,
· информационные
потребности пользователей,
· необходимые
процессы обработки данных с указанием их периодичности,
· ТО, на котором
предполагается эксплуатировать ЭИС,
· требования к
функционированию ЭИС.
Результатом
обследования предметной области должно быть техническое задание (ТЗ) на
разработку системы.
2. Определение необходимых
объектов и их атрибутов:
· набор свойств
объектов,
· идентифицирующие
свойства объектов,
· количество
экземпляров каждого объекта и предполагаемая динамика,
· методы
вычислений производных показателей пр.
3. Установление
структурных связей между объектами и процессами. Разработка
структуры БД.
4. Определение
технологии работы ЭИС.
5. Уточнение выбора ТО и выбор
программных средств для реализации ЭИС.
6. Определение сроков реализации
проекта.
Итогом перечисленных выше пунктов 2-6
становится технический проект ЭИС.
7. На стадии рабочего проектирования
необходимо:
· описание всех
компонентов базы данных,
· разработка
экранных форм и системы меню,
· разработка
приложений,
· подготовка
отладочных данных и тестирование на них ЭИС,
· составление
инструкций по работе с ЭИС и обучение пользователей,
· написание
рабочего проекта.
8. Стадия эксплуатации начинается с
заполнения ЭИС реальными данными.
9.
Этапы эксплуатации и модификации ЭИС поочередно меняют друг друга до тех пор,
пока не наступит момент морального старения ЭИС и будет принято
решение о ее ликвидации и разработке принципиально новой системы.
Стадию эксплуатации можно
охарактеризовать как период стабильного функционирования ЭИС, не требующий изменения
ранее принятых проектных решений. Но процесс эксплуатации обычно через
некоторое время прерывается стадиями модификации системы.
Модификация - процесс корректировки проектных
решений по отдельным компонентам ЭИС. Модификация
базы данных и других компонентов ЭИС позволяет поддерживать ее технические и
эксплуатационные характеристики. В процессе эксплуатации ЭИС
осуществляется мониторинг параметров ее и предметной области. Сравнение
результатов за прошлые периоды и отклонение текущих параметров ЭИС от нормативных
могут стать основанием для модификации ЭИС. Большинство процедур модификации
ЭИС могут производиться без прекращения стадии эксплуатации.
Важность
исследования процессов модификация ЭИС поясним такими данными: стоимостные
затраты на модернизацию ЭИС достигают примерно трети объема эксплуатационных
расходов, за год в ЭИС обычно меняется 10-40% первичных документов и 20-50%
выходных документов.
Факторы,
вызывающие модификацию ЭИС:
·
изменения
на объекте управления и во внешней среде,
·
изменение
состава нагрузки ТО, замена оборудования, рост объема файлов БД,
·
накопление
опыта работы с ЭИС,
·
обнаружение
проектных ошибок и пр.
1.
Общие
понятия и задачи проектирования информационного обеспечения
2. Имя, структура и значение единиц информации.
Экономические показатели и документы.
3. Операции над единицами информации.
4. Классификация и кодирование информации
Информационное обеспечение (ИО) представляет собой совокупность проектных решений по объемам,
размещению, формам организации информации. Оно включает в себя совокупность
показателей, справочных данных, классификаторов и кодификаторов информации,
унифицированные системы документации, специально организованные для
автоматического обслуживания, файлы информации на соответствующих носителях, а
также персонал, обеспечивающий надежность хранения, своевременность и качество
технологии обработки информации.
ИО
предназначено для отображения информации, характеризующей состояние
объекта управления. ИО – основа для
принятия управленческих решений. В теории ЭИС различают информационное обеспечение:
·
внемашинное
(удобное для восприятия человеком),
·
внутримашинное
(связано с хранением, поиском, обработкой информации).
Внемашинное
обеспечение:
·
системы
показателей данной предметной области,
·
системы
классификации и кодирования,
·
унифицированная
документация,
·
потоки
информации.
Внутримашинное обеспечение - различные
информационные файлы.
Проектирование
ИО осуществляется в ходе составления технического и рабочего проектов и
предусматривает:
·
инструкции по
подготовке документов к автоматизированной обработке и их кодирование;
·
инструкции по
обработке экономической информации на ЭВМ (ведение файлов БД, организация
запросов, получение выходных данных, обмен информации с другими пользователями
и пр.).
Проектирование структурных единиц
информации
заключается в определении составных единиц информации, их логической структуры
и способов перехода от одних единиц к другим, т.е. структуризация данных
(условно-постоянных, входных, выходных).
Экономическая
информация отражается через систему натуральных
и стоимостных показателей. Выделяют простые (не поддаются дальнейшему расчленению) и составные единицы информации
(СЕИ).
В структуре
экономической информации различают: атрибут, показатель, информационное
сообщение, информационный файл, информационный поток, информационная
подсистема, информационная система.
Основные единицы информации - атрибут и составная единица информации.
Атрибут –
информационная единица низшего уровня, отражает отдельные свойства объекта,
состоит из сочетания цифр и/или букв, имеющих смысловое содержание, не подается
дальнейшему делению. Т.е. атрибут
(элемент данных, реквизит, поле) - неделимая информационная совокупность.
Материальные
процессы имеют качественную и количественную характеристику. Соответственно, и
атрибуты должны подразделяться на два класса: атрибуты - признаки и атрибуты - основания.
Атрибут-признак характеризует качественное свойство отражаемых
сущностей (наименования предприятий, код, номер счета, дата и т.д.), служит для
выполнения логических операций, составления группировок.
Атрибут-основание
характеризует объект, процесс, явление с количественной
стороны (сумма, расценки, количество и т.д.), над которым в процессе
обработки выполняются арифметические действия.
Атрибут
характеризуется именем и значением. Именем атрибута называется его условное
обозначение в процессах обработки данных.
Значением
атрибута называется величина, характеризующая некоторое свойство объекта,
явления, процесса в конкретных обстоятельствах. Все допустимые значения атрибута образуют
множество, называемое доменом этого
атрибута (областью определения атрибута).
Если в домене необходимо перечислить обозначения объектов из некоторого класса,
то разрабатывается классификатор, содержащий условные обозначения (коды) отдельных
объектов и классов, к которым эти объекты отнесены.
Атрибут
с одним именем может иметь несколько различных значений. Например,
Наименование
продукции: чугун, сталь.
Количество:
90, 120, 200.
Атрибуты
объединяются в единицу информации более высокого уровня: сочетание одного
атрибута-основания и всех, относящихся к нему атрибутов-признаков, однозначно характеризующих
условия существования этого основания,
образуют показатель.
Информационное
сообщение: “ Ткань 450 м”.
Здесь
количественный реквизит один - 450,
Реквизитов-признаков
два - ткань, м.
Документы,
характеризующие экономическую деятельность, содержат, как правило, большое
количество показателей. Каждый показатель имеет множество значений и рассчитывается
по своему алгоритму.
Существуют
документы, не содержащие атрибутов-оснований, например анкеты кадрового учета,
сведения о структуре подразделений предприятия и т. д. Следовательно, не вся
экономическая информация может быть представлена в форме показателей.
Одним из
критериев качества создания базы данных может служить минимальная избыточность
хранимой информации: каждое сообщение
хранится в БД один раз. Использование аппарата экономических показателей
позволяет создать структуру БД с минимальной избыточностью, если сначала
декомпозировать все сведения, циркулирующие в АИС, на показатели, а потом
объединить атрибуты родственных показателей по принципу: в один файл включается группа экономических показателей с одинаковым
составом атрибутов-признаков.
Одна из причин
выделения показателей в особую разновидность единиц информации заключается в
том, что показатель является минимальной группой атрибутов, сохраняющей
информативность (осмысленность) и поэтому достаточной для образования
самостоятельного документа. Как единица информации показатель
является составной единицей информации - пример СЕИ.
Вообще аппарат
СЕИ предназначен для описания структуры экономических документов. Документом называется материальный носитель
информации (обычно бланк бумаги), содержащий оформленные в установленном
порядке сообщения, и имеющий юридическую силу. В экономических документах
таблицы не имеют названий, названия всех элементов документа требуются при его
машинной обработке.
Простейшими
характеристиками СЕИ являются имя,
структура и значение. Имя СЕИ -
это ее условное обозначение в процессах обработки информации. Структурой СЕИ называется вхождение
одних единиц информации в состав других единиц информации.
Название свойства |
Атрибут |
Составная единица информацни |
|||
Операции над именем Операции над значением Операции над структурой |
Переименование, объявление синонима |
||||
Перекодирование |
Выборка, корректировка |
||||
|
Арифмети- ческие операции |
|
|||
- |
Декомпозиция, композиция. нормализация, свертка |
|
Проекция, соединение, добавлениеатрибутов |
Добавление/ изъятие атрибутов |
|
Ограничения |
Принад-лежность домену |
Функциональные зависимости |
Отметим базовые операции обработки составных единиц
информации:
Переименованием
единицы информации называется присвоение ей нового имени, объявление
синонима - это установление альтернативного равноценного имени для единицы
информации.
Выборка - операция
выделения подмножества значений заданной информации, которое удовлетворяет условиям
выборки.
Корректировка означает
выполнение одной из операций:
•
добавление нового
значения,
•
исключение
существующего значения,
•
замена некоторого
значения на новое.
Декомпозиция - операция преобразования исходной СЕИ в
несколько СЕИ с различными структурами. Декомпозиция может иметь множество
вариантов.
Композиция - операция преобразования нескольких СЕИ с различными структурами
в одну СЕИ. Декомпозиция и композиция являются взаимообратными операциями.
Нормализация - это операция перехода от СЕИ с
произвольной структурой к СЕИ с двухуровневой структурой (прямоугольная
таблица).
Свертка - операция преобразования СЕИ с
двухуровневой структурой в документ с произвольной многоуровневой структурой,
имеющий экономический смысл.
Совокупность показателей документа образует информационное
сообщение (запись). Группа таких записей, объединенных по определенному
признаку, представляет собой информационный файл – основную
структурную единицу при автоматизированный обработке данных – ядро любой АИС.
Файл – это место, где фактически хранится информация, совокупность всех
записей, включающих различные поля. Обычно в решении экономической задачи
участвуют несколько файлов. Несколько файлов могут составлять БД. БД в целом
также является единицей информации.
Информационные файлы, используемые при решении конкретной
экономической задачи (например, “Расчет заработной платы”) образуют информационный поток. При этом некоторые файлы могут
использоваться в разных задачах, например, нормативно-справочные файлы.
Принадлежность информации к какой-либо функции управления –
основание для организации более высокой структуры – информационной подсистемы (бух.учет, финансовая деятельность и
пр.).
Структурная единица высшего уровня – информационная систем - относится к какому-либо экономическому
объекту (предприятие, банк, отрасль, регион и т.д.).
Приведенные толкования отражают скорее прагматический смысл
терминов, формулировку, более точную в теоретическом смысле, смотри в
соответствующих предыдущих лекциях курса.
Классификация - распределение элементов множества на
подмножества на основании признаков и зависимости внутри признаков (например,
область - районы).
Кодирование
- присвоение условного обозначения кода – знака или группы знаков - по
определенным правилам, принятым в системе кодирования.
Кодированию в документах подлежат те признаки, по которым выполняется группировка информации
в ЭВМ. Проектирование кодов – при
составлении технического и рабочего проектирования.
Если классификация
объектов не требуется, производится их нумерация, и кодом каждого объекта
служит его порядковый номер. Такая система кодирования называется порядковой.
Если
все множество объектов классифицируется по одному признаку, то коды объектов
целесообразно разделить на несколько частей (серий) по количеству значений
этого признака и в пределах каждой серии использовать последовательные
номера – серийная система кодирования.
Когда
используется несколько классификационных признаков и их взаимная подчиненность
соответствует выделению классов объектов, подклассов внутри каждого класса и
т.д., удобно использовать разрядную (позиционную) систему
кодирования.
Можно выделить систему
кодирования с кодом повторения (№ склада в шифре продукции), комбинированную, шахматную.
В
качестве примера рассмотрим различные системы кодирования значений атрибута Код студента.
1). Порядковый
код студента - это его номер в списке всех студентов.
2).
Предположим, что необходимо различать студентов-дневников, студентов ИДО
и заочников с использованием серийной системы кодирования. Для этого
последовательные номера от 1 до 5999 будем использовать при кодировании
дневников, номера от 6000 до 7999 - при кодировании студентов ИДО, от 8000 до
9999 - при кодировании заочников.
3).
Если в этих же условиях применить
разрядный код, то первый знак кода будет принимать три значения (1 -
дневное отделение, 2 – ИДО, 3 - заочное), а следующие 4 знака отводятся для
нумерации студентов каждого отделения. В разрядном коде можно учесть больше признаков,
например, первый знак - код отделения, второй - код факультета, третий - код
курса, четвертый - код группы, пятый и шестой - порядковый номер студента в
группе. Но увеличивая число различимых признаков в коде, мы вынуждены
увеличивать и длину значения атрибута Код
студента.
Классификационные группировки по младшим признакам кодируются в зависимости
от кода более старшего признака.
Требования к кодам:
·
учитывать весь
диапазон значений,
·
быть едиными
внутри одного экономического объекта,
·
иметь резерв
свободных номеров,
·
стабильность,
·
длина кода должна
быть минимальной.
Систематизация экономической информации вызывает необходимость
применения самых разнообразных классификаторов: республиканских, отраслевых,
локальных (данное предприятие).
Изначально выясняется, какие из универсальных классификаторов
могут быть использованы, а затем, при необходимости, разрабатываются локальные.
Проектирование классификаторов:
·
классификация
информации,
·
кодирование
информации.
Коды : цифры, буквы,
буквенно – цифровые.
Классификатор,
как минимум, содержит:
·
код,
·
наименование
позиции.
Классификаторы
используются при подготовке первичных документов к машинной обработке. Хранение
классификаторов в ЭВМ позволяет автоматически формировать необходимую текстовую
информацию в выходных сводках.
1.
Модели данных.
2. Реляционная модель данных
Определение
модели данных предусматривает указание множества допустимых информационных конструкций,
множества допустимых операций над данными и множества ограничений для хранимых
значений данных.
Информационные
конструкции, операции и ограничения моделей данных выбираются из достаточно
небольшого множества вариантов.
Классификация
информационных конструкций (информационных объектов) тесно связана с областью
их использования в ЭИС:
1. Объекты для технологии баз данных -
отношения и веерные отношения.
2. Объекты
для технологии искусственного интеллекта - предикаты, фреймы и семантические сети.
3. Объекты для технологии мультимедиа - тексты,
графические изображения, фонограммы и видеофрагменты.
Количество существенно различных моделей
данных определяется наличием различных множеств информационных конструкций: принципиальными
различиями обладают три модели данных - реляционная, сетевая и иерархическая.
Реляционная модель
данных характеризуется следующими компонентами:
• информационная конструкция
- отношение (таблица) с двухуровневой структурой,
• допустимые операции -
проекция, выборка, соединение и др.,
• ограничения -
функциональные зависимости между атрибутами отношения.
Каждому
классу объектов Р материального мира ставится в соответствие некоторое
множество атрибутов, например А1, А2,...,Аn. Отдельный объект
класса Р описывается строкой величин (а1, а2,..., an), где ai - значение атрибута Ai.
Строка
(а1, а2,..., an) называется кортежем. Всему классу объектов соответствует множество кортежей,
называемое отношением. Обозначим
отношение, описывающее класс объектов Р, также через Р. Выражение Р(А1,
А2,...,Аn)
называется схемой отношения Р.
Каждое отношение
представляет состояние класса объектов в некоторый момент времени.
Следовательно, одной схеме отношения в разные моменты времени могут
соответствовать разные отношения.
Множество
значений отношения можно представить в виде таблицы, в которой соблюдаются
следующие соответствия:
• название
таблицы и перечень названий граф соответствуют схеме отношения,
• строке таблицы
соответствует кортеж отношения,
• все строки таблицы
различны,
• порядок строк
и столбцов произвольный.
Реляционная база данных
представляет собой множество отношений.
Схема реляционной БД содержит следующие
компоненты: S(rel) = <A, R, Dom, Rel, V(s)>,
где А
- множество имен атрибутов,
R - множество имен отношений,
Dom - вхождение атрибутов в домены,
Rel -
вхождение атрибутов в отношения,
V(s) -
множество ограничений (функциональных зависимостей).
Описание
процессов обработки отношений может быть выполнено двумя способами:
•
указанием перечня операций, выполнение которых приводит к требуемому результату
(процедурный подход),
•
описанием свойств, которым должно удовлетворять результирующее отношение (декларативный
подход).
Декларативный
подход основан на интерпретации
понятий и методов математической логики, в частности,
реляционное исчисление базируется на исчислении предикатов. В последнее время
наиболее распространенным декларативным языком запросов является SQL (структурированный язык запросов).
Приводимые
далее операции над отношениями ориентированы на процедурное описание процессов
обработки данных. Множество отношений и операций над ними образует реляционную алгебру.
Как правило, список операций содержит
проекцию, выборку, объединение, пересечение, вычитание, соединение и деление.
Проекцией
называется операция, которая переносит в результирующее отношение те столбцы
исходного отношения, которые указаны в условии операции. Алгебраическая запись
проекции имеет вид: R=I [X],
где I - исходное отношение,
R - результирующее отношение,
Х - список
атрибутов в структуре отношения R
(условие проекции).
Рассмотрим два отношения: W1, содержащее сведения о продаже
продукции и W2, в котором указаны цены на
продукцию и комплектующие изделия для соответствующих видов продукции.
W1 |
|||
Магазин |
Продукция |
План |
Факт |
Динамо Динамо АТЭ АТЭ |
Эдв-12 ЭВИ Эдв-12 Эдв-30 |
120
200 80 150 |
140
200 170 100 |
W2 |
|||
Продукция |
Цена |
Компл. |
|
Эдв-12 |
40 |
Вх-15 |
|
Эдв-12 |
40 |
Р-20 |
|
Эдв-30 |
20 |
Вк-15 |
|
Эдв-30
ЭВИ |
20
120 |
Р-20 Р-20 |
|
Отношение R1, содержит сведения только о
фактическом выпуске продукции (столбцы результирующего отношения могут
указываться в любом порядке): R1 = Wl [Maгaзин, Продукция, Факт]
R1 |
||
Магазин |
Продукция |
Факт |
Динамо Динамо
АТЭ АТЭ |
Эдв-12 ЭВИ
Эдв-12 Эдв-30 |
140 200
170 100 |
Пример 2
- проекция
Получение справочника цен на продукцию: R21
= W2
[Продукция, Цена]
R21 |
|
Продукция |
Цена |
Эдв-12 Эдв-12 Эдв-30 Эдв-30 ЭВИ |
40
40 20 20 120 |
Правильным результатом проекции
является R22
(исключены повторения
строк):
R22 |
|
Продукция |
Цена |
Эдв-12 Эдв-30
ЭВИ |
40
20
120 |
Отношение с заданной
структурой можно получить из различных исходных отношений БД. В этом случае не
гарантируются одинаковые результаты. Пусть нам необходим список отделов
учреждения. В БД имеются отношения Служащий (Фамилия, Отдел,...) и Технолог
(Фамилия, Отдел,...). Проекция Служащий[Отдел] формирует полный список отделов,
а Технолог[Отдел] может содержать меньше значений, если в некоторых отделах не
работают технологи.
Выборкой называется операция, которая переносит
в результирующее отношение те строки из исходного отношения, которые
удовлетворяют условию выборки. Условие выборки проверяется в каждой строке
отношения по отдельности и не может охватывать информацию из нескольких строк.
Существуют две простейшие разновидности условия выборки:
1. Имя_атрибута <знак сравнения>
Значение,
где допускаются знаки
сравнения =, #, >, =>, <, <=.
Например, Цена > 100.
2.
Имя_атрибута_1 <знак сравнения> Имя__атрибута_2
Например, Факт > План.
Имена атрибутов должны содержаться в
структуре исходного отношения.
Алгебраическая запись выборки имеет
вид R = I [X],
где I - исходное отношение;
R - результирующее отношение;
X - условие выборки.
Проекция
– обработка по вертикали, выборка – по горизонтали.
Пример 3 - выборка
Получим
значения R3=
W1[Продукция
= "Эдв-12"]
R3 |
|||
Магазин |
Продукция |
План |
Факт |
Динамо
АТЭ |
Эдв-12
Эдв-12 |
120 80 |
140 170 |
Пример 4 - выборка
Получим
значения R4=
W1[Факт
=> План]
R4 |
|||
Магазин |
Продукция |
План |
Факт |
Динамо
Динамо АТЭ |
Эдв-12
ЗВИ
Эдв-12 |
120 200
80 |
140
200
170 |
В
команде Copy
условия выборки и проекции могут присутствовать одновременно, но атрибуты
условия выборки должны включаться в условие проекции.
Операции
объединения, пересечения
и вычитания производятся над двумя исходными
отношениями с одинаковой структурой.
Обозначим исходные отношения через I1 и I2, а результирующее - R.
Объединение
R
= U(I1, I2) содержит строки, присутствующие
либо в отношении I1,
либо в I2.
Пересечение
R
= C(I1, I2) содержит строки, присутствующие в
отношениях I1
и I2
одновременно.
Вычитание
R
= S(I1, I2) содержит те строки из I1, которые отсутствуют в I2.
Пример 5. Если справочник цен на продукцию R22 необходимо дополнить
новыми сведениями из отношения W3,
то надо выполнить объединение R5 = U (R22, W3):
W3 |
|
R5 |
||
Продукция |
Цена |
Продукция |
Цена |
|
Эдв-42 |
40 |
Эдв-12 |
40 |
|
Тэн-10 |
15 |
Эдв-30 |
20 |
|
|
|
ЗВИ |
120 |
|
|
|
|
Эдв-42 |
40 |
|
|
|
Тэн-10 |
15 |
Операция
соединения отношений
выполняется над двумя исходными отношениями и создает одно результирующее.
Каждая строка первого исходного отношения сопоставляется по очереди со всеми
строками второго отношения, и если для этой пары строк соблюдается условие
соединения, то они образуют очередную строку в результирующем отношении.
Условие соединения имеет вид:
Имя_атрибута_1 <знак сравнения> Имя_атрибута_2,
где Имя_атрибута_1
находится в одном исходном отношении, а Имя_атрибута_2 - в другом. Будем
использовать следующее обозначение операции соединения: R=Il [J] I2,
где I1
и I2
- исходные отношения,
R - результирующее отношение,
J - условие соединения.
На практике наиболее
важный частный случай соединения называется натуральным соединением и имеет
следующие особенности:
• знаком сравнения в условии соединения является "=",
•
Имя_атрибута_1 и Имя_атрибута_2 должны содержать пересечение списков атрибутов
исходных отношений,
•
список атрибутов результирующего отношения образуется в результате объединения
списков атрибутов исходных отношений.
Пример 6.
Сведения о продаже продукции из отношения W1 дополнить данными о ценах
на продукцию из отношения R22:
R6
= Wl [ Продукция = Продукция ] R22:
R6 |
|||||
Магазин |
Продукция |
План |
Факт |
Продукция |
Цена |
Динамо |
Эдв-12 |
120 |
140 |
Эдв-12 |
40 |
Динамо |
ЭВИ |
200 |
200 |
ЗВИ |
120 |
АТЭ |
Эдв-12 |
80 |
170 |
Эдв-12 |
40 |
АТЭ |
Эдв-30 |
150 |
100 |
Эдв-30 |
20 |
Первая строка из W1
и первая строка из R22 удовлетворяют условию
Продукция = Продукция, поэтому сцепляются. Остальные строки из R22 не будут сцепляться с
первой строкой из W1 (условие не соблюдается). Вторая строка из W1 при
сравнении со всеми строками из R22 сцепится только с
третьей строкой и т. д. Если применять операцию натурального соединения, то в
отношении R6
будет отсутствовать второй столбец с именем Продукция.
Примечание: В ряде случаев соединение дает некорректные
результаты, например, соединение W1 и W2 содержит одинаковые сообщения о
выпуске продукции, потому что эти виды продукции используют несколько
комплектующих изделий.
Операция деления отношений.
Пусть
существует отношение W4(ФИО,ЯП),
где для каждого программиста с фамилией ФИО указываются языки программирования
ЯП, которые он знает.
W4 |
|
ФИО |
ЯП |
Иванов |
Си |
Иванов |
Фортран |
Иванов |
Паскаль |
Петров |
Си |
Петров |
Паскаль |
Семин |
Си |
Семин |
Фортран |
Яшин |
Фортран |
Яшин |
Паскаль |
Выборка R71 = W4 [ЯП = "Си" AND ЯП = "Фортран"] создаст пустое отношение (в одной строке
отношения нет информации о двух языках программирования сразу).
В теории, как правило, вводится вспомогательная операция
"образ". В изученных Вами
электронных таблицах (Excel)
и СУБД (Access) это задание реализуется через фильтры и запросы.
Центральная задача проектирования
базы данных ЭИС - определение количества отношений и их атрибутного состава.
Задача группировки атрибутов в
отношения допускает множество различных вариантов решений. Рациональные
варианты группировки должны учитывать следующие требования:
• множество отношений должно обеспечивать
минимальную избыточность представления информации,
• корректировка отношений не должна
приводить к двусмысленности или потере информации,
• перестройка набора отношений при добавлении в
базу данных новых атрибутов должна быть минимальной.
Нормализация представляет собой один
из способов преобразования отношений, позволяющих улучшить характеристики БД по
перечисленным критериям.
Ограничения на значения, хранимые в
реляционной базе данных, достаточно многочисленны. Соблюдение этих ограничений
связано с наличием нормальных форм. Процесс преобразования отношений базы данных
к той или иной нормальной форме называется нормализацией отношений.
Нормальные формы нумеруются последовательно от 1 по возрастанию, и чем больше
номер нормальной формы, тем больше ограничений на хранимые значения должно
соблюдаться в соответствующем отношении.
Ограничения,
типичные для реляционной модели данных - это функциональные и многозначные
зависимости, а также их обобщения (обеспечивается
сокращение избыточной информации в реляционной БД). Множество дополнительных ограничений может расти и,
соответственно, будет увеличиваться число нормальных форм.
Отношение в первой нормальной форме
(сокращенно 1НФ) - это обычное отношение с двухуровневой структурой.
Недопустимость в структуре отношения
третьего и последующих уровней является ограничением, определяющим 1НФ -
отношения.
Преобразование ненормализованного отношения в
представление, соответствующее 1НФ - это операция нормализации. Реляционная база данных в целом
характеризуется 1НФ, если все ее отношения соответствуют 1НФ.
Следующие нормальные формы (вторая и третья)
используют ограничения, связанные с понятием функциональной зависимости.
Функциональные
зависимости определяются для атрибутов, находящихся в одном и том же отношении,
удовлетворяющем 1НФ. Простейший случай функциональной зависимости охватывает 2
атрибута. В отношении R(A,B,...) атрибут А функционально
определяет атрибут В, если в любой
момент времени каждому значению А соответствует
единственное значение В (обозначается А ®В).
Иначе говорят, что В функционально
зависит от А (обозначается В = f(A)). Отсутствие функциональной
зависимости обозначается А—/®
В.
Пример
1.
I1 |
|
ФИО |
ГР |
Иванов Зуев Смирнов Яшина |
I960 1963 1960 1961 |
Предположим, что в столбце ФИО
представлены сведения о разных людях и значения не повторяются. Тогда можно
утверждать: ФИО ® ГР, поскольку у каждого человека единственный год рождения. Наличие в столбце ГР
повторяющихся годов (I960) означает ГР —/® ФИО.
Практически каждое ограничение для
проверки функциональной зависимости можно преобразовать в утверждение о
свойствах объектов предметной области.
Одновременное соблюдение двух
зависимостей вида А ® В и В ® А называется взаимно-однозначным
соответствием и обозначается А « В.
Пример
2.
I2 |
|
Магазин |
Расч |
ММЗ Динамо АТЭ |
704098 122096 440162 |
Можно допустить, что у каждого магазина единственный
номер расчетного счета и утверждать, что каждый расчетный счет принадлежит
единственному магазину. Это доказывает справедливость функциональных
зависимостей Магазин ® Расч и Расч ®
Магазин, т.е. Магазин « Расч.
Примера
3.
I3 |
|
ФИО |
Дисциплина |
Петров Федин Алешин Петров |
Физика Химия Физика Химия |
Отношение
I3
описывает экзамены, сдаваемые студентами:
ФИО —/®
Дисциплина и Дисциплина —/® ФИО, т.к. каждый студент сдает экзамены по нескольким
дисциплинам, и по каждой дисциплине экзамен сдается многими студентами. Т.е.
отсутствуют функциональные зависимости.
Таким
образом, для атрибутов А и В некоторого отношения возможны следующие ситуации:
• отсутствие
функциональной зависимости,
• наличие А ®
В (или В ®
А), но не обе зависимости вместе,
• наличие
взаимно-однозначного соответствия А« В.
Понятие
функциональной зависимости распространяется на ситуацию с тремя и более
атрибутами в следующей форме. Группа атрибутов (для определенности А,В,С)
функционально определяет атрибут D
в отношении T(A,B,C,D,....), если каждому сочетанию
значений <а,b,с>
соответствует единственное значение d
(а - значение A,
b
- значение В, с - значение С, d
- значение D). Наличие такой функциональной зависимости будем обозначать А,В,С ®
D.
Существование функциональных зависимостей связано
с применяемыми способами кодирования атрибутов. Так, для множества
учреждений можно утверждать, что каждый отдел (как объект предметной области)
относится к единственному учреждению. Однако этого недостаточно для
доказательства функциональной зависимости Отдел
®
Учреждение. Если в каждом учреждении отделы
нумеруются последовательно, начиная с 1, то функциональная зависимость неверна.
Если же код отдела, кроме номера, содержит и код учреждения (или уникальность
кодов обеспечивается каким-то другим способом), то функциональная зависимость Отдел ® Учреждение
справедлива.
Зависимость ФИО®ГР
в I1
соблюдается, если ФИО является атрибутом- идентификатором для каждого человека,
что может быть справедливо только для небольших множеств людей.
Для показателя со множеством
атрибутов-признаков Р = {Р1, Р2, ... ,Рn} и атрибутом-основанием Q справедлива функциональная
зависимость Р ®
Q, но нельзя утверждать, что это единственная зависимость на указанных
атрибутах.
С помощью функциональных зависимостей
определяется понятие ключа отношения -
вероятный, первичный и вторичный.
Вероятным
ключом отношения
называется такое множество атрибутов, что каждое сочетание их значений
встречается только в одной строке отношения, и никакое подмножество атрибутов
этим свойством не обладает. Вероятных ключей в отношении может быть несколько.
Примера
4.
I4 |
||||
ZEN |
RAM |
AST |
SPIM |
BIG |
1А |
31 |
dwa |
wii |
73 |
ЗВ |
21 |
bun |
CUD —*K |
40 |
3D |
30 |
mun |
lam |
58 |
40 |
31 |
sab |
wii |
40 |
Вероятным ключом
отношения I4
является атрибут ZEN и пара атрибутов RAM, AST.
Выборка по известному значению вероятного ключа дает
в результате одну строку отношения либо ни одной.
Когда в отношении присутствует
несколько вероятных ключей, целесообразно выбрать один из них в качестве
основного (первичного).
Первичным
ключом
отношения называется такой вероятный ключ, по значениям которого производится
контроль достоверности информации в отношении (интересующий
в данный момент аспект).
Применительно к экономической
информации часто отношения содержат единственный вероятный ключ, который и
является первичным ключом. Наличие двух и более вероятных ключей в отношениях
можно объяснить наличием нескольких возможных способов интерпретации одних и
тех же данных. Первичный ключ часто называется просто ключ.
В отношениях с большим числом строк
нахождение первичного ключа путем непосредственного применения определения
достаточно затруднено. Кроме того, на стадии проектирования ЭИС значения многих
отношений просто неизвестны. Поэтому практически первичный ключ
отношения определяется по известным функциональным зависимостям.
Каждое значение первичного ключа
встречается только в одной строке отношения. Значение любого атрибута в этой
строке также единственное. Если через К обозначить атрибуты первичного ключа в
отношении R(A,B,C,... J), то справедливы следующие функциональные
зависимости К ®А,
К ®
В, К ®
С,..., К ®
J.
Набор
атрибутов первичного ключа функционально определяет любой атрибут отношения.
Обратно: если найдена группа атрибутов, которая функционально определяет все
атрибуты отношения по отдельности, и эту группу нельзя сократить, то найден
первичный ключ отношения.
Пример
5.
I5 |
||||
ФИО |
Дисциплина |
Дата |
Преподаватель |
Оценка |
Петров
Федин Алешин Петров |
Физика
Химия Физика Химия |
10.02.11 10.02.11 14.02.11 14.02.11 |
Иванов Смирнов Иванов Смирнов |
4 5 5 5 |
Ограничение, состоящее в том, что
студент не может в один день сдать два и более экзаменов означает
справедливость ряда функциональных
зависимостей:
ФИО, Дата ® Дисциплина,
ФИО, Дата ® Преподаватель,
ФИО, Дата® Оценка.
ФИО, Дата ®ФИО,
ФИО, Дата ®Дата
Следовательно, первичный ключ в
отношении I5
составляют атрибуты ФИО, Дата и при поиске ключа не потребовались конкретные
значения I5.
Для множества
функциональных зависимостей одного отношения существует ряд закономерностей,
которые выражаются теоремами. Знание теорем позволяет из исходного множества
функциональных зависимостей получать производные зависимости.
Теорема1
А, В ® А и А, В ® В.
Доказательство основано на том,
что в строке <а,b>
для атрибутов А и В значение а (как и значение b) присутствует один раз.
Теорема 2
А ® В и А ® С тогда и только тогда, когда А ®ВС.
Рассмотрим
произвольное значение а атрибута А. Если А®В и А®С,
то im[2]В(а) и
imC(a) содержат по одному элементу. Предположим, что зависимость А ®
ВС неверна и im ВС(а) состоит из 2 или более элементов. Тогда либо im В(а),
либо im С(а) должны содержать более одного элемента. Полученное противоречие
доказывает зависимость А ® ВС.
Обратно, если А ®
ВС, то imВС(а) содержит один элемент вида <b,с> для любого а. Зафиксируем
некоторое значение al. Значение b (как и значение с) встречается в сочетании с
al только один раз, следовательно, справедливо А ® В и А ®
С.
Теорема
3
Если
А®В и В®С, то А ® С.
Предположим, что
зависимость А ®
С неверна и множество imС(а) содержит более одного элемента. Каждому
значению а соответствует единственное значение b (в силу А ®
В), поэтому imC(b) содержит более одного элемента. Получилось
противоречие с условием В ® С, что и доказывает теорему.
Доказательства
остальных теорем опираются на первые 3 теоремы.
Теорема 4
Если
А ®
В, то АС ® В (С произвольно).
Доказательство :
АС ® А (теорема 1), А ® В (условие),
следовательно, АС ® В по теореме 3.
Теорема 5
Если
А ® В, то АС ®ВС ( С произвольно).
Доказательство: АС ®
В (теорема 4), АС ® С (теорема 1), следовательно, АС ®
ВС по теореме 2.
Теорема 6
Если
А ® В и ВС ® D, то AC ®
D.
Доказательство
Из
А ®
В следует АС ®
ВС (теорема 5). ВС ®
D (условие), поэтому АС ®D по теореме 3.
Количество
теорем, которые можно доказать в таком стиле, можно расширить.
Для некоторого множества
функциональных зависимостей F
введем множество F~,
называемое покрытием. Покрытие F~
содержит все функциональные зависимости, которые можно получить из множества F
в результате применения теорем 1-6 (включая и содержимое F). Одно и то же покрытие
F~
может быть получено из различных множеств функциональных зависимостей. Среди
таких множеств выделим множество с минимальным числом зависимостей и назовем
его минимальным покрытием (базисом) множества зависимостей
F.
Иначе: минимальным покрытием называется
множество функциональных зависимостей, из которого удалены все зависимости,
являющиеся следствиями оставшихся зависимостей и теорем 1-6.
Т.о. зависимости, указанные в
условии той или иной теоремы, остаются в списке функциональных зависимостей, а
зависимости, указанные в заключении теоремы, удаляются.
Если известно, что вероятный ключ в
отношении один, то его можно найти простым способом: это набор атрибутов, которые не встречаются в правых частях
функциональных зависимостей.
Иными словами, из полного списка атрибутов отношения
необходимо вычеркнуть атрибуты, встречающиеся в правых частях всех
функциональных зависимостей. Оставшиеся атрибуты образуют первичный ключ.
1.
Экономическая информатика. Введение в экономический
анализ информационных систем: Учебник: М.И. Лугачев и др. – М.: Экономический
факультет МГУ им. М.В.Ломоносова, 2005 г., 958 с. Главы 1-2.
2.
Закон РФ “Об
информации, информатизации и
защите информации ”. Информационные ресурсы.
3.
Информатика : учебник для студентов вузов/ Н.В.
Макарова, Л.А. Матвеев, В.Л. Бройдо и др.; под ред. Н.В.Макаровой. – 3-е
перераб. изд. – М.:Финансы и статистика, 2008. –765с.
4.
Мишенин А.И.
Теория экономических информационных систем: учебник для студентов вузов/
А.И. Мишенин. ─ 4-е изд., доп. и перераб. ─ М.:Финансы и
статистика,2000. ─ 239с. ─ ISBN 5-279-01987-9.