Тема: 10 Анализ информационных ресурсов
1. Информационные ресурсы предприятия. 2. Жизненный цикл управления информационными ресурсами. 3. Методы анализа и синтеза информационных ресурсов
1. Информационные ресурсы предприятия
Информационный ресурс – это информация в любом виде, которую можно многократно использовать для решения проблем пользователей. Например, это может быть файл, документ, вебсайт, база данных, база знаний.
Классификация информационных ресурсов может осуществляться различными способами. Так, различают понятия данных и знаний. Под данными понимается представление фактов (наблюдений за объектами, событиями, явлениями, процессами) в формализованном виде, пригодном для передачи и обработки. Знания же помимо фактов отражают закономерности процессов и явлений, а также правила использования этой информации для принятия решений. Отличительной способностью знаний является их способность порождать новые факты и знания, т. е. они активны. Ряд авторов наряду с категориями данных и знаний вводят понятия информации, сведений, понимания и др. В частности, Р. Акоф вводит следующую иерархию, в которой каждая категория является основой, материалом для получения следующего, более обобщенного понятия.
При этом под данными понимаются некоторые символы, рассматриваемые безотносительно к какомулибо контексту. Информацией называется выделенная и упорядоченная часть всего массива данных, обработанная для использования. Знания - это выявленные тенденции или существенные связи между фактами и явлениями, представленные в информации. Понимание -это осознание закономерностей, содержащихся в разрозненных знаниях, позволяющее ответить на вопрос «Почему?». И, наконец, мудрость взвешенное, оцененное понимание закономерностей с точки зрения прошлого и будущего. Знания также подразделяют на различные классы. Некоторые из классов приведены на рис. Неявные знания существуют в умах людей и являются результатом генетической наследственности, обучения, чтения, а также приобретенного жизненного опыта. Явные знания зафиксированы в виде, пригодном для распространения. Они хранятся на реальных физических носителях в книгах, документах, схемах, аудио и видеозаписях, электронных файлах и т. д.
Неявные знания являются личностными, индивидуальными знаниями, а явные, как правило, - общедоступными, распространяемыми. Эвристические знания - это знания, почерпнутые из эмпирических наблюдений, опыта, основанные на интуиции и здравом смысле. К теоретическим знаниям относятся законы, теории, абстракции, обобщения. Это общезначимые факты, определения, закономерности, признанные специалистами в соответствующей предметной области. Декларативными (описательными) являются знания о свойствах, характеристиках объектов предметной области, их структуре и отношениях. Процедурные (операционные) это знания о методах, способах решения задач, например: алгоритмы, компьютерные программы. В контексте данного параграфа под информационными ресурсами будем понимать разнообразные знания (включающие в себя данные), используемые специалистами предприятия в процессе своей профессиональной деятельности. При этом активы знаний могут находиться в различных местах: в документах, картотеках, базах данных, головах специалистов и могут быть рассредоточены по всему предприятию. Это создает ряд проблем [83]: • информация захоронена в огромном количестве документов и данных, доступ к которым затруднен, в результате работники тратят слишком много времени на поиск необходимой информации; • опыт ведущих и наиболее квалифицированных сотрудников используется только ими самими; • происходит дублирование информации и операций по ее сбору, хранению и переработке. Основным средством консолидации разрозненных знаний является корпоративная память совокупность явных знаний, полученных из различных источников (в том числе и путем извлечения и формализации неявных знаний), доступных специалистам для решения производственных задач. Знания содержатся в едином хранилище, что обеспечивает 255 оперативный доступ, устранение дублирования, интеграцию различной информации. Наиболее типичными компонентами корпоративной памяти являются:
• базы данных (фактографические, реляционные), содержащие структурированные данные, обеспечивающие однократный ввод и многократное использование хранимых данных; • документы - текстовые файлы (отчеты, инструкции, методики, спецификации), чертежи, электронные таблицы, вебстраницы и др.; • базы знаний - формализованные эвристические и теоретические знания о предметной области, описанные на языках представления знаний (логических, продукционных, фреймовых, языках семантических сетей). Для структурирования разнообразных компонент корпоративной памяти, обеспечения быстрого доступа к ним используются метаданные, т. е. данные о данных. К ним относятся структура баз данных и баз знаний, каталоги, структура архивов. По сути, это «карта» расположения разнообразных знаний в хранилище. Пример структуры корпоративного хранилища с выделенным уровнем метаописаний данных, документов и знаний приведен на рис 5.21.
Метаописаниях хранятся отдельно от содержательной информации в специальной части хранилища, называемой репозитарием. Они получили широкое распространение в борьбе с информационной перегрузкой. Репозитарий не только ускоряет и облегчает поиск необходимой информации, но и позволяет оптимизировать структуру баз данных, баз знаний и документальных БД, устранить дублирование.
2. Жизненный цикл управления информационными ресурсами.
Исследованием процессов создания, распространения, обработки и использования информации внутри предприятия занимается специальная научная дисциплина Knowledge Management (KM), или управление знаниями. В литературе по данной тематике встречаются различные, хотя во многом и похожие, описания жизненного цикла знаний. Можно выделить три укрупненных стадии (рис. 5.22).
1. Выявление знаний. Начальным шагом является потребность в знаниях, возникающая у сотрудников компании в процессе их профес¬ сиональной деятельности выполнении бизнеспроцессов или управлении ими. Определяются «разрывы» между существующей на предприятии информацией и необходимой. При этом анализируются задачи, выполняемые менеджерами и рядовыми сотрудниками, требуемые для решения задач исходные данные, а также способы обработки данных (процедурное знание). Собственно, выявление отсутствующих знаний осуществляется как путем стихийного и бессистемного накопления информации по мере ее необходимости, так и с помощью целенаправленного извлечения знаний путем опросов, интервью, обсуждений, наблюдений, накопления статистики, поиска в литературных источниках, в Интернете и т. д. На этом этапе широко используются методы системного анализа, методы инженерии знаний (раздел искусственного интеллекта, изучающий формы представления знаний и способы их выявления), социологические методы, статистика. 2. Создание знаний. На данном этапе происходит создание корпоративной памяти в виде единого хранилища или нескольких предметноориентированных хранилищ. Этот процесс включает в себя: • структурирование выделение основных понятий, определение структуры представления информации; • формализацию представление информации в форматах машинной обработки, т. е. на выбранных языках представления данных и знаний; • наполнение собственно создание баз данных, баз знаний, документов, депозитариев; • обслуживание хранимых знаний добавление, обновление, удаление информации. Методы построения баз данных и баз знаний достаточно хорошо развиты. Существует множество инструментальных средств (CASEсредств), поддерживающих разработку, в том числе с помощью визуального проектирования, предполагающего на первом этапе формирование концептуальных диаграмм представления данных и знаний. В настоящее время активно развиваются методы и средства построения онтологий концептуальных систем понятий и терминов, описывающих некоторую предметную область. Онтологии являются основой для объединенной эксплуатации данных, документов и формального знания путем построения объединенных метамоделей. 3. Использование знаний. Хранимые в корпоративной памяти знания используются с помощью различных прикладных программ для поддержки бизнеспроцессов и принятия управленческих решений. Основные функции, выполняемые на данном этапе: • поиск, фильтрация выделение информации, запрашиваемой конкретным пользователем и отвечающей заданным требованиям; • обработка выполнение преобразований информации, например: статистическая обработка данных, поиск решения на некоторой математической модели, дедуктивный логический вывод на базе правилпродукций, пополнение знаний и др.; • отображение формирование разнообразных отчетов по результатам поиска и обработки информации, построение диаграмм (столбиковых, круговых), графиков; • распространение передача информации в нужное место, в нужное время, с нужным качеством. В ходе использования знаний может оказаться, что для решения некоторых задач недостаточно имеющихся информационных ресурсов и необходима следующая итерация жизненного цикла знаний.
3. Методы анализа и синтеза информационных ресурсов
Рассмотрим некоторые из методов, используемых в цикле управления информационными ресурсами предприятия, которые опираются на аппарат теории систем и системного анализа. Анализ необходимой информации путем моделирования бизнеспроцессов. Данный метод используется на этапе выявления знаний для определения потребности в информационных ресурсах. Метод состоит в декомпозиции бизнеспроцесса, связанного с обработкой информации, и сопоставлении отдельным операциям исходных данных, управляющей, результирующей информации, а также информационных систем, осуществляющих обработку информации. Для наглядности используются графические модели бизнеспроцесса, например, построенные с помощью таких методологий моделирования, как IDEF0, DFD, ARIS. При использовании методологии IDEF0 (см. п. 3.2.3) отдельные операции представляются в виде функциональных блоков; исходная информация в виде входящих дуг; результирующая в виде выходящих дуг; регламентирующая выполнение операции и принимаемая во внимание в виде дуг управления; используемые информационные системы в виде дуг механизма. На рис. 5.23 представлен пример процесса обработки заказа.
Более богатые возможности по отражению формы и содержания информации, используемой в бизнеспроцессах, предоставляет методология ARIS. В частности, для этой цели могут быть использованы такие диаграммы, как событийная цепочка процесса (Extended event driven processchain eEPC), диаграмма информационных потоков (Information flow diagram), карта знаний (Knowledge map). Для примера рассмотрим представление бизнеспроцесса на диаграмме eEPC. Диаграмма отражает последовательность событий и функций в рамках процесса, а также связанные с функциями ресурсы (человеческие, информационные, материальные) и выходы. Пример модели eEPC приведен на рис. 5.24.
Функция представляет некоторое действие (шаг процесса). С функциеймогут быть связаны: исполнители (сотрудники или подразделения), входные и выходные документы, используемое программное обеспечение и т. д. Событие описывает какоелибо завершенное состояние системы. С одной стороны, события инициируют выполнение функций, с другой они следуют из предшествующих функций и описывают, таким образом, их результат. Логические операторы AND (И), OR (ИЛИ), XOR (исключающее ИЛИ) связывают события и функции. С их помощью моделируются логические разветвления в потоке процесса. Оценка уровня управления знаниями. Периодическая оценка эффективности использования знаний позволяет выявить проблемы в системе управления знаниями, такие как устаревание знаний, затрудненный доступ к отдельным категориям знаний, несоответствие имеющихся информационных ресурсов требованиям и др. Для удобства оценки желательно структурировать весь массив используемых в компании знаний путем декомпозиции по категориям. Разделение может осуществляться по областям знаний, таким как знания об управлении проектами, знания о технологии производства, знания о клиентах и конкурентах, знания о системах менеджмента качества и т. д. Могут быть выделены также классы явного (документированного) знания и неявного. Классификация может осуществляться по источникам знаний и форме представления. Наглядным средством отображения различных категорий знаний является диаграмма структуры знаний, входящая в методологию ARIS. На рис. 5.25 приведен пример диаграммы, описывающей знания о менеджменте качества.
Для оценки отдельных категорий знаний могут быть использованы следующие показатели [84]: • частота корректировки как часто обновляются знания данной категории; • степень охвата насколько знания распространены среди персона ла компании; • использование знаний интенсивность применения категории знний; • важность (ценность) насколько облегчает данная категория знаний принятие решений. Используются либо числовые значения (например, процент или число от 0 до 1), либо лингвистические (например, низкий уровень, средний, высокий). При оценке по каждому показателю определяется желаемый и фактический уровень. В табл. 5.9 приводится пример оценки знаний по менеджменту качества. Использованы следующие множества значений: для показателя «частота корректировки» ежечасно, ежедневно, еженедельно, ежемесячно, ежегодно, редко, никогда; для показателя «степень охвата» процент от общей численности персонала; для показателя «использование знаний» количество запросов на получение информации (за год); для показателя «важность» экспертная оценка по 10балльной шкале.
Поскольку основной задачей является определение проблем, связанных с отдельными категориями знаний, вычислять интегральную оценку в данном случае нет смысла. Необходимо зафиксировать расхождения между желаемым и фактическим значениями по каждой из категорий. Величина расхождения определяет глубину соответствующей проблемы. По результатам оценки необходимо составить список выявленных проблем. Проблемы могут быть про ранжированы по важности. Построение онтологий. Онтологии (от др.греч. онтос сущее и логос учение, понятие) используются для структурирования знаний об объектах, понятиях и связях между ними. Другими словами, это концеп¬ туальные знания в виде формально представленной системы категорий, являющейся следствием определенного взгляда на мир [83]. Онтологии могут выступать основой для построения баз знаний, баз данных, репозитариев. Знания, представленные в онтологии, могут использоваться раз¬ личными приложениями, отчуждаться от конкретных разработчиков и разделяться пользователями. Онтологию можно задать как взаимосвязанную совокупность трех компонент: • конечного множества концептов (понятий, терминов) предметной области; • множества отношений между концептами; • множества логических аксиом, заданных на концептах или их отношениях. Как правило, построение онтологии начинается с формирования глоссария основных понятий и таксономии иерархической структуры, в которой понятия связаны отношениями «общеечастное» или «быть элементом класса» (isa). Это иерархия классов (см. п. 2.5, 4.3.2). На нижнем уровне представлены экземпляры, сопоставленные конкретным объектам, выше располагаются классы объектов, на верхних уровнях мета классы, т. е. понятия высокого уровня обобщения. На рис. 5.26 представлен при¬ мер таксономии (составлен на основе).
Помимо отношений типа «общее частное» между концептами могут быть установлены разнообразные бинарные отношения, имеющие различную семантику. Каждое отношение может быть представлено в виде тройки: Субъект и объект представляют собой соответственно исходный и конечный элементы отношения, предикат само отношение. Как правило, наименования субъекта и объекта выражены в виде существительного, предиката глаголом. Примеры бинарных отношений. Множество бинарных отношений удобно представлять в виде размеченных ориентированных графов. Пример такого графа приведен на рис. 5.27 (составлен на основе).
Понятия, входящие в глоссарий, а также бинарные отношения могут характеризоваться множеством атрибутов. С помощью присвоения атри¬ бутам конкретных значений специфицируются экземпляры понятий. По сути, используется объектноориентированное представление знаний. На рис. 5.28 приведены примеры описания классов.
1.
|