МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ

Федеральное государственное бюджетное образовательное учреждение  высшего образования

«ДАГЕСТАНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»

Информатики и информационных технологий

 

 

 

 

ЛАБОРАТОРНЫЙ ПРАКТИКУМ

 

Для бакалавров 2-го курса по направлению

«Прикладная информатика в экономике»

по дисциплине

АНАЛИТИЧЕСКИЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ

 

Кафедра Информационных технологий и моделирования экономических процессов 

факультет Информатики и информационных технологий

       

 

Разработчик: к.э.н., доцент кафедры ИТиМЭП Рабаданова Р.М.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Оглавление

ЛАБОРАТОРНЫЕ РАБОТЫ  ПО ИЗУЧЕНИЮ ВОЗМОЖНОСТЕЙ АНАЛИТИЧЕСКОЙ ПЛАТФОРМЫ... 2

«DEDUCTOR». 2

Лабораторная работа №1. Знакомство с АП «Deductor. 2

Лабораторная работа №2. Реализация алгоритма построения. 6

дерева решений. 6

Лабораторная работа №3. Логистическая регрессия и ROC-анализ. 14

Лабораторная работа №4. Применение алгоритма кластеризации: самоорганизующиеся карты Кохонена. 22

ЛАБОРАТОРНЫЕ  РАБОТЫ ПО ИЗУЧЕНИЮ ИАС «СЕМАНТИЧЕСКИЙ АРХИВ». 27

Лабораторная работа №1. «Сценарий работы пользователя с модулем поиска «Искатель»  27

Лабораторная работа №2. Добавление данных в базы данных. 36

Лабораторная работа №3. Работа в витрине  «Сквозного поиска». 42

Лабораторная работа №4. Перенос данных из АРМ... 52

«Оператор» в «Аналитик». 52

Лабораторная работа №5. Построение семантических сетей. 58

 

 

 

ЛАБОРАТОРНЫЕ РАБОТЫ  ПО ИЗУЧЕНИЮ ВОЗМОЖНОСТЕЙ АНАЛИТИЧЕСКОЙ ПЛАТФОРМЫ

«DEDUCTOR»

 

Лабораторная работа №1. Знакомство с АП «Deductor

 

1.1.   Основная цель

 

Целью выполнения данной лабораторной работы является:

-       получение     первоначальных     сведений     о     возможностях аналитической платформы;

-       изучение основных модулей; работа с мастерами импорта, экспорта, обработки и визуализации данных.

 

1.2.   Теоретическая часть

 

АП «Deductor» применима для решения большого спектра задач, таких как создание аналитической отчетности, прогнозирование, поиск закономерностей и пр. Можно сказать, что данная система применима в задачах, где требуется консолидация и отображение данных различными способами, построение моделей и последующее применение полученных  моделей к новым данным.

Рассмотрим некоторые задачи,  решаемые АП:

-  Системы корпоративной отчетности. Готовое хранилище данных и гибкие механизмы предобработки, очистки, загрузки, визуализации позволяют быстро создавать законченные системы отчетности в сжатые сроки.

-  Обработка нерегламентированных запросов. Конечный пользователь может с легкостью получить ответ на вопросы типа "Сколько было продаж товара по группам  в Московскую  область   за


прошлый год с разбивкой по месяцам?" и просмотреть результаты наиболее удобным для него способом.

-  Анализ тенденций и закономерностей, планирование, ранжирование. Простота использования и интуитивно понятная модель данных позволяет вам проводить анализ по принципу «Что, если...?», соотносить ваши гипотезы со сведениями, хранящимися в базе данных, находить аномальные значения, оценивать последствия принятия бизнес-решений.

-  Прогнозирование. Построив модель на исторических примерах, вы можете использовать ее для прогнозирования ситуации в будущем. По мере изменения ситуации нет необходимости перестраивать все, необходимо всего лишь дообучить модель.

-  Управление рисками. Реализованные в системе алгоритмы дают возможность достаточно точно определиться с тем, какие характеристики объектов и как влияют на риски, благодаря чему можно прогнозировать наступление рискового события и заблаговременно принимать необходимые меры к снижению размера возможных неблагоприятных последствий.

-  Анализ данных маркетинговых и социологических исследований. Анализируя сведения о потребителях, можно определить, кто  является вашим клиентом и почему. Как изменяются их пристрастия в зависимости от возраста, образования, социального положения, материального состояния и множества других показателей. Понимание этого будет способствовать правильному позиционированию ваших продуктов и стимулированию продаж.

-  Диагностика. Механизмы анализа, имеющиеся в системе Deductor, с успехом применяются в медицинской диагностике и диагностике сложного оборудования. Например, можно построить модель на основе сведений об отказах. При ее помощи быстро локализовать проблемы и находить причины сбоев.

-  Обнаружение объектов на основе нечетких критериев. Часто встречается ситуация, когда необходимо обнаружить объект, основываясь не на таких четких критериях, как стоимость, технические характеристики продукта, а на размытых  формулировках, например, найти продукты, похожие на ваши с точки зрения потребителя.

 

1.3.      Практическая часть

 

После запуска «Deductor Studio Academic» появится главное окно программы.


Главное окно после запуска программы Deductor Studio

 

Для начала работы необходимо создать новый сценарий, воспользуемся для этого мастером импорта (кнопка  в левой части главного окна либо клавиша F6).

Импорт данных включает в себя:

-       выбор типа источника данных;

-       выбор файла источника данных;

-       указание параметров импорта;

-       указание параметров столбцов;

-       выбор      способа      отображения      данных      (при      выборе

«Диаграммы», «Гистограммы» или «OLAP-куба» потребуется дополнительно указать параметры построения);

-       указание имени, метки и описания данных.

Выполнив вышеуказанные действия по импорту данных, на панели «Сценарии» мы получим новый узел, с заданными именем, меткой и описанием.


 

Пример создания сценария, вкладка «Статистика»

 

Изучим  возможности  мастера  обработки  (кнопка    в левой части главного окна либо клавиша F7). После запуска мастера обработки появится список возможных способов обработки данных.

Список доступных способов обработки данных


Все способы разделены на четыре основные группы: очистка данных, трансформация данных, Data Mining, пр. Каждый способ обработки имеет название и краткое описание.  Выбор  способа зависит от целей обработки данных (например, сортировка и фильтрация данных, построение дерева решений и пр.).

Мастер визуализации позволяет определить способ отображения данных, указать метки и добавить описание к проекту. Запустить его можно с помощью кнопки  либо клавишей F5.

Готовый проект можно экспортировать, воспользовавшись мастером экспорта   (кнопка   основного окна либо клавиша F8). Указав параметры, проект можно перенести в один из доступных форматов.

 

1.4.   Задание

 

1.    Опишите назначение и возможности АП «Deductor».

2.    Запустите     программу          «Deductor     Studio     Academic», ознакомьтесь с назначением кнопок и контекстным меню главного окна программы.

3.    Воспользуйтесь мастером импорта данных (импортируйте любой файл, например из C:\Program Files\ BaseGroup\ Deductor\ Samples\ *.txt ).

4.    Ознакомьтесь с доступными способами обработки данных.

5.    Изучите возможности мастера визуализации и  экспорта. Какие параметры доступны для мастера экспорта данных?

6.    Создайте отчет.

 

Лабораторная работа №2. Реализация алгоритма построения

дерева решений

 

2.1.   Основная цель

 

Изучить алгоритм «Построение дерева решений» и научиться обрабатывать с его помощью данные.

 

2.2.   Теоретическая часть

 

Своевременная разработка и принятие правильного решения - это одна     из     главных     задач     работы     управленческого  персонала


организации, т.к. необдуманное решение может дорого обойтись компании. Зачастую на практике результат одного  решения заставляет нас принимать следующее решение и т. д. Когда же нужно принять несколько решений в условиях неопределенности, когда каждое решение зависит от исхода предыдущего, то применяют  схему, называемую деревом решений.

Дерево решений это графическое изображение процесса  принятия решений, в котором отражены альтернативные решения, соответствующие вероятности, и выигрыши для любых комбинаций альтернатив.

Дерево решений представляет один из способов разбиения множества данных на классы или категории. Корень дерева неявно содержит все классифицируемые данные, а листья определенные классы после выполнения классификации. Промежуточные узлы дерева представляют пункты принятия решения о выборе.


Структура дерева решений

 

Построение дерева решений

 

Пусть нам задано некоторое обучающее множество T, содержащее объекты, каждый из которых характеризуется m атрибутами, причем один из них указывает на принадлежность объекта к определенному классу.

Пусть через {C1, C2, ... Ck} обозначены классы, тогда существуют 3 ситуации:

-   множество T содержит один или более примеров, относящихся к одному классу Ck. Тогда дерево решений для Т – это лист, определяющий класс Ck;


-   множество T не содержит ни одного примера, т.е. пустое множество. Тогда это снова лист, и класс, ассоциированный с листом, выбирается из другого множества отличного от T, скажем, из множества, ассоциированного с родителем;

-   множество T содержит примеры, относящиеся к разным классам. В этом случае следует разбить множество T на некоторые подмножества. Для этого выбирается один из признаков, имеющий два и более отличных друг от друга значений O1, O2, ... On. T разбивается на подмножества T1, T2, ... Tn, где каждое подмножество  Ti содержит все примеры, имеющие значение Oi для выбранного признака. Эта процедура будет рекурсивно продолжаться до тех пор, пока конечное множество не будет состоять из примеров, относящихся к одному и тому же классу.

Вышеописанная процедура лежит в основе многих современных алгоритмов построения дерева решений, этот метод известен еще под названием «разделение и захват». Очевидно, что при использовании данной методики построение дерева решений будет происходить сверху вниз.

 

Области применения дерева решений

 

Дерево решений является прекрасным инструментом в системах поддержки принятия решений, интеллектуального анализа данных (Data Mining). В областях, где высока цена ошибки, они послужат отличным подспорьем аналитика или руководителя.

Дерево решений успешно применяется для решения практических задач в следующих областях:

-       Банковское дело. Оценка кредитоспособности клиентов банка при выдаче кредитов.

-       Промышленность. Контроль качества продукции (выявление дефектов), испытания без разрушений (например, проверка качества сварки) и т.д.

-       Медицина. Диагностика различных заболеваний.

-       Молекулярная биология. Анализ строения аминокислот.

Это далеко не полный список областей, где можно использовать дерево решений, т.к. еще многие потенциальные области применения не исследованы.


2.3.   Практическая часть

 

Для загрузки данных примера импортируйте файл C:\Program Files\BaseGroup\Deductor\Samples\CreditSample.txt в АП «Deductor» с помощью мастера импорта. Все параметры импорта примите установленными по умолчанию. В окне выбора способа отображения данных выберите «Таблица», если он не выбран по умолчанию.

В результате в основном окне появится таблица, заполненная из указанного файла.


Итог импорта данных

 

Запустите мастер обработки данных. В появившемся окне в разделе Data Mining выберете метод обработки «Дерево решений» и нажмите «Далее».


Мастер обработки данных

 

На вкладке «Настройка значения столбцов» необходимо задать назначения столбцов данных. Почти все столбцы автоматически получили значение «Входные». Значение поля «Выдать кредит», которое принимает только два значения «Да» или «Нет», необходимо установить  в  «Выходное».  Также  необходимо  обозначить  столбцы

«Код» и «№ паспорта» как «Неиспользуемые» (так как значения этих столбцов уникальны, а это не позволит их классифицировать).


Окно настройки назначений столбцов

 

Далее следует окно настройки разбиения исходного множества данных на подмножества. Оставьте это окно без изменений и  нажмите кнопку «Далее».

Следующий этап – настройка параметров обучения дерева решений. Необходимо учитывать, что чем больше  значение параметра «Уровень доверия, используемый при отсечении узлов дерева», тем больше будет дерево решений в итоге.

С помощью кнопки «Пуск» запускаем процесс построения дерева решений. По окончании процесса вы увидите график, отображающий уровень распознавания данных, количество узлов созданного дерева и правил, полученных в результате обработки.


Процесс построения дерева решений

 

В последующем окне выбора способа отображения данных выберите «Дерево решений». А в последнем окне  мастера обработки, по желанию,  укажите имя и метку.

Результатом всех вышеописанных действий будет построенное дерево решений, которое отобразится в основном окне программы. На основании этого метода можно ответить на вопрос «Давать ли человеку кредит и если да, то при каких условиях».


Готовое дерево решений

 

Из полученного дерева можно вывести правила выдачи кредитов.

Например:

-       Если срок проживания в данной местности меньше 6,5 лет, то кредит не давать.

-       Если срок проживания в данной местности больше 6,5 лет, займ обеспечен, возраст больше 20,5  лет, не имеется недвижимость, но имеется банковский счет, то кредит давать.

 

2.4.   Задание

 

1.    Постройте дерево решения для описанного выше примера. Попробуйте использовать различные значения параметров обучения дерева решения и сравните полученные деревья.

2.    Выведите 5 правил из построенного дерева решений.

3.    Приведите 4-5 примеров, для которых можно использовать метод обработки дерево решений, реализуйте один из них.

4.    Составьте отчет.


Лабораторная работа №3. Логистическая регрессия и ROC-анализ

 

3.1.   Основная цель

 

Научиться обрабатывать данные и прогнозировать события, используя возможности логистической регрессии и ROC-анализ.

 

3.2.   Теоретическая часть

 

Логистическая регрессия — метод построения линейного классификатора, позволяющий оценивать апостериорные вероятности принадлежности объектов классам.

Вообще, регрессионная модель предназначена для решения задач предсказания значения непрерывной зависимой переменной, при условии, что эта зависимая переменная может принимать значения на интервале от 0 до 1. В силу такой специфики ее часто используют для предсказания вероятности наступления некоторого события в зависимости от значений некоторого числа предикторов.

При изучении линейной регрессии мы исследуем модели вида

y = a + b1 x1  + b2 x2  +... + bn xn .

Здесь зависимая переменная y является непрерывной, и мы определяем набор независимых переменных xi и коэффициенты при них bi, которые позволили бы нам предсказывать среднее значение y с учетом наблюдаемой ее изменчивости.

Во многих ситуациях, однако, y не является непрерывной величиной, а принимает всего два возможных значения. Обычно единицей в этом случае представляют осуществление какого-либо события (успех), а нулем - отсутствие его реализации (неуспех).

Среднее значение y - обозначенное через p, есть доля случаев, в которых y принимает значение 1. Математически это можно записать как p = P(y = 1) или p = P("Успех").

ROC-кривая или кривая ошибок - показывает зависимость количества верно классифицированных положительных объектов (по оси y) от количества неверно классифицированных отрицательных объектов (по оси x).

В терминологии ROC - анализа первые называются истинно положительным, вторые – ложно отрицательным множеством. При этом   предполагается,   что   у   классификатора   имеется   некоторый


параметр, варьируя который, мы будем получать то или иное разбиение на два класса. Этот параметр часто называют порогом, или точкой отсечения. В зависимости от него будут получаться различные величины ошибок I и II рода.

В логистической регрессии порог отсечения изменяется от 0 до  1

   это и есть расчетное значение уравнения регрессии. Будем называть его рейтингом.

Введём ещё несколько определений:

TP (True Positives) – верно классифицированные положительные примеры (так называемые истинно положительные случаи);

TN (True Negatives) – верно классифицированные отрицательные примеры (истинно отрицательные случаи);

FN (False Negatives) – положительные примеры, классифицированные как отрицательные (ошибка I рода). Это так называемый «ложный пропуск» – когда интересующее нас событие ошибочно не обнаруживается (ложно отрицательные примеры);

FP (False Positives) – отрицательные примеры, классифицированные как положительные (ошибка II рода). Это ложное обнаружение, т.к. при отсутствии события ошибочно выносится решение о его присутствии (ложно положительные случаи).

Что является положительным событием, а что – отрицательным, зависит от конкретной задачи. Например, если мы прогнозируем вероятность наличия заболевания, то положительным исходом будет класс «Больной пациент», отрицательным – «Здоровый пациент». И наоборот, если мы хотим определить вероятность того, что человек здоров, то положительным исходом будет класс «Здоровый пациент», и так далее.

При анализе чаще оперируют не абсолютными показателями, а относительными – долями, выраженными в процентах:

Доля истинно положительных примеров (True Positives Rate):


TPR =


TP TP + FN


×100 %


Доля ложно положительных примеров (False Positives Rate):


FPR =


FP TN + FP


×100  %


Введем еще два определения: чувствительность и  специфичность

модели. Ими определяется объективная ценность любого бинарного классификатора.


Чувствительность (Sensitivity) – доля истинно положительных случаев:


Se = TPR =


TP TP + FN


×100 %


Специфичность   (Specificity)      доля   истинно   отрицательных

случаев, которые были правильно идентифицированы моделью:


Sp =


TN TN + FP


×100 %


Модель   с   высокой   чувствительностью   часто   дает истинный

результат при наличии положительного исхода (обнаруживает положительные примеры). Наоборот, модель с высокой специфичностью чаще дает истинный результат при наличии отрицательного исхода (обнаруживает отрицательные примеры).

ROC-кривая получается следующим образом:

1.   Для каждого значения порога отсечения, которое меняется от 0 до 1 с шагом dx (например, 0,01), рассчитываются значения чувствительности Se и специфичности Sp. В качестве альтернативы порогом может являться каждое последующее значение примера в выборке.

2.         Строится график зависимости: по оси y откладывается чувствительность Se, по оси x – (100 %Sp) (сто процентов минус специфичность), или, что то же самое, FPR – доля ложно положительных случаев.

Численный показатель площади под кривой называется AUC (Area Under Curve). С большими допущениями можно считать, что чем больше показатель AUC, тем лучшей прогностической силой обладает модель. Однако следует знать, что:

-       показатель AUC предназначен скорее для сравнительного анализа нескольких моделей;

-       AUC не содержит никакой информации о чувствительности и специфичности модели.

В литературе иногда приводится следующая экспертная шкала для значений AUC, по которой можно судить о качестве модели:

-   отличное качество модели – интервал AUC 0,9-1,0;

-   очень хорошее качество модели – интервал AUC 0,8-0,9;

-   хорошее качество модели – интервал AUC 0,7-0,8;

-   среднее качество модели – интервал AUC 0,6-0,7;

-   неудовлетворительное качество модели – интервал AUC 0,5-0,6.


Идеальная модель обладает 100 % чувствительностью и специфичностью. Однако на практике добиться этого невозможно, более того, невозможно одновременно повысить и чувствительность, и специфичность модели. Компромисс находится с помощью порога отсечения, т.к. пороговое значение влияет на соотношение Se и Sp. Можно говорить о задаче нахождения оптимального  порога отсечения.

 

3.3.   Практическая часть

 

Используя  мастер  импорта  и  файл    с  данными,     например, C:\ProgramFiles\BaseGroup\Deductor\Samples\CreditSample.txt, создайте новый сценарий и импортируйте данные.

В       мастере      обработки       выберите      способ      обработки

«Логистическая регрессия».


Выбор метода «Логистическая регрессия»

 

Прежде чем начнется обработка данных, необходимо провести нормализацию полей и настроить обучающую выборку.

Нормализация полей проводится с цель преобразования данных к виду, подходящему для обработки средствами АП «Deductor». Например, при построении нейронной сети, линейной модели прогнозирования или  самоорганизующихся карт «Входящие» данные


должны иметь числовой тип (т.е. непрерывный характер), а их значения должны быть распределены в определенном диапазоне. В этом случае при нормализации дискретные данные преобразуются в набор непрерывных значений.

Настройка нормализации полей вызывается с помощью    кнопки

«Настройка нормализации» в нижней левой части окна «Настройка назначения столбцов».


Вызов окна настройки нормализации

 

В окне «Настройка нормализации данных» слева приведен полный список входных и выходных полей. При этом каждое поле помечено значком, обозначающим вид нормализации:

-            линейная - линейная нормализация исходных значений;

-            уникальные значения - преобразование уникальных  значений в их индексы;

-            битовая маска - преобразование дискретных значений в битовую маску.

В правой части окна для выделенного поля отображаются параметры нормализации.


Окно настройки нормализации данных

 

Для числовых (непрерывных) полей с линейной нормализацией дополнительные   параметры   недоступны.   В   полях   «Минимум»  и

«Максимум»    секции    «Диапазон   значений»    можно    посмотреть минимальное и максимальное значения этого поля.

Для дискретных полей могут быть использованы два вида нормализации - уникальные значения и битовая маска.

Если дискретные значения преобразуются в битовую маску (т.е. каждому уникальному значению ставится в соответствие уникальная битовая комбинация), то возможны два способа такого преобразования, выбираемые из списка «Способ кодирования»:

1.     Позиция бита - поле в этом случае представляется в виде n битов, где n - число уникальных значений в поле. Каждый бит соответствует одному значению. В 1 устанавливается только бит, соответствующий текущему значению, принимаемому полем, все остальные биты равны 0. Этот способ кодирования используется при малом числе уникальных значений.

2.     Комбинация битов - каждому уникальному значению соответствует своя комбинация битов в двоичном виде.

Настройка обучающей выборки - разбиение обучающей выборки на два множества - обучающее и тестовое - для построения линейной модели.


Пример настройки обучающей выборки

 

Обучающее множество - включает записи, которые будут использоваться в качестве входных данных, а также соответствующие желаемые выходные значения.

Тестовое множество - также включает записи, содержащие входные и желаемые выходные значения, но используемое не для обучения модели, а для проверки его результатов.

Примечание. Oбучение может с большой долей вероятности считаться успешным, если процент распознанных примеров на обучающем и тестовом множествах достаточно велик.

Следующий этап – настройка параметров остановки обучения, которая включает определение максимального числа итераций (заданная точность), задание функции правдоподобия, порога отсечения и допустимость ошибки.


Настройка параметров остановки обучения

 

Итогом проведения регрессионного анализа будет построенная ROC-кривая.

 

3.4.   Задание

 

1.   С помощью мастера импорта откройте файл (например, C:\ProgramFiles\BaseGroup\Deductor\Samples\ CreditSample.txt).

2.     В мастере обработки выберите «Логистическая регрессия».

3.     Проведите настройку нормализации полей.

4.     Настройте обучающую выборку.

5.     Проанализируйте полученные данные.

6.     Создайте отчет.


Лабораторная работа №4. Применение алгоритма кластеризации: самоорганизующиеся карты Кохонена

 

4.1.   Основная цель

 

Научиться        использовать        метод        обработки        данных

«Самоорганизующиеся карты Кохонена».

 

Импортируйте в АП «Deductor» исходные данные из файла C:\Program\Files\BaseGroup\Deductor\Samples\CreditSample.txt.

Процесс построения карты Кохонена состоит из 10 этапов. Далее рассмотрим эти этапы подробнее.

Затем запустите мастер обработки, в котором в разделе «Data Mining» выберете способ обработки данных «Карта Кохонена», нажмите «Далее».

В окне настройки назначения столбцов необходимо обозначить столбцы «Код» и «№ паспорта» как «Неиспользуемые» (так как значения этих столбцов уникальны, а это не позволит их классифицировать по общим признакам). Определите поле «Давать кредит» как «Выходное».

Пример настройки назначений столбцов

 

Настройку обучающей выборки и параметров карты Кохонена можно оставить без изменений.


Настройка параметров карты Кохонена

 

Настройте    параметры   остановки   обучения,    указав    уровень допустимой  погрешности,  если  он  будет  превышен, анализ данного


множества    будет    прекращен.    Можно    оставить    значения    «по умолчанию».


Настройка параметров остановки обучения

 

Настройку параметров обучения также оставьте без изменений.

Далее запустите процесс построения карты Кохонена, нажав кнопку «Пуск».


Итог построения карты Кохонена


На вкладке «Выбор способа отображения данных» поставьте галочку напротив пункта «Самоорганизующаяся карта Кохонена».

Теперь необходимо провести настройку отображения карты: отметьте разделы «Давать кредит» и «Кластеры» и другие разделы по желанию.


Настройка отображений карты Кохонена

 

Далее задайте имя, метку и описание карты (по желанию).

 

В результате получатся карты Кохонена, подобные изображенным на рисунке.


Примеры карт Кохонена

Щелкнув левой клавишей мыши по любому шестиугольнику на любой карте, выделятся соответствующие ему ячейки на остальных картах, в том числе на картах «Давать кредит» и «Кластеры». При этом на шкалах в нижней части карт отобразятся значения соответствующих параметров.

 

4.2.   Задание

 

1.    Выполните описанные выше действия по построению карт Кохонена. Проанализируйте результаты, что можно сказать о вероятности  возврата кредита для групп 2, 3 и 4?

2.    Используя различные отображения карты Кохонена, постройте 3-4 правила выдачи кредитов.

3.    Ответьте на вопросы:

-      для чего используются карты Кохонена?

-      по какому принципу происходит перенос многомерного пространства на пространство меньшей размерности?

4.    Подготовьте отчет.


ЛАБОРАТОРНЫЕ  РАБОТЫ ПО ИЗУЧЕНИЮ ИАС «СЕМАНТИЧЕСКИЙ АРХИВ»

 

 

Лабораторная работа №1. «Сценарий работы пользователя с модулем поиска «Искатель»

 

 

1.1.   Основная цель

 

Научиться работать с модулем поиска «Искатель», создавать автоматические задания, изучить язык запросов модуля.

 

1.2.   Пояснения к выполнению работы

 

Прежде чем приступить к поиску информации, необходимо определить рамки исследуемой области, поставить конкретные цели исследования и сформулировать вопросы. Естественно, что не важной информации нет, и заранее не известно, в какой из исследуемых областей будет найден ответ. Но поиск во всех областях сразу приведет к накоплению лишней информации, не касающейся исследования. Только заранее установленные рамки помогут  наиболее эффективно спланировать процесс поиска.

Рассмотрим основные функции «Семантического архива»:

-         автоматический сбор тематической информации из сети Интернет;

-         автоматическое создание базы текстовых документов;

-         обработка тематических запросов к поисковым  сайтам (Yandex, Google и др.).


Элементы окна модуля «Искатель».


Рабочее окно программы «Искатель»:

1 – меню модуля; 2 – выбор поиска в Google; 3 – выбор поиска в Yandex;

4 – строка ввода поискового запроса; 5 – исключать пустые ссылки; 6 – показывать пустые ссылки; 7 – показывать фрагмент строки, где найден поисковый запрос; 8 -  показывать весь текст Интернет-

-страницы; 9 – загрузить запрос из файла; 10 – сохранить найденные результаты в файл; 11 - сохранить найденные результаты в базу; 12 - настройка модуля; 13 - вызов справки; 14 - выполнить поиск;

15 - остановить поиск; 16 - список ключевых выражений; 17 - сохранить внесенные изменения в текст статьи; 18 - вырезать из текста

выделенный фрагмент; 19 - копировать выделенный фрагмент текста; 20 - вставить из буфера обмена в текст; 21 - поиск/подсветка

выражений в тексте статьи

 

Элементы меню «Файл».


Меню "Файл"


Меню «Действия».


Меню "Действия"

 

Меню «Инструменты».


Меню "Инструменты"

 

Вызов справки по программе

 
Меню «Помощь».

 

 

 

 

 

 

 

 

Вызов справки о программе

 
Меню "Помощь"


Окно настройки конфигурации.


 

Вкладка "Конфигурация":

1 - количество просматриваемых страниц модулем поиска в Интернет-поисковике, по которым будет проводиться поиск; 2 - затрачиваемое время (в секундах) модулем поиска  на  открытие ссылки; 3 - выбор сервера и базы для сохранения найденной информации; 4 - поиск

сервера и базы; 5 - выбор папки для сохранения найденной информации в текстовые файлы; 6 - поиск папки для сохранения найденной информации  в текстовые файлы;

7 - настройки прокси-сервера; 8 - применить изменения в настройках; 9 - отменить изменения в настройках

 

Поиск по запросу

 

При поиске по одному запросу необходимо ввести запрос в   поле

«Поисковое   выражение»  и   нажать   клавишу   «Enter»  или   кнопку «Искать».


 

Поле для ввода поискового выражения

 

Ключевые выражения

 

Модуль поиска может производить отбор статей по ключевым выражениям. Если задать ключевые выражения, тогда при поиске по заданному запросу, в случае когда в тексте Интернет-страницы не найдены заданные ключевые выражения, Интернет-страница будет добавляться в список  пустых ссылок .

Если ключевые выражения не заданы, поиск ведется без учета ключевых выражений.


Поле для ввода ключевых выражений

 

Для ввода ключевых выражений необходимо:

1.     Ввести ключевые выражения (ключевые выражения вводятся в столбец).


Окно ввода ключевых слов


2.     Нажать кнопку «ОК».

3.     При желании, если заданные ключевые выражения будут использоваться в дальнейшем, можно их сохранить.


Сохранение ключевых слов

 

4.     Так же можно экспортировать сохраненные в файл ключевые выражения.


Загрузка сохраненных ключевых слов

 

5.     Для загрузки сохраненных файлов-запросов нужно выбрать в меню «Файл» вкладку «Загрузить из файла». В появившемся окне указать путь к файлу-запросу и нажать кнопку «Open».


Создание задания в Windows для модуля поиска «Искатель»

 

Можно создать задание для модуля поиска «Искатель», которое будет автоматически запускаться и производить поиск по одному или нескольким запросам в заданное время.

Перед созданием задания необходимо ввести в самом модуле поиска «Искатель» настройки сохранения информации, настройки количества страниц поиска и времени, затрачиваемого на страницы и ссылки,  по  которым  будет  искать  модуль  поиска  (модуль   поиска

«Искатель» – меню «Инструменты»).

Если используется прокси-сервер, необходимо его настроить (модуль поиска «Искатель» – меню «Инструменты»).

Пример создания задания:

1.     Выбираем в меню «Все программы» - «Стандартные» -

«Служебные» - «Назначить задание».


Назначение задания

 

2.     После того как задание создано,  его нужно открыть.

3.     Далее проводим настройку задания.


Настройка задания

 

В строке RUN нужно ввести следующие параметры: "C:\Program Files\ABS\IrobotClient\IRobotClient.exe"  (путь к

«Искателю») и затем, через пробел "D:\Temp\File1.txt" (созданная папка «Temp» на D диске - можно создать в любом месте, тогда указывается путь к этой папке, а в ней «.txt» файл, в котором сохранены поисковые запросы).

 

Запросы

 

При создании запросов можно указать два параметра:

1.     @part - сохраняется выделенная автоматически часть текста. По умолчанию сохраняется весь текст на странице.

2.     @today - поиск по текущей дате, реализовано с помощью  языка запросов Yandex (date=”20071025”).

 

Основные операторы языка запросов Yandex

 

1.     «+» слова из запроса обязательно найдены;

2.     «-» исключение слов из результата поиска;


3.     «Пробел» все слова входят в предложение, аналог «&»; «|»;

4.     «&» логическое «и» в пределах предложения;

5.     «~» запрос содержит первое слово, но не содержит второе;

6.     «&&» логическое «и» в пределах документа;

7.     «‘’» устойчивые словосочетания;

8.     «/» указывается расстояние до слова, например «/2»;

9.     «( объединение.

 

Специальные запросы

 

Title, address, image, url, link (например, '#image='Ленин'' выдаст картинку с названием Ленин).

 

1.3.   Задание

 


 

т.д.


1.     Определите  объект  поиска:  персона,  организация,  событие и

 

2.     Укажите    папку    для    сохранения    результатов,    настройте


количество страниц поиска и времени, затрачиваемого на страницы и ссылки.

3.     Создайте текстовый файл с запросом на выбранный вами объект:

-       простой запрос;

-       сложный     запрос     с      использованием     ключевых      слов (выражений),  языка запрос Yandex и «Искатель».

4.     Создать автоматическое задание в Windows для поиска в определенное время.

 


Лабораторная работа №2. Добавление данных в базы данных

 

2.1.   Основная цель

 

Научиться    добавлять    текстовые    данные       в    базы    данных

«Семантического архива» в АРМ «Оператор».

 

2.2.   Пояснения к выполнению работы

 

Проводя аналитическое исследование, всегда следует вести архив полученных данных, поскольку одни и те же данные спустя время могу толковаться по-разному. Также это необходимо для выявления причинно-следственных связей, которые можно проследить только во временном промежутке.

ИАС «Семантический архив» предназначена для решения широкого круга аналитических задач. Для этого в системе создаются базы данных, в которых накапливаются знания об объектах и их действиях. Система поставляется с несколькими готовыми базами данных, которые нуждаются в обновлении, а для работы с новыми объектами возникает необходимость создания архивов путём добавления новых текстовых массивов.

 

Открытие витрины АРМ «Оператор»

 

Для открытия АРМ «Оператор» последовательно выберите левой кнопкой   мыши   пункты    меню:   «Пуск»   -    «Все    программы»   -

«Аналитические бизнес решения» - «Семантический Архив» -   «АРМ

«Оператор».

В диалоговом окне «Настройка подключения» введите имя сервера в поле «Сервер» и выберите значение из списка «База данных». Нажмите кнопку «Продолжить» окна «Настройка подключения».

Витрина АРМ «Оператор» после открытия выглядит следующим образом.


Витрина АРМ "Оператор"

 

Добавление данных через «Утилиту добавления документов»

 

Если вы ищете единичные документы во внешних источниках (Интернете или разных БД, файлах с набором текстов статей или других Windows-приложениях) и при этом нет необходимости хранить информацию в виде текстовых документов (например, новостные статьи), то удобнее всего использовать «Утилиту добавления документов».

Выберите статью для добавления в базу данных «Семантического архива»,   желательно,   чтобы  статья


содержала: заголовок статьи, дату публикации, источник СМИ, автора статьи.


Рис. 4.15. Иконка "Мастер добавления статей"


Чтобы   запустить   утилиту   последовательно,   выберите   левой кнопкой мыши пункты меню: «Пуск»

-   «Все программы» - «Аналитические бизнес решения» - «Семантический Архив» - «Утилита добавления документов».      После      в     правом


нижнем углу экрана появится значок утилиты.


Меню утилиты добавления документов


В меню «Утилиты» (меню утилиты вызывается правым нажатием кнопки мышки на значок утилиты), выберете «Настроить» и  укажите

«Настройка добавления статей в базу». Выбирается та база данных (БД), в которую надо добавить документ.


Выбор БД для добавления документов

 

Теперь выделите текст статьи вместе с ее реквизитами и копируйте («Сtrl + C» или правая кнопка мышки на выделенном тексте), затем откройте меню утилиты и выберите «Мастер добавления документов» или используйте горячие клавиши «Ctrl +  Alt + Z».


Окно «Мастер добавления документов»

 

Заголовок статьи автоматически копируется в наименование, дата публикации, источник СМИ и автор статьи также проставляются автоматически (если утилита не проставила автоматически дату, СМИ и автора, можно ввести их вручную),  при                                                                                   желании           можно откорректировать текст и заголовок статьи.

После нажмите кнопку «ОК» и статья сохранится в базе, которая указана в настройках утилиты.

Для    быстрой   вставки   статьи   в   «Семантический   архив»   с помощью                   утилиты   «Добавление

документов»                      необходимо скопировать ее в буфер обмена  Ctrl

+ C» или правая кнопка мышки и выбрать                 «Копировать»)   и   в   меню


утилиты выбирается «Быстро добавить документ» (либо нажатием горячих клавиш «Ctrl + Alt + X»).


Меню утилиты «Добавление документов»


Для вставки в систему одного или нескольких документов через кнопку «Создать документ из файла», сохраните несколько статей в папке в любом текстовом формате, желательно, чтобы статьи содержали: заголовок статьи, дату публикации, источник СМИ,  автора статьи.


Для вставки в систему одного или нескольких документов из указанной папки нажмите кнопку  «Создать документ из файла» на главной панели инструментов витрины АРМ «Оператор» или используйте сочетание клавиш «Shift + Ctrl + N».

В открывшемся диалоговом окне выбора документов зайдите в папку, где хранятся файлы статей, и выделите одну или несколько (при помощи сочетания клавиш «Shift + [↑↓]») статей для ввода. Кнопки «Shift + [↑↓]» используются при выделении файлов статей, расположенных в списке друг за другом. При необходимости выделить файлы, находящиеся в разных частях списка, воспользуйтесь сочетанием клавиш «Ctrl + левая клавиша мыши»: удерживая «Ctrl», отметьте левой клавишей мыши нужные вам  файлы.

После выбора статей для добавления в базу данных, нажмите кнопку «Открыть», система начнет их обработку.

 

Добавление данных через «Автопапку»

 

Если у вас имеется собранная информация, размещенная по тематическим папкам, или вы хотите одновременно сохранять документы в текстовых файлах и автоматически добавлять их в систему,   то   удобнее   воспользоваться   «Автопапками».   Функцию

«Автопапки» можно включать и отключать по мере необходимости. Если документы изначально находятся в разных местах, тогда при помощи средств файловой системы их можно перенести в одну папку, и одновременно с добавлением новых документов уже может идти загрузка. Еще этот способ удобен, если из библиотек поставщиков контента регулярно поступает много статей в какие-то папки файловой системы.

Создайте на своем компьютере две рабочие папки: папку, в которую вы предполагаете помещать новые документы, и папку, в которую система будет перемещать обработанные документы. В первую папку поместите текстовые документы, содержащие данные о некоторых объектах.

Нажмите кнопку  «Настроить автопапку» или используйте сочетание клавиш «Ctrl + Alt + G».


Кнопка «Настроить автопапку» на панели

инструментов АРМ «Оператор»

 

В открывшемся диалоговом окне пропишите адреса папки, из которой система будет брать файлы, и папки, в которую файлы будут перемещаться .


Настройка «Автопапки»

 

Далее нажмите «ОК».

Для   запуска   обработки   системой  статей   необходимо   нажать кнопку  «Запустить автопапку».

Статьи начнут поступать на обработку в систему и накапливаться в папке, предназначенной для обработанных документов.

 

Примечание

 

Необходимо   следить   за   тем,   чтобы   при   изменении   путей

«Автопапок» кнопка  «Запустить автопапку» не была нажата. Также кнопка должна быть отжата в том случае, если в папке-источнике есть незакрытые файлы офисных приложений (например, MS  Word). Иначе в систему продублируются дополнительные файлы, которые создаются офисными приложениями при работе с файлами.

Статьи, добавленные в систему при помощи вставки файлов   или

«Автопапок», будут иметь незаполненные свойства СМИ, автор, заголовок, поэтому эти свойства необходимо заполнить вручную.


2.3.   Задание

 

1.     Найдите биографии любых четырёх известных личностей.

2.     Добавьте     информацию     о     первой     биографии     в     БД

«Семантического архива» через «Утилиту добавления документов».

3.     Добавьте     информацию     о     второй     биографии     в     БД

«Семантического архива» через «Утилиту добавления документов» кнопкой «Быстро вставить документ».

4.     Добавьте     информацию     о     третьей     биографии     в     БД

«Семантического архива» через кнопку «Создать документ из файла».

5.     Добавьте      информацию     о      четвёртой     биографии      БД

«Семантического архива» через «Автопапку».

 

 

Лабораторная работа №3. Работа в витрине  «Сквозного поиска»

 

 

1.1.   Основная цель

 

Поиск выбранных объектов (персоны, организации и.т.д.) с заданным значением их свойств и связей из разных БД.

 

1.2.   Пояснения к выполнению работы

 

Собрав достаточно большой архив данных,  необходимо научиться быстрому поиску необходимой информации в собственных архивах. Такая же ситуация возможна при приобретении чужих архивов данных. В таких случаях возникает необходимость появления автоматизированного приложения для сокращения временных затрат в среду структурированных архивов данных.


Сквозной поиск позволяет найти экземпляры с заданным значением их свойств (текстовых или строковых) одного или нескольких искомых типов, хранящиеся в нескольких заданных БД. Для искомого типа можно задать условие на соответствие заданному параметру любого из нескольких выбранных составителем запроса свойств. Поисковый запрос можно настроить таким образом, чтобы  он выполнялся по БД, которые находятся на нескольких серверах.

 

Запуск витрины  «Сквозной поиск»

 

Для запуска витрины «Сквозного поиска» последовательно выберите пункты меню «Пуск» - «Программы» - «Аналитические бизнес решения» - «Семантический архив» - «Сквозной поиск».

При первоначальном открытии витрины «Сквозной поиск» система выдаст сообщение о необходимости настройки подключения к серверу с базами данных, в которых будет производиться сквозной поиск.

Примечание: Данная операция происходит единожды, лишь при первоначальной загрузке комплекса ИАС «Семантический архив» на компьютер пользователя.

После нажатия кнопки «ОК» откроется витрина утилиты, где необходимо будет настроить имя сервера.


Подключение к БД и настройка сервера

 

Далее необходимо перезапустить витрину «Сквозной поиск»!


Полнотекстовый поиск

 

Если раньше для полнотекстового поиска необходимо было заводить объект поиска между кавычками “Иванов”, то теперь данная функция стоит по умолчанию – заводится просто Иванов.

 

Упрощенное создание запроса для поиска

 

Упрощенное создание запроса для поиска используется при необходимости ведения поиска по определенным параметрам, например по региону.

Если нужно провести поиск по определенным базам, то необходимо снять выделение с неиспользуемых баз «  ».

Далее, путем фильтрации, выбираем необходимые нам поля.

Фильтрация по полям

 

После система покажет поля с выбранными нами параметрами.

Сохраняем данный список баз. При необходимости ведения поиска по данному запросу пользователь просто загружает сохраненный список. Таким методом сохраняются любые параметры для поиска. Также можно загрузить сразу несколько параметров одновременно.

 

Визуальное представление результатов поиска

 

Для более удобного просмотра результатов необходимо поместить их в «Корзину». Система позволяет просмотреть  результаты поиска в пяти режимах.


 

Виды представления информации об объектах:

1 – досье на основной объект; 2 – досье на основной объект, а также список связанных экземпляров; 3 – досье на основной объект, список связанных экземпляров, а также досье на связанные объекты; 4 – досье на основной объект, список связанных объектов, досье на связанные объекты, а также список связанных объектов; 5 – досье на основной объект, список связанных объектов, досье на связанные объекты,  список связанных объектов, а также досье на связанные объекты

 

Основные области витрины «Сквозной поиск»

 

Окно витрины «Сквозного поиска» состоит из 4-х основных областей.


Окно витрины «Сквозной поиск»

 

«Область 1» отображает процесс выполнения запроса среди всех заданных  типов  в  базах,  по  которым  осуществляется  поиск.     Эта


область состоит из 3 колонок. В первых двух колонках указываются имена искомых типов и БД, которой принадлежат эти типы. Третья колонка заполняется только после того, как поиск по данному типу в данной базе завершен. В ней отображается количество найденных экземпляров соответствующего типа, если оно не превышает предела, установленного в окне настройки. Если же запросу удовлетворяет большее число экземпляров данного типа, то в третьей колонке отображается число из окна настроек.

«Область 2» отображает найденные объекты в базах.

«Область 3» показывает свойства найденных объектов.

Примечание:   Просмотреть   результаты   поиска   можно   как   в

«Инспекторе свойств», так и строчном режиме.

«Область 4» отображает полный список доступных баз, по которым производится поиск данных. Данный список может быть отсортирован, т.е. в этой области будут отображаться выбранные базы. Для этого необходимо активировать нужные пункты путем нажатия соответствующих кнопок.

 

Сохранение найденных объектов в виде XML-файла

 

Также    найденные    объекты    можно    просмотреть    в    АРМ

«Аналитик». Для этого необходимо сохранить данные объекты в виде XML-файла.


Сохранение в формате XML

 

В открывшемся окне создается папка, куда помещается созданный XML-файл.

По    кнопке       «Запустить Семантический архив» можно запустить витрину АРМ «Аналитик».

Для просмотра результатов поиска в витрине АРМ «Аналитик» система автоматически подключится к тому серверу, на котором идет поиск, и расположенной на нем БД.

При необходимости АРМ «Аналитик» можно подключить к рабочему серверу и необходимой БД.

Далее, создав новый объект, привязываем к нему результаты поиска, т.е. сохраненный XML-файл.

 

Возможность создания нового объекта/факта из текстового содержимого, найденного в «Сквозном поиске» объекта на

семантической сети

 

После нахождения объекта поиска выделяем объект и помещаем его в «Корзину» со связанными экземплярами.


Перенос объекта в «Корзину»

 

Далее выделяем экземпляры и помещаем их в буфер обмена. Открываем «Корзину» в витрине АРМ «Аналитик». Из буфера обмена в АРМ «Аналитик» добавляем объекты в «Корзину».

На витрине АРМ «Аналитик» необходимо  создать определенный объект, создать от этого объекта семантическую сеть (в данном случае она будет пустой).

Примечание: Это упрощенный метод создания семантических сетей, показывающий лишь принцип вставки.


 

 

 

 

 

 

 


Создав объект, нажимаем на соответствующую кнопку. Появится пустая семантическая сеть.


 

Вставляем объекты из буфера обмена


 

 

 

 

 

 

 

 

Создание объекта

 

При просмотре текстового досье объекта выявляем там упоминаемый объект. Далее появится окно создания нового объекта. В нашем случае это персона – Степанян Гарик Генрихович.


Создание объекта


Выбираем нужный «Тип». В нашем примере это  «Персона».


Выбор экземпляра нового элемента

 

Нажимаем на создание «Нового объекта».


Создание экземпляра

 

Появится окно «Создание экземпляра», где мы можем конкретизировать связь создаваемого объекта с объектом на семантической сети, из текстового содержимого которого был выявлен новый объект.


4.3.3. Задание

 

1.    Запустите витрину «Сквозной поиск».

2.    Найдите информацию о персоне при известных ФИО, годе рождения. Для этого:

-       откройте окно «Запросы»;

-       в окне «Запросы» щелчком левой кнопки мыши выделите название группы баз «Персона по всем полям»;

-       заполните известные поля поиска на закладке «Параметры»;

-       на закладке «Детали запроса» просмотрите параметры БД, по которым будет производиться сквозной поиск;

-       укажите параметры, содержащиеся  в тех или иных БД;

-       запустите запрос на выполнение;

-       перенесите данные в «Корзину» и поместите в буфер обмена;

-       экспортируйте данные в файл формата XML.

 


Лабораторная работа №4. Перенос данных из АРМ

«Оператор» в «Аналитик»

 

4.1.Основная цель

 

Научиться переносить обработанные данные из АРМ «Оператор» в АРМ «Аналитик».

 

4.2.   Пояснения к выполнению работы

 

Даже хорошо структурированные данные без визуального отображения не предоставляют возможности легко оценивать  картину исследования. Только визуально протянув связи между объектами через их действия или действия над ними, можно построить целостную картину, позволяющую дать наиболее точную оценку. После установления прямых связей объектов можно найти косвенные связи, например объектов через третий объект или действие.

Входными данными для работы АРМ «Аналитик» являются текстовые массивы, переработанные (выделены объекты, их связи и пр.) в АРМ «Оператор». Первоначальным этапом работы аналитика является получение данных об объектах и их связях от оператора, для этого   в   ИАС   «Семантический   архив»   имеются   приспособления

«Сквозной поиск» - для нахождения объектов, связей, статей в БД и

«Корзина» - для передачи данных.

 

4.3.   Поиск объектов и помещение в «Корзину»

 

Для  поиска  объекта  в   «Сквозной  поиск»  созданного  в    АРМ

«Аналитике» и привязывания к нему найденных результатов нажмите правой кнопкой мыши на объекте поиска, в выпавшем меню выберите

«Сквозной поиск» - «Искать в сквозном поиске».


Запуск «Сквозной поиск»

 

Выберете пункт, по которому будет производиться поиск в   окне

«Мастер поиска».


Окно «Мастер поиска»


Найденные данные выделяем и помещаем в  корзину  объектов при помощи кнопки  «Добавить экземпляр(ы) в корзину», выбирая из списка, в соответствии с результатом поиска, один из способов добавления.


Добавление результатов поиска

 

Добавленные экземпляры отобразятся в корзине объектов, которая открывается нажатием на соответствующую кнопку  в левом нижнем углу экрана.


Окно «Корзина объектов»

 

Для перемещения найденных экземпляров вместе со связанными объектами в АРМ «Аналитик» воспользуемся экспортом в XML файл, который осуществляется путем нажатия соответствующей клавиши в корзине объектов. Сохраняем файл по выбранному вами адресу для дальнейшей его вставки в АРМ «Аналитик». Файл будет иметь наименование, соответственное наименованию БД, например, anbs- sql.ЕГРЮЛ_Москва_2005_06.xml.


Экспортирование в XML

 

4.4 Приём данных в АРМ «Аналитик»

 

Переходим на витрину АРМ «Аналитик». Для этого последовательно   выберите   левой   кнопкой   мыши   пункты    меню

«Пуск»  -  «Все  программы»  -  «Аналитические  бизнес  решения»    -

«Семантический Архив» - «АРМ «Аналитик».

Открываем корзину объектов   кнопкой   в левом нижнем углу экрана. Последовательно нажимаем кнопки, как показано на рисунке.


Импорт данных в АРМ «Аналитик»

 

В открывшемся диалоговом окне зайдите в папку, где хранится XML файл. Нажмите кнопку «Открыть».


Окно «Открыть»

 

Откроется окно настройки соответствия типов, где по умолчанию предложены соответствия свойств. При необходимости их можно корректировать.


Настройка соответствий типов и свойств при импорте


Нажмите кнопку «ОК».

В результате вы увидите корзину объектов с импортированными данными.


Корзина объектов с импортированными данными

 

Объекты помещены в корзину АРМ «Аналитик», т.е. добавлены в БД Primer_Persona. Закройте корзину и обновите данные нажатием на кнопку    «Обновить». Данные из БД будут привязаны к персоне через отношение «Работа в должности» (т.к. в БД указаны руководители организаций). Вид витрины после выполнения  операции показан на рисунке.


Витрина АРМ «Аналитик» после добавления

данных из «Корзины»


4.3. Задание

 

1.     Найдите    объект    «Иванов    Сергей    Владимирович»    через

«Сквозной поиск».

2.     Переместите данные о нём в АРМ «Аналитик».

 

Лабораторная работа №5. Построение семантических сетей

 

5.1.   Основная цель

 

Научиться строить семантические сети с помощью АРМ

«Аналитик»".

 

5.2.   Пояснения к выполнению работы

 

Визуальное отображение данных исследования позволяет наиболее ясно увидеть картину. Проследить  прямые,  косвенные связи, выявить причинно-следственные взаимодействия. Такая картина сама должна быть максимально ясной и логически интуитивно понятной. Временные процессы следует  располагать слева направо, иерархии строить сверху вниз. Процессы, являющиеся подпроцессами одного единого, – объединять рамками. Следует избегать множественного пересечений связей. Связь один ко многим следует отображать одной связью, объединив объекты рамкой.

Анализ собранных данных по объекту начинается с изучения связанных с ним фактов в инспекторе свойств или на динамической раскладке семантической сети. Удобно разбираться в данных, создав экземпляр рабочей области и формируя раскладки с фрагментами данных.   Далее   в   такие   раскладки   постепенно   добавлять  новые

«куски» сети.

В    витрине   АРМ    «Аналитик»   создайте   «Рабочую   область»

«Аффилированные лица».

Для  этого  нажмите на панели инструментов  кнопку   «Поиск элементов по типу».

При   помощи   кнопки       «Создание экземпляра» создайте экземпляр типа «Рабочая область» с заданным наименованием. Нажмите кнопку «ОК».


Создание экземпляра в «Рабочей области»

 

Для перехода в режим «Семантическая сеть» выберите данный тип визуализатора в витрине «Аналитика».

Создана новая рабочая область для построения семантической сети. Перед началом работы нажмите кнопку          «Выделение элементов»,  т.к.  по  умолчанию  стоит  настройка защиты    от редактирования.

Для вызова панели редактирования нажмите кнопку . В нижней части экрана появится панель редактирования, которая необходима для построения семантической сети.


Панель редактирования для построения семантической сети

 

Начинаем строить семантическую сеть с добавления главного объекта, в нашем примере «Иванов Сергей Владимирович».  Нажмите


кнопку    «Добавить объект» на панели редактирования. Откроется стандартная панель выбора экземпляров. В строке поиска наберите

«Иванов»  и  нажмите  кнопку   «Поиск по имени». Из найденных экземпляров выберите нужный, с помощью стрелочки переместите его в правую часть окна и нажмите кнопку «Ок».


Выбор экземпляра «Иванов Сергей Владимирович»

 

Экземпляр «Иванов Сергей Владимирович» отобразится на семантической сети. Далее выделите объект (щелчком мыши), справа находится всплывающая панель инспектора свойств. Чтобы закрепить ее, щелкните по скрепке.


Закрепление панели инспектора свойств

 

На закладке «Связи» отображены все связанные с объектом экземпляры. Выделите один или несколько экземпляров и нажатием правой клавишей мыши выберите «Вставить в семантическую сеть».

Таким образом, постепенно наполняется семантическая сеть, распределяются экземпляры.

Для  сохранения результата работы воспользуйтесь кнопкой     

«Сохранить».

Дайте наименование раскладке, например «Аффилированные лица Иванова С.В.».

Для придания раскладке эстетичного вида воспользуйтесь кнопкой   «Форматирование».


Открытие панели «Форматирование»

 

Из    выпадающего    списка    выберите    пункт    «Внешний    вид элементов». Откроется окно «Внешний вид элементов».


Окно для настройки внешнего вида элементов

 

В этом окне можно редактировать внешний вид экземпляров: изменять размеры, цвет и т.д.

По умолчанию настроены цвета в соответствии с типом объекта.


Результат проведенной работы выглядит следующим образом.

Семантическая сеть для объекта «Иванов С.В.»

 

Чтобы сохранить раскладку в формате программы MS Visio, нажмите кнопку   «Экспорт в VISIO». Последовательно выполняйте шаги мастера экспорта. Вы получите изображение в формате «.vsd».


Семантическая сеть в формате «.vsd»

 

Можно воспользоваться шаблоном оформления заголовка и легенды, либо создать свой фирменный шаблон и экспортировать раскладки в него.


На     семантической    сети    есть    возможность    расположения экземпляров в виде таблицы.

 

5.3.   Задание

 

1.    Запустите АРМ «Аналитик».

2.    Найдите в БД объект для построения семантической сети.

3.    Создайте рабочую область «Аффилированных объектов».

4.    Постройте семантическую сеть.

5.    Экспортируйте полученный результат в MS Visio.