1. Понятие информации,
информация и данные
Термин «информация» происходит от латинского слова «information»
-разъяснение, изложение, осведомленность.
Существование множества определений информации
обусловлено сложностью, специфичностью и многообразием подходов к толкованию
сущности этого понятия. Существуют три наиболее распространенные концепции
информации, каждая из которых по-своему объясняет ее сущность.
Первая концепция
(концепция К. Шеннона - одного из основоположников теории информации), отражает
количественно-информационный подход. Согласно этому подходу информация - это мера неопределенности события.
При таком
понимании информация – это сведения об объектах и явлениях окружающей
среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них
степень неопределённости, неполноты знаний.
Этот подход, хоть и не
учитывает смысловую сторону информации, оказался весьма полезным в
вычислительной технике и послужил основой для измерения информации и
оптимального кодирования сообщений.
Вторая концепция рассматривает информацию как свойство материи. Её появление связано с развитием кибернетики и основано на
утверждении, что информацию содержат любые сообщения, воспринимаемые человеком
или приборами. Наиболее ярко и образно эта концепция информации выражена
академиком В.М. Глушковым. Он писал, что "информацию несут не только
испещренные буквами листы книги или человеческая речь, но и солнечный свет,
складки горного хребта, шум водопада, шелест травы".
Т.о., информация как свойство материи создает представление о ее природе и
структуре, упорядоченности и разнообразии. Она не может существовать вне
материи, а значит, она существовала и будет существовать вечно, её можно
накапливать, хранить и перерабатывать.
Третья концепция
основана на логико-семантическом подходе, при котором
информация трактуется как знание, причем не любое знание, а та его часть,
которая используется для активного действия, для управления и самоуправления.
Иными словами, информация - это действующая, полезная часть
знаний.
Рассмотренные подходы в
определенной мере дополняют друг друга, освещают различные стороны сущности
понятия информации и облегчают тем самым систематизацию ее основных свойств.
Обобщив данные подходы, можно дать следующее определение информации:
Информация - это
сведения, снимающие неопределенность об окружающем мире, которые являются
объектом хранения, преобразования, передачи и использования.
Выделяют следующие аспекты информации
прагматический, семантический и синтаксический.
Прагматический аспект
связан с возможностью достижения поставленной цели с использованием получаемой
информации. Этот аспект информации влияет на поведение потребителя. Если
информация была эффективной, то поведение потребителя меняется в
желаемом направлении, т.е. информация имеет прагматическое содержание. Таким
образом, этот аспект характеризует поведенческую сторону проблемы.
Семантический аспект позволяет оценить смысл передаваемой информации
и соотносит её с ранее имевшейся информацией. Смысловые связи между словами и
другими элементами языка отражает тезаурус-словарь. Тезаурус состоит из двух частей: списка слов
и устойчивых словосочетаний, сгруппированных по смыслу, и некоторого ключа,
например алфавитного, позволяющего расположить слова в определённом порядке.
При получении информации тезаурус может изменяться, и степень этого изменения
характеризует воспринятое количество информации.
Синтаксический аспект информации связан со способом ее представления
вне зависимости от её смысловых и потребительских качеств. На синтаксическом
уровне рассматриваются формы представления информации для её передачи и
хранения. В зависимости от реального процесса, в котором участвует информация
(осуществляется ее сбор, передача, преобразование, отражение, представление,
ввод или вывод), она представляется в виде специальных знаков, символов.
Наряду с информацией часто употребляется понятие данные.
Данные – это информация, рассмотренная только относительно
синтаксического аспекта.
Информация с точки зрения
ее возникновения и последующих преобразований проходит три этапа, которые
собственно и отражают ее синтаксический, семантический и прагматический
аспекты. Человек сначала наблюдает некоторый факт окружающей действительности,
который отражается в его сознании в виде определенного набора данных. Здесь
проявляется синтаксический аспект. Затем, после определенной
структуризации этих данных в соответствии с конкретной предметной областью,
человек формирует знание о наблюдаемом факте, что отражает семантический
аспект полученной информации. Информация в виде знаний имеет высокую
степень структуризации, что позволяет выделять полную информацию об окружающей
нас действительности и создавать информационные модели исследуемых объектов.
Полученные знания человек затем использует в своей практике, т.е. для
достижения поставленных целей, что и отражает прагматический аспект
информации.
Возможность
и эффективность использования информации обусловливаются такими основными ее
потребительскими показателями качества, как
¾
адекватность
¾
репрезентативность,
¾
полнота,
¾
достоверность,
¾
доступность,
¾
актуальность,
¾
своевременность,
¾
точность,
¾ устойчивость
и д.р.
Адекватность информации – это определённый
уровень соответствия создаваемого с помощью полученной информации образа
реальному объекту, процессу, явлению и т.д.
В реальной жизни вряд ли возможна
ситуация, когда можно рассчитывать на полную адекватность информации. Всегда
присутствует некоторая степень неопределённости. Неадекватная информация может
образовываться при создании новой информации на основе неполных или
недостоверных данных. Однако и полные, достоверные данные могут приводить к
созданию неадекватной информации в случае применения к ним неадекватных
методов. От степени адекватности информации реальному состоянию объекта или
процесса зависит правильность принятия решений человеком.
Репрезентативность информации
связана с правильностью ее отбора и формирования в целях адекватного отражения
свойств объекта. Важнейшее значение здесь имеют:
¾
правильность
концепции, на базе которой сформулировано исходное понятие;
¾
обоснованность
отбора существенных признаков и связей отображаемого явления.
Нарушение репрезентативности информации приводит
нередко к существенным ее погрешностям.
Полнота информации определяет достаточность данных
для принятия решений или для создания новых данных на основе имеющихся.
С понятием полноты данных
сталкиваются все, кому приходится выполнять служебные задания. Если исходные
данные неполны, принять верное решение непросто. Однако бывают случаи, когда
исходные данные полны, а получить верное решение всё равно не можем. Это
свидетельствует о том, что мы не располагаем какими-то методами. И в том, и в
другом случае говорят, что недостаточно необходимой информации.
Достоверность информации – это свойство информации не иметь
скрытых ошибок.
Данные возникают в момент
регистрации сигналов, но не все сигналы являются “полезными” — всегда
присутствует какой-то уровень посторонних сигналов, в результате чего полезные
данные сопровождаются определенным уровнем “информационного шума”. Если
полезный сигнал зарегистрирован более четко, чем посторонние сигналы,
достоверность информации может быть более высокой. При увеличении уровня шумов
достоверность информации снижается. В этом случае для передачи того же
количества информации требуется использовать либо больше данных, либо более
сложные методы.
Недостоверность информации может
быть связана с тем, что данные изначально были подготовлены как ложные
(например, оставление на месте преступления объектов с отпечатками пальцев
посторонних лиц), в результате модификации данных (удаление отпечатков пальцев
с объекта) или в результате того, что данные трудно выделить на фоне
регистраций посторонних сигналов (объект с отпечатками пальцев преступника
несёт многочисленные отпечатки пальцев посторонних лиц).
Известны случаи, когда
недостоверные данные могут давать достоверную информацию, например, когда
заранее известна степень их недостоверности. Науке известны методы обработки
недостоверных данных с целью получения более достоверной информации. Эти методы
основываются, например, на фильтрации (отсеве) и на статистическом анализе
данных. Как правило, в таких случаях, чем больше исходных данных мы имеем, тем
выше достоверность полученного результата. Таким образом, на достоверность
информации влияют такие её свойства как адекватность и полнота.
Свойство достоверности информации
имеет важное значение в тех случаях, когда её используют для принятия решений.
Недостоверная информация может приводить к решениям, имеющим негативные
экономические, социальные и политические последствия.
Доступность информации – свойство информации,
характеризующее возможность её получения данным потребителем. На степень
доступности информации влияют одновременно как доступность данных, так и
доступность адекватных методов для их интерпретации. Отсутствие доступа к
данным или отсутствие адекватных методов обработки данных приводят к
одинаковому результату: информация оказывается недоступной.
Актуальность информации – это степень соответствия
информации текущему моменту времени. Нередко с актуальностью, как и с полнотой,
связывают коммерческую ценность информации. Поскольку информационные процессы
растянуты во времени, то достоверная и адекватная, но устаревшая информация
может приводить к ошибочным решениям. Необходимость поиска (или разработки)
адекватного метода для работы с данными может приводить к такой задержке в
получении информации, что она становится неактуальной и ненужной. На этом, в
частности, основаны многие современные системы шифрования данных и механизмы
электронной подписи. Люди, не владеющие ключом (методом) для чтения данных,
могут заняться поиском ключа, поскольку алгоритм метода обычно доступен, но
продолжительность этого поиска столь велика, что за время работы информация
теряет актуальность и, соответственно, связанную с ней практическую ценность.
Своевременность –
способность информации соответствовать нуждам потребителя в данный момент
времени. Своевременность информации означает ее
поступление не позже заранее назначенного момента времени, согласованного с
временем решения поставленной задачи.
Точность информации
определяется степенью близости получаемой информации к реальному состоянию
объекта, процесса, явления и т.п.
Устойчивость информации отражает
ее способность реагировать на изменения исходных данных без нарушения
необходимой точности. Устойчивость информации, как и репрезентативность,
обусловлена выбранной методикой ее отбора и формирования.
Отметим также следующие свойства информации.
Релевантность – способность информации
соответствовать нуждам (запросам) потребителя.
Защищённость – свойство, характеризующее
невозможность несанкционированного использования или изменения информации.
Эргономичность – свойство, характеризующее
удобство формы или объёма информации с точки зрения данного потребителя.
Различают синтаксическую, семантическую и
прагматическую меры информации.
Для измерения информации вводятся два параметра:
количество информации I и объем данных Vд.
Синтаксическая мера информации.
Эта мера количества
информации оперирует с обезличенной информацией, не выражающей смыслового
отношения к объекту. Она характеризуется объёмом данных и количеством информации.
Объем
данных Vд измеряется
количеством символов (разрядов) в передаваемом сообщении.
В двоичной системе счисления один разряд - это
бит (или байт = 8 бит), в десятичной системе счисления – это число,
представленное одной арабской цифрой (от 0 до 9).
В различных системах
счисления один разряд имеет различный вес и соответственно меняется единица
измерения данных:
·
в двоичной системе счисления единица измерения
- бит (bit - binary digit - двоичный разряд);
·
в десятичной
системе счисления единица измерения - дит (десятичный разряд).
Пример. Сообщение в двоичной системе в виде восьмиразрядного
двоичного кода 10111011 имеет объем данных Vд=8 бит.
Сообщение в десятичной системе в виде шестиразрядного
числа 275903 имеет объем данных Vд = 6 дит.
Часто информация кодируется
числовыми кодами в той или иной системе счисления, особенно это актуально при
представлении информации в компьютере. Естественно, что одно и то же количество
разрядов в разных системах счисления может передать разное число состояний отображаемого
объекта, что можно представить в виде соотношения
N=mn,
где N - число
всевозможных отображаемых состояний;
т - основание системы счисления (разнообразие символов,
применяемых в алфавите);
п - число разрядов (символов) в сообщении.
Количество информации I, приобретенной
абонентом в результате получения сообщения, будет
I = log N = n log m - формула Хартли.
Если в качестве основания
логарифма принять т, то I=n. При равновероятностных состояниях
системы количество информации (при условии полного априорного незнания
абонентом содержания сообщения) будет равно объему данных I=Vд,
полученных по каналу связи.
Для неравновероятных
состояний системы всегда I<Vд=n.
Коэффициент
(степень) информативности
(лаконичность) сообщения определяется отношением количества информации к объему
данных, т.е.
причем 0<Y<1. С
увеличением Y уменьшаются объемы работы по преобразованию информации
(данных) в системе. Поэтому стремятся к повышению информативности, для чего
разрабатываются специальные методы оптимального кодирования информации
Семантическая
мера информации.
Для измерения смыслового
содержания информации, т.е. ее количества на семантическом уровне, наибольшее
признание получила тезаурусная мера, которая связывает семантические свойства
информации со способностью пользователя принимать поступившее сообщение. Для
этого используется понятие тезаурус пользователя.
Тезаурус - это
совокупность сведений, которыми располагает пользователь или система.
В зависимости от
соотношений между смысловым содержанием информации S и тезаурусом
пользователя Sp изменяется количество семантической
информации Ic, воспринимаемой пользователем и включаемой им в
дальнейшем в свой тезаурус. Характер такой зависимости показан на рис.1.2.
Рассмотрим два предельных случая, когда
количество семантической информации Ic равно 0:
при Sp ≈
0 пользователь не воспринимает, не понимает поступающую информацию;
при Sp →¥ пользователь все знает, и поступающая
информация ему не нужна.
Рис. 1.2.
Зависимость количества семантической информации, воспринимаемой потребителем,
от его тезауруса Ic=f(Sp)
Максимальное количество
семантической информации Ic потребитель приобретает при
согласовании ее смыслового содержания S со своим тезаурусом Sp
(Sp = Sp opt), когда поступающая
информация понятна пользователю и несет ему ранее не известные (отсутствующие в
его тезаурусе) сведения.
Следовательно, количество
семантической информации в сообщении, количество новых знаний, получаемых
пользователем, является величиной относительной. Одно и то же сообщение может
иметь смысловое содержание для компетентного пользователя и быть бессмысленным
(семантический шум) для пользователя некомпетентного.
При оценке семантического
(содержательного) аспекта информации необходимо стремиться к согласованию
величин S и Sp.
Относительной мерой
количества семантической информации может служить коэффициент содержательности С,
который определяется как отношение количества семантической информации к ее
объему:
Прагматическая мера информации.
Эта мера определяет полезность
информации (ценность) для достижения пользователем поставленной цели. Эта мера
также величина относительная, обусловленная особенностями использования этой
информации в той или иной системе. В экономической системе прагматические
свойства (ценность) информации можно определить приростом экономического
эффекта функционирования, достигнутым благодаря использованию этой информации
для управления системой.
1. Дайте понятие информации.
2. Каковы особенности информации?
3. Дайте характеристику синтаксического аспекта
информации.
4. Дайте характеристику семантического аспекта
информации.
5. Дайте характеристику прагматического аспекта
информации.
6. Какие три этапа проходит информация относительно
возникновения и последующих преобразований?
7. Раскройте свойство адекватности информации.
8. Раскройте свойство полноты информации.
9. Раскройте свойство достоверности информации.
10. Раскройте свойство доступности информации.
11. Раскройте свойство актуальности информации.
12. Раскройте свойство избыточности информации.
13. Раскройте свойство объективности и субъективности
информации.
14. Раскройте свойство репрезентативности информации.
15. Раскройте свойство содержательности информации.
16. Раскройте свойство своевременности информации.
17. Раскройте свойство точности информации.
18. Раскройте свойство устойчивости информации.
19. В чем суть синтаксических мер оценок информации?
20. В чем суть семантических мер оценок информации?
21. Дайте определение тезауруса.
22. В чем суть прагматических мер оценок информации?