Онлайн книга Проектирование распределенных информационных систем. 1 Лекция 1. Назначение и основные компоненты информационной системы (Е. Н. Чернопрудова, 2012)

Проектирование распределенных информационных систем (Е. Н. Чернопрудова, 2012)

1 Лекция 1. Назначение и основные компоненты информационной системы

Первая лекция предназначена для общего введения в теорию и практику построения информационных систем на основе баз данных, рассмотрения и обсуждения основных терминов и определений компонентов информационных систем. Лекция посвящена рассмотрению общетеоретических вопросов, касающихся системы баз данных как информационной системы, использующей информационные технологии по обработке информации. Некоторые термины в системе баз данных не имеют четко определенных государственным стандартом определений, что составляет основную проблему однозначного понимания некоторых определений и понятий баз данных как информационной системы. Для решения данной основной проблемы обсудим различные подходы и общепринятые соглашения (нотации), существующие в современной научной литературе.

Ключевые слова: система, управление, информация, данные, базы данных, система управления базами данных (СУБД), уровни представления баз данных, модели данных.

Введение.

В прошлом информация считалась сферой бюрократической работы и ограниченным инструментом для принятия решений. Сегодня информацию рассматривают как один из основных ресурсов развития общества, а информационные системы и технологии как средство повышения производительности и эффективности деятельности людей.

Наиболее широко информационные системы и технологии используются в производственной, управленческой и финансовой деятельности, хотя начались подвижки в сознании людей, занятых и в других сферах, относительно необходимости их внедрения и активного применения.

Основные идеи современной информационной технологии базируются на концепции баз данных (БД), ранее упоминаемых достаточно часто без какого-либо их детального пояснения.

Согласно данной концепции основой информационной технологии являются данные, организованные в БД, адекватно отражающие реалии действительности в той или иной предметной области и обеспечивающие пользователя актуальной информацией в соответствующей предметной области.

Развитие современного промышленного производства и бизнеса невозможно без создания автоматизированных информационных систем (АИС), одно из назначений которых – предоставление пользователю достоверной информации, необходимой для принятия оптимального решения. В настоящее время ни одна из задач управления производством и бизнесом не должна выполняться без применения автоматизированных информационных систем. Сегодня мы должны рассматривать любую деятельность любого специалиста как некоторую систему принятия решений, поэтому специалисту и нужна достоверная информация. Таким образом, одной из важнейших функций информационной системы является информационное обеспечение процесса управления.

Итак, что же такое База данных и Система управления базами данных!

К сожалению, в большинстве книг по этому направлению информационных технологий нет достаточно четких определений. Рассмотрим и обсудим термины и определения, касающиеся баз данных.

Понятие об информационных системах.

Под системой понимают любой объект, который одновременно рассматривается и как единое целое, и как объединенная в интересах достижения поставленных целей совокупность разнородных элементов. Системы значительно отличаются между собой как по составу, так и по главным целям.

Приведем примеры нескольких систем, состоящих из разных элементов и направленных на реализацию различных целей (таблица 1.1).

Таблица 1.1

В информатике понятие “система” широко распространено и имеет множество смысловых значений. Чаще всего оно используется применительно к набору технических средств и программ. Системой может называться аппаратная часть компьютера. Системой может также считаться множество программ для решения конкретных прикладных задач, дополненных процедурами ведения документации и управления расчетами.

Добавление к понятию “система” слова “информационная” отражает цель ее создания и функционирования. Информационные системы обеспечивают сбор, хранение, обработку, поиск и выдачу информации, необходимой в процессе принятия решений задач в любой предметной области. Появление электронных вычислительных машин и персональных компьютеров предопределило создание и внедрение автоматизированных информационных систем (АИС), которые значительно повысили производительность и результативность информационных технологий по обработке и выдачи информации.

В качестве основного классификационного признака АИС целесообразно рассматривать особенности автоматизируемой профессиональной деятельностипроцесса переработки входной информации для получения требуемой выходной информации, в котором АИС выступает в качестве инструмента должностного лица или группы должностных лиц, участвующих в управлении организационной системой.

В соответствии с предложенным классификационным признаком можно выделить следующие классы АИС (рисунок 1.1):

Рисунок 1.1 – Классификация АИС

АИС – взаимосвязанная совокупность средств, методов и персонала, используемых для хранения, обработки и выдачи информации в интересах достижения поставленной цели.

Современное понимание АИС как системы предполагает использование в качестве основного технического средства переработки информации персонального компьютера. Кроме того, техническое воплощение информационной системы само по себе ничего не будет значить, если не будет учтена роль человека, для которого предназначена производимая информация и без которого невозможно ее получение и представление.

Структуру АИС составляет совокупность отдельных ее частей, называемых подсистемами.

Подсистема – это часть системы, выделенная по какому-либо признаку.

Общую структуру информационной системы можно рассматривать как совокупность подсистем независимо от сферы применения. В этом случае говорят о структурном признаке классификации, а подсистемы называют обеспечивающими. Таким образом, структура любой информационной системы может быть представлена совокупностью обеспечивающих подсистем (рисунок 1.2).

Рисунок 1.2 – Структура АИС как совокупность обеспечивающих подсистем

Среди обеспечивающих подсистем обычно выделяют информационное, техническое, математическое, программное, организационное и правовое обеспечение. В понятии АИС присутствуют три очень важных, емких, ключевых, философско-методологических и специально-научных понятия:

– система;

– управление;

– информация.

И поэтому, чтобы разобраться в АИС, необходимо прежде всего выяснить:

– что такое система;

– что такое управление;

– что такое информация.

Система (от греч. SYSTEMA –целое, составленное из частей соединение) – это совокупность элементов, взаимосвязанных друг с другом, образующая определенную целостность, единство.

Введем набор понятий, связанных с использованием слова “система”.

Элемент – некоторый объект (материальный, энергетический, информационный), обладающий определенным функциональным назначением, отличающимся от назначения системы.

Введем обозначения:

М – элемент;

{М}– совокупность элементов;

М∈ {М} – принадлежность элементов совокупности.

Вопрос. Сколько или какое количество элементов необходимо, чтобы их совокупность стала системой? Древние философы спорили – сколько нужно камней, сложенных вместе, чтобы они образовали кучу. Вся доступная разуму человека природа состоит из систем, которые могут быть различны по масштабам: от бесконечно больших (галактика) до бесконечно малых (атом); различны по природе: материальные, энергетические, информационные. Практически любой объект с определенной точки зрения может рассматриваться как система, если совокупность элементов обладать двумя признаками: а) связями, которые позволяют посредством переходов по ним от элемента к элементу соединить два любых элемента совокупности (рисунок 1.3).

Рисунок 1.3 – Связь двух элементов

Х₁₂– воздействие элемента М1 на элемент М2;

Х₂₁– воздействие М2 на М1.

б) Свойством (назначением, функцией), отличным от свойств отдельных элементов совокупности.

По степени автоматизации решения своих функциональных задач системы могут быть:

– ручные, т.е. без средств автоматизации;

– автоматизированные, т.е. со средствами автоматизации при участии человека;

– автоматические, т.е. типа «автомат» без участия человека.

Дадим определение АСУ согласно ГОСТ 19675-74:

АСУ – это человеко-машинная система, обеспечивающая автоматизированный сбор и обработку информации, необходимой для оптимизации управления в различных сферах человеческой деятельности.

Большой системой называют систему, включающую большое количество однотипных элементов и однотипных связей. Пример: гирлянда, трубопровод.

Сложной системой называют систему, состоящую из элементов разных типов и обладающую разнородными связями между ними. Пример: космический корабль, автомобиль, морское судно и т.п.

Простая система – это система, состоящая из небольшого числа элементов и не имеющая разветвленной структуры (нельзя выявить иерархические уровни).

Структура системы – совокупность внутренних, устойчивых связей между элементами системы, определяющая ее основные свойства.

Простейшие типы структур систем показаны на рисунке 1.4.

Рисунок 1.4 – Типы структур систем

Иерархические структуры – это структуры с наличием подчиненности (рисунок 1.5).

Рисунок 1.5 – Иерархические структуры

С понятием структура тесно связан термин «декомпозиция» – это деление системы на части, удобное для каких-то операций.

Примеры: автомобиль состоит из систем смазки, охлаждения, питания и др. Любая книга имеет содержание (оглавление).

Различают также статистические и динамические системы. Состояние статической системы с течением времени остается постоянным, динамические системы, наоборот, изменяют свое состояние во времени.

Динамические системы разделяют на детерминированные, т.е. полностью определенных в любой момент времени, и вероятностные (стохастические).

По характеру взаимодействия системы и внешней среды различают закрытые и открытые системы.

Системы обладают свойством целостности – это принципиальная несводимость свойств системы к сумме свойств составляющих ее элементов и, в то же время, зависимость свойств каждого элемента от его места и функции внутри системы.

Группа элементов системы, описываемая только своими входами и выходами и обладающая определенной целостностью, называется модулем (рисунок 1.6).

Рисунок 1.6 – Модуль J

X_Jвх– внешние (не от системы) воздействия на элементы модуля;

Х_iJ– связи от других элементов системы;

Х_{J вых –}воздействия на выходе системы;

Х_Jk– воздействия на элементы системы.

В различных разделах науки и техники понятие модуль имеет различные синонимы:

– в технике: агрегат, блок, узел, механизм;

– в программировании: программа, программный модуль, логический блок;

– в организации и управлении – комиссия, подразделение. Входы и выходы можно интерпретировать как:

1) сигнал – отклик;

2) воздействие – реакция;

3) запрос – ответ;

4) аргумент – решение и др.

Перейдем к анализу понятия управления в системах. Процессы управления протекают повсеместно, ежедневно, ежечасно, ежесекундно и охватывают буквально все стороны и моменты человеческой деятельности.

В науке управление стало изучаться и исследоваться сравнительно недавно, и связано это было прежде всего с именем всемирного ученого Норберта Винера (1894-1964). В 1948 году в США и Европе вышла книга «Кибернетика, или Управление и связь в животном и машине», ознаменовавшая своим появлением рождение нового научного направления – кибернетика.

Кибернетические исследования заключаются в изучении общих свойств процессов управления и систем управления в живых и неживых системах.

Направления исследований кибернетики весьма разнообразны:

– теоретические (теория управления, теория информации, информатика);

– механические (исследование и проектирование АИС);

– биологические (нейрокибернетика – обработка информация в нервных тканях человека;

– бионика – искусственные органы;

– гомеостатика – автоматы–роботы;

– экономические;

– социальные.

В современном обществе кибернетика уступила пальму первенства информатике, но значение кибернетики как науки об общих принципах управления в живых и неживых системах, в искусственных системах и в обществе сохраняются и сейчас.

Итак, что такое управление?

Под управлением в самом общем виде понимают совокупность действий, осуществляемых человеком, группой людей или автоматическим устройством.

Эти действия направлены на поддержание или улучшение работы управляемого объекта в соответствии с имеющейся программой (алгоритмом функционирования) или с целью управления.

Управлять – это значит влиять на ход какого-либо процесса или состояния некоторого объекта и его положения в пространстве.

При изучении структуры процессов управления выделяют три основные проблемы. Первая группа задач – это задачи по изучению свойств объектов управления и их характеристик. Вторая группа задач – анализ различных видов органов управления, форм и способов выработки управляющих воздействий, формирование и согласование множества критериев качества (целей) управления, обеспечение устойчивости функционирования управляющих органов. Третья группа задач связана с передачей информации, ее восприятием, оценкой количества, кодированием, защитой от помех, достоверности. Все это относится к той части кибернетики, которую называют теорией информации.

Что же характерно для любого процесса управления?

1 Есть объект, которым управляют (рисунок 1.7). На него через исполнительный орган подается управляющее воздействие. Информация о состоянии объекта по цепи обратной связи поступает на управляющий орган, который выдает управляющие сигналы на исполнительный орган. Очевидно, что самым сложным с точки зрения функционирования, является управляющий орган, так как на него возложено одновременное и оптимальное управление, прием информации от внешней среды, прием информации от объекта.

2 В управлении всегда решается задача с определенной целью (целевой функцией). Решение на выдачу того или иного управляющего воздействия принимается согласно теории принятия решения. Как правило, целевую функцию в моделях описывают математически, задают параметры и ограничения, временные характеристики. Тогда оптимальность управления достигается в обеспечении экстремума выходных характеристик при определенных входных воздействиях.

3 Без информации нет управления.

Информация нужна и внешняя, и внутренняя (о состоянии объекта). Это информация полезная. Есть и информация в виде возмущающих воздействий (неверная, ложная, ненужная, избыточная и т.д.).

Циркуляция информации происходит в информационной системе (ИС), которая является как бы кровеносными сосудами в структуре элементов управления.

Основу информационной системы составляет база данных, в которой хранится большая по объему информация о какой-либо предметной области.

В неавтоматизированном варианте примером информационной системы является книжный каталог библиотеки. В настоящее время все большее развитие приобретают автоматизированные информационные системы. Ее элементы показаны на рисунке 1.7. Пользователь из органа управления выдает запрос в ИС. Этот запрос расшифровывается, формируется поисковое предписание (или поисковый образ), представляющее задание для процедуры поиска в базе данных. Поиск в базе данных осуществляется блоком поиска. Найденная информация выдается потребителю в удобной для него форме. АИС играют большую роль в инфраструктуре общества и являются одним из обязательных звеньев новых информационных технологий (НИТ).

Проанализируем понятие ИНФОРМАЦИЯ.

Отличительной чертой человеческого общества является то, что в течение длительного времени основным предметом труда оставались материальные объекты. Воздействуя на них, человек добывал себе средства к существованию, и на протяжении многих веков решалась задача усиления мускульных возможностей человека с помощью различных инструментов, агрегатов и машин. На это была направлена механизация производства, которая стала интенсивно внедряться в наличие двадцатого века. Развитие человеческого общества практически на всех этапах проходило на основе технического прогресса. Это и овладение огнем, и использование паровых машин, и проникновение в тайны атомной энергии, и т.п.

Повышению производительности труда способствовала автоматизация. В процессе формирования трудовых коллективов возникла необходимость обмена знаниями. Первоначально знания передавались устно из поколения в поколение.

Появление письменности позволило по-новому показать накопленные знания: представить их в виде информации.

Рисунок 1.7 – Структурная схема АИС

Понятие о данных и информации.

В этом разделе рассмотрим и обсудим два основных понятия – это данные и информация, их взаимосвязь. Еще раз подчеркнем, что с философской точки зрения эти понятия однозначно и до конца не определены. Чтобы отличить базу данных от овощной базы необходимо прежде всего дать определение данных.

Данными называют описание в сознании человека предметов, событий и явлений окружающего мира. Существуют три основных формы описания и дальнейшего представления данных:

– символьная;

– текстовая;

– графическая.

Символьная форма, основанная на использовании символов – букв, цифр, знаков, является наиболее простой, но она практически применяется только для передачи несложных сигналов и различных событий. (Например – сигналы светофора).

Более сложной является текстовая форма, в которой, как и в предыдущей форме, используются символы – буквы, цифры, математические знаки. Однако информация заложена не только в этих символах, но и в их сочетании, порядке следования. Удобство текстовой информации обусловлено взаимосвязью текста и речи человека.

Самой емкой и сложной является графическая форма представления информации. К этой форме относятся виды природы, фотографии, чертежи, схемы, рисунки.

Говоря о формах информации важно еще раз подчеркнуть свойство нематериальной информации – для ее существования обязательно должен быть какойлибо материальный объект: свет, воздух, вода, электрический ток, эфир электромагнитных колебаний и т.д.

Итак, носителем информации может быть как непосредственно наблюдаемый физический объект, так и энергетический субстрат. В последнем случае информация представлена в виде сигналов световых, звуковых, электрических и т.д. При отображении на носителе информация кодируется, т.е. ей ставится в соответствие форма, цвет, структура и другие параметры элементов носителя.

Примеры:

1 Почему человек различает цвета воспринимаемого изображения?

Потому, что простой белый цвет имеет частотные составляющие спектры электромагнитных колебаний для цветов: красного, оранжевого, желтого, зеленого, голубого, синего, фиолетового. Сетчатка глаз способна различать частотные спектры цветности и сообщать сведения в мозг человека.

2 Книга – носитель кодированной последовательности букв, цифр, символов, графики. Читая книгу, мы как раз и воспринимаем информацию, записанную на ее страницах, в виде кодовых комбинаций (слов), состоящих из последовательности символов (букв, цифр) принятого алфавита. То же самое можно сказать и относительно информации, сообщаемой в процессе устной речи.

В теории информации особого внимания заслужила наиболее стандартная и единая форма представления информации – двоичная форма. Она заключается в записи любой информации в виде последовательности только двух символов: 1, или «да», или «истина»; 0, или «нет», или «ложь». В ЭВМ эти символы обозначаются наличием либо отсутствием в рассматриваемой точке электрического или магнитного импульса. В этом случае реквизитом информации, т.е. самой малой порцией информации (меньше не может быть) является ответ на любой вопрос в виде «да» или «нет». Эта порция определяет единицу измерения информации, называемую «битом». Последовательность битов может иметь различную разрядность. Запись нулей и единиц производится по правилам кодирования, используемых в ЭВМ.

Поясняя определение данных, мы непроизвольно стали использовать термин информация. Уясним взаимосвязь этих двух терминов.

Мы с вами уяснили, что информация – это первичное понятие, точного определения которого не существует.

Существует четыре основных направлений толкования термина информация:

1 Информация – это смысл полученного сообщения, его интерпретация. Пример учителя и ученика. Учитель имеет информацию о предмете. С помощью сообщений (рассказ с показом, демонстрация) передает ученику сведения, данные. Ученик получает сообщения и усваивает их. То, что он понял со своей точки зрения и есть информация. Степень адекватности реальному образу проверяется учителем контрольным опросом. В этом отношении компьютер никогда не оценивает смысл информации, ему все равно с какими данными работать. Только человек имеет возможность получить информацию на основе данных компьютера.

2 Информация – это как содержание сообщений, так и само сообщение, данные. В этом смысле примером может служить книга с ценными для потребителя сведениями, газета, кодограмма и т.п.

3 Некоторые ученые и, прежде всего, философы считают, что информация – это третья составляющая основ мироздания (материя, энергия и информация).

Н. Винер в одной из работ написал: «Информация и есть информация, а не материя и энергия».

4 4 В математической теории информации понятие информация определяется только для случайных событий. В этом отношении информация – это то, что уменьшает неопределенность события.

Приведем пример: Компьютер с помощью генератора случайных чисел выдал число от 1 до 16. Наша задача угадать это число. Мы задаем вопросы компьютеру, а он отвечает «да» (истина, 1) или «нет» (ложь, 0). За какое минимальное количество вопросов можно отгадать число? Сколько нужно информации, чтобы угадать загаданное число? Неопределенность равна 16. Первый вопрос: задуманное число меньше 8? Ответ «да» или «нет» уменьшает неопределенность в два раза и мы получаем информацию, равную одному биту. Если число находится в пределах от 1 до 8, то мы задаем вопрос: число меньше 4? Получаем ответ и еще один бит информации и т.д. Итого, количество информации, необходимое для угадывания числа равно 4 битам.

Подведем итоги и решим проблемный вопрос в однозначном понятии информации:

1 Под словом «информация» (в переводе с латинского «Jnformation») понимается разъяснение, изложение, чего-либо, сообщение о чем-либо.

2 Ответьте на вопрос – материальна или нематериальна информация? Будем понимать так, информация не материальна, но информация является свойством материи и не может существовать без своего материального носителя – средства переноса ее в пространстве и во времени.

Рассмотрим взаимосвязь двух понятий – данных и информации. Если рассматривать процесс передачи данных от источника данных до потребителя (рисунок 1.8), то можно сделать вывод о том, что источник в виде базы данных содержит большое количество различных и неупорядоченных данных, а потребителю информации нужна определенная и необходимая ему информация о конкретной предметной области.

Рисунок 1.8 – Взаимосвязь данных и информации

Исходя из данной взаимосвязи мы можем дать свое определение информации. Информация – это необходимые для получателя данные, переданные по каналу связи от источника данных своевременно и достоверно.

Количество и качество информации – как их анализировать?

В предыдущем разделе мы дали определение информации исходя из взаимосвязи данных и информации, при этом указали два показателя качества информации – достоверность и своевременность. Возникает проблемный вопрос – как анализировать и оценивать качество и количество информации.

В свете идей науки о знаковых системах – семиотики адекватность информации, т.е. соответствие содержания образа отображаемому объекту, может выражаться в трех формах: синтаксический, семантический и прагматический.

Синтаксическая адекватность связана с воспроизведением формально-структурных характеристик отражения независимо от смысловых и потребительских (полезностных) параметров объекта. На синтаксическом уровне учитываются тип носителя и способ представления информации, скорость ее передачи и обработки, размеры кодов представления информации, надежность и точность преобразования этих кодов и т.п. Информацию, рассматриваемую только с синтаксических позиций, обычно называют данными.

Семантическая адекватность выражает аспект соответствия образа, знака и объекта, т.е. отношение информации и ее источника. Проявляется семантическая информация при наличии единства информации (объекта) и пользователя. Семантический аспект имеет в виду учет смыслового содержания информации; на этом уровне анализируются те сведения, которые отражает информация, рассматриваются смысловые связи между кодами представления информации.

Прагматическая адекватность отражает отношение информации и ее потребителя, соответствие информации цели управления, которые на ее основе реализуется. Прагматический аспект связан с ценностью, полезностью использования информации для выработки правильного управленческого решения. С этой точки зрения анализируются потребительские свойства информации.

Три формы адекватности информации соответствуют трем ступеням познания истины, сформулированным философами: «От живого созерцания к абстрактному мышлению и от него к практике – таков диалектический путь познания истины, познания объективной реальности». Первая ступень соответствует восприятию внешних структурных характеристик, т.е. синтаксической стороны информации; вторая – ступень формирования понятий и представлений, выявления смысла, содержания информации и ее обобщения; третья – непосредственно связана с практическим использованием информации в соответствии ее целевой функции деятельности системы. В соответствии с тремя формами адекватности выполняется и измерение информации. Терминологически принято говорить о количестве информации и об объеме данных. Объем данных в сообщении измеряется количеством символов (разрядов) принятого алфавита в этом сообщении. Часто информация кодируется числовыми кодами в той или иной системе счисления. Естественно, что одно и то же количество разрядов в разных системах счисления может передать разное число состояний отображаемого объекта.

Действительно:

N = m
ⁿ,

где: N – число всевозможных отображаемых состояний;

m – основание системы счисления (разнообразие символов, применяемых в алфавите);

n – число разрядов (символов) в сообщении.

Поэтому в различных системах счисления один разряд имеет различный вес, и соответственно меняется единица измерения данных. Так, в двоичной системе счисления единицей измерения служит «бит» – двоичный разряд, в десятичной системе счисления – «дит», как десятичный разряд.

Например:

а) сообщение в двоичной системе 10111011 имеет объем данных V_д= 8 бит;

б) сообщение в десятичной системе 275903 имеет объем данных V_д= 6 дит.

В современной ЭВМ наряду с минимальной единицей данных «бит» широко используется укрупненная единица измерения «байт», равная 8 бит.

Определение количества информации на синтаксическом уровне невозможно без рассмотрения понятия неопределенности состояния системы (энтропии системы).

Действительно, получение информации о какой-либо системе всегда связано с изменением степени неосведомленности получателя о состоянии этой системы. До получения информации получатель мог иметь некоторые предварительные (априорные) сведения о системе ɑ. Мера неосведомленности о системе H (ɑ) и является для него мерой неопределенности состояния системы. После получения некоторого сообщения получатель приобретает некоторую дополнительную информацию I_β(ɑ), уменьшающую его априорную неосведомленность так, что апостериорная (после получения сообщения β) неопределенность состояния системы становится равной H_β(ɑ). Тогда количество информации I_β(ɑ) о системе ɑ, полученное в сообщении β, определится как:

I
_β(ɑ) = H (ɑ) – H
_β(ɑ),

т. е. количество информации измеряется изменением (уменьшением) неопределенности состояния системы. Если конечная неопределенность H_β(ɑ) обратится в нуль, то первоначальное неполное знание заменится полным знанием и количество информации станет равным:

I
_β(ɑ) = H (ɑ)

Иными словами, энтропия системы H (ɑ) может рассматриваться как мера недостающей информации. Энтропия системы H (ɑ), имеющей N возможных состояний согласно формуле ШЕННОНА, равна:

где P_i– вероятность того, что система находится в i-м состоянии.

Для случая, когда все состояния системы равновероятны, ее энтропия определяется по формуле:

Рассмотрим пример. По каналу связи передается n- разрядное сообщение, использующее m различных символов.

Так как количество всевозможных кодовых комбинаций определяется по формуле N = m ⁿ, то при равновероятности появления любой из них количество информации, приобретенной абонентом в результате получения сообщения, будет определяться по формуле ХАРТЛИ:

I = log N = n log m

Если в качестве основания логарифма принять m, то формула упростится и количество информации станет равным:

I = n

В данном случае количество информации (при условии полного априорного незнания абонентном содержания сообщения) будет равно объему данных I = V_д, полученных по каналу связи.

Наиболее часто используются двоичные и десятичные логарифмы. Единицами измерения в этих случаях будут соответственно «бит» и «дит».

Степень информативности сообщения определяется отношением количества информации к объему данных, т.е.

Y = 1/ V
_д, причем 0≤Y≤1,

где: Y – характеризует лаконичность сообщения.

С увеличением Y уменьшаются объемы работы по преобразованию информации (данных) в системе. Поэтому стремятся к повышению информативности, для чего разрабатываются специальные методы оптимального кодирования информации.

Семантическая мера информации.

Синтаксические меры количества информации в общем случае не могут быть непосредственно использованы для измерения смыслового содержания, ибо имеют дело с обезличенной информацией, не выражающей смыслового отношения к объекту.

Для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне наибольшее признание получила тезаурусная мера информации, предложенная Ю.И. ШНЕЙДЕРОМ. Он связывает семантические свойства информации прежде всего со способностью пользователя принимать поступившее сообщение. Используется понятие «тезаурус пользователя». Тезаурус можно трактовать как совокупность сведений, которыми располагает данная система, пользователь.

В зависимости от соотношений между смысловым содержанием информации Ŝ и тезаурусом пользователя S_nизменяется количество семантической информации J_c, воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. При S_n≈ 0 пользователь не воспринимает, не понимает поступающую информацию; при S_n→∞ пользователь все знает, и поступающая информация ему не нужна: и в том, и в другом случае J_c≈0. Максимальное значение J_cприобретает при согласовании Ŝ c тезаурусом S_n(S_{n –}S_{n opt}), когда поступающая информация понятна пользователю и несет ему ранее не известные (отсутствующие в его тезаурусе) сведения ( рисунок 1.9).

Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной.

Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным (семантический шум) для пользователя некомпетентного.

В то же время понятная, но известная компетентному пользователю информация представляет собой для него тоже семантический шум.

Рисунок 1.9 – Зависимость J_c= f (S_n)

При разработке информационного обеспечения АИС следует стремиться к согласованию величиныŜ и S_nтак, чтобы циркулирующая в системе информация была понятна, доступна для восприятия и обладала наибольшей содержательностью S, т.е.

S = J
_c/V
_д

Прагматическая мера информации – это ее полезность, ценность для управления. Эта мера также величина относительная, обусловленная особенностями использования этой информации в той или иной системе.

Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция управления системой. В автоматизированной системе управления производством, например, ценность информации определяется эффективностью осуществляемого на ее основе экономического управления, или иначе, приростом экономического эффекта функционирования системы управления, обусловленным прагматическими свойствами информации:

J
_nβ(γ) = П (γ/β) – П (γ),

где: J_nβ(γ) – ценность информационного сообщения β для системы управления γ;

П (γ) – априорный ожидаемый экономический эффект функционирования системы управления γ;

П (γ/β) – ожидаемый эффект функционирования системы γ при условии, что для управления будет использована информация, содержащаяся в сообщении β.

Поскольку экономический эффект функционирования АИС складывается из экономического эффекта решения отдельных функциональных задач, то для вычисления J_nследует определить:

Z_β-множество задач, для решения которых используется информация β;

F – частоту решения каждой задачи за период времени, для которого оценивается экономический эффект;

R_β– степень влияния информационного сообщения β на точность решения задачи, 0≤ R ≤ 1.

Тогда:

где П_j– экономический эффект от решения j-й задачи в системе.

В такой постановке единицей измерения ценности информации АИС является обычно рубль.

Качество информации.

Информация в АИС является и предметом труда и продуктом труда, поэтому от ее качества существенно зависят эффективность и качество функционирования системы.

Качество информации можно определить как совокупность свойств, обусловливающих возможность ее использования для удовлетворения определенных в соответствии с ее назначением потребностей.

Конец ознакомительного фрагмента.

Вы здесь

Проектирование распределенных информационных систем. 1 Лекция 1. Назначение и основные компоненты информационной системы (Е. Н. Чернопрудова, 2012)