Logo Международный форум «Евразийская экономическая перспектива»
На главную страницу
Новости
Информация о журнале
О главном редакторе
Подписка
Контакты
ЕВРАЗИЙСКИЙ МЕЖДУНАРОДНЫЙ НАУЧНО-АНАЛИТИЧЕСКИЙ ЖУРНАЛ English
Тематика журнала
Текущий номер
Анонс
Список номеров
Найти
Редакционный совет
Редакционная коллегия
Представи- тельства журнала
Правила направления, рецензирования и опубликования
Научные дискуссии
Семинары, конференции
 
 
 
Проблемы современной экономики, N 4 (40), 2011
ЭКОНОМИКА, УПРАВЛЕНИЕ И УЧЕТ НА ПРЕДПРИЯТИИ
Вашко Т. А.
доцент кафедры менеджмента факультета экономики и управления Красноярского государственного торгово-экономического института,
кандидат технических наук


Технология дублирования информации как средство повышения качества принятия решений
В статье рассмотрена проблема достоверности и чрезмерной объемности социально-экономической информации и её влияние на качество принимаемых управленческих решений. Предложена технология, позволяющая найти компромисс между исключением «шумовой» информации и сохранением качества решений в условиях искажения входных данных
Ключевые слова: информация, достоверность информации, объем информации, качество принимаемого решения, дублирование информации
УДК 005:002.6+005.53; ББК 60.822

Современные организации живут в эпоху достаточно жесткой конкуренции и высоких темпов информатизации общества. И от того, насколько быстро руководство умеет реагировать на изменение окружающей среды и своевременно отследить и проанализировать необходимую информацию, зависит качество принятия решений и достижение поставленных целей.
В настоящее время менеджеру нужно не только располагать своевременной и точной информацией, но уметь осмысливать ее, делать необходимые выводы и результативно воплощать в управленческие решения. Тот руководитель, который способен грамотно использовать характеристики информации, имеет возможность создать первоклассный информационный ресурс своей организации.
Управленческая информация — это часть данных, несущих в себе новизну и полезность для принятия специалистом обоснованного решения. Она представляет собой важнейший элемент информационной среды управления. Информационная среда в виду ее важности является объектом управления наряду с персоналом, финансами, производством и др. Поэтому задача субъекта управления заключается в том, чтобы отделить ценную информацию от «шумов»; выделить из информации наиболее важную часть, позволяющую анализировать текущее состояние объекта управления и выработать правильное решение. На данный момент наука располагает существенными возможностями в области компьютерной обработки массовых данных статистики, основанными, например, на средствах теории распознавания образов, кластерного анализа, дискриминантного анализа и др., но проблема достоверности информации продолжает оставаться открытой.
В данной работе в качестве альтернативного решения предложена технология, которая может войти в категорию мер, позволяющих оградить статистические выборки от внесения в них неумышленно искаженной информации и, тем самым, повысить точность вычислений в процессе прогнозирования результата или решения задач классификации. Основная цель предложенной работы — это разработка технологии повышения качества принятия управленческих и экономических решений в условиях искажения информации во входных данных.
В последние десятилетия как в нашей стране, так и во всем мире увеличивается объем социальной и особенно экономической деятельности, растет число объектов и субъектов хозяйствования, углубляются и расширяются экономические связи, происходят качественные изменения в структуре производства, возрастает его динамичность, усиливается централизация управления. Неизбежным следствием этих процессов и одновременно их необходимым условием становится быстрое увеличение объема социально-экономической информации, усложнение информационной сети и структуры собираемых данных. При этом обоснованность и оперативность принимаемых решений становится все более зависимой от качества информационного обеспечения процессов принятия решений и все больше ужесточаются требования к оперативности и глубине анализа информации.
Проблема контроля качества как управленческой, так и экономической информации должна рассматриваться как комплексная. С одной стороны, бессмысленно оценивать полезность информации, если она ошибочна, поэтому опасно принимать решения на основании данных, достоверность которых неизвестна; с другой — мощный поток достоверной информации лишь «затопит» руководителя бесполезными, не представляющими для него интереса сведениями, если не организован отбор наиболее ценных сообщений. С учетом того, что достоверность информации является важнейшим показателем качества принятия управленческих решений, знание о том, что этот показатель снижается в результате дезинформирования и под действием помех, заставляет постоянно возвращаться к поиску путей повышения точности входящей информации. Вопросу достоверности информации традиционно уделяется большое внимание в теории и практике управления социально-экономическими системами. Она в той или иной степени встает в процессе любого динамического анализа. Понятийное осмысление достоверности информации и, в частности, управленческой и финансовой отчетности как основного источника данных о деятельности организации, ее имущественном положении и финансовых результатах, уходит корнями в глубокую древность. С древних времен достоверность информации в отчетных документах является предметом исследований представителей различных научных школ и направлений. Анализ эволюции подходов к исследованию достоверности позволяет раскрыть логику их формирования в рамках различных концептуальных платформ, а также выявить ресурсы активизации исследования данной проблемы в современных условиях.
Существует много определений понятия достоверности информации. В одних источниках под «достоверностью информации» понимают степень (или уровень) адекватного отображения ею реальных событий или процессов. В других — достоверность выступает как свойство не иметь скрытых ошибок. Чаще всего «достоверность информации» определяется как свойство информации быть правильно воспринятой, что достигается: указанием времени свершения событий, сведения о которых передаются; сопоставлением данных, полученных из различных источников; своевременным вскрытием дезинформации; исключением искаженной информации и др.
На практике выделяют ряд правил обеспечения достоверности информации, а именно: подтверждение ее из двух независимых источников; сопоставление полученной информации с уже известной по тематике. Кроме того, достоверность подтверждается и проверкой незаинтересованных лиц и наличием у них информационного содержания. К правилу установления достоверности информации относится и проверка достоверности полученной информации у авторитетных источников. В реальной жизни, в условиях жесткой конкуренции гипотетическая лживость полученной информации грозит серьезными последствиями как для репутации компании, так и для получения реальных результатов деятельности. Для оценки достоверности на сегодняшний момент широко используют такие частные показатели как: достоверность сообщения в смысле отсутствия ложных сведения и данных; разборчивость речи; вероятность ошибочного или неискаженного приема дискретной единицы (бита, символа, цифры, буквы, слова).
Для количественной оценки достоверности сообщения применяются различные качественно-количественные способы и шкалы, в том числе так называемая схема Кента. В соответствии с ней диапазон возможных изменений достоверности разбивается на 7 интервалов, и достоверность конкретной информации оценивается в шансах:
— достоверная (вероятность отсутствия ложной информации близка к 1);
— почти определено, что информация достоверна (9 шансов против одного);
— имеется много шансов, что информация достоверна (3 шанса против одного);
— шансы примерно равны (1 за, 1 против);
— имеется много шансов, что информация недостоверна (3 шанса против одного);
— почти определено, что информация недостоверна (за 9 шансов против одного);
— недостоверная информация (вероятность ложной информации близка к 1).
Достоверность информации в смысле отсутствия в ней элементов дезинформации зависит от надежности источника, которая может оцениваться, например, по качественной шкале с уровнями: совершенно надежный; обычно надежный; довольно надежный; не всегда надежный; ненадежный; надежность не может быть определена.
Источниками недостаточной достоверности и точности экономической информации могут быть ошибки фиксации и организации сбора первичной информации, нечеткость определений и классификации данных, влияние времени, округление и выравнивание данных. Значительную проблему несут большие объемы данных низкой информативности и высокой зашумленности, а также необходимость выявления и обработки фальсифицированной информации.
Выделяются следующие основные причины искажения данных [2].
1. Несовершенство структуры системы обработки информации (сюда относятся, и недостатки технологического процесса обработки данных, и недостатки модели объекта управления);
2. Несовершенство алгоритмов, ошибки в программах, которые обрабатывают запросы на выдачу определенных сообщений;
3. Ненадежность работы оборудования;
4. Ошибки человека-оператора.
Практически все авторы работ по проблеме достоверности информации единодушно отмечают, что основным источником ошибок является человек-оператор. По данным [5], [6] и [7] на этапе сбора, подготовки и ввода сообщений вносятся от 61% до 98% всех ошибок. Проблема достоверности и точности информации поднималась и обсуждалась экономистами и историками еще советского периода. В научном арсенале решения проблемы достоверности информации преобладают статистические методы, простые модели анализа межотраслевых связей, с использованием вероятностных методов и методов теории информации. Однако, несмотря на достаточно высокий уровень подобного рода решений, эта проблема достоверности социально-экономической информации не может считаться в достаточной мере исследованной и решенной.
Рассмотрим в качестве одного из решений поставленной проблемы технологию дублирования информации, суть которого заключается в поиске компромисса между сокращением количества входных данных (для исключения «шумовой» информации) и сохранение качества принятия решений в условиях возможных искажений входной информации. То есть добавление к минимальному набору признаков такого набора, который содержит в себе данные, полностью или частично дублирующие информацию из минимального набора.
Прежде, чем приступить непосредственно к описанию идеи, введем основные понятия. Для начала обратимся к понятиям прототип и дублер:
● ПРОТОТИП — начальный, основной образец, источник.
● ДУБЛЕР — это двойник, способный почти полностью компенсировать отсутствие прототипа.
Таким образом получаем, что ДУБЛЬ — это набор дублеров, а ДУБЛИРОВАНИЕ — это процесс замены прототипа(ов) соответствующим(ими) дублером(ами). И так как, предлагаемая Вашему вниманию технология можно отнести к категории контролирующих процесс формирования первичных данных, то его можно определить как ТЕХНОЛОГИЯ ДУБЛИРУЮЩЕГО КОНРОЛЯ.

Формальная постановка задачи
Пусть дана таблица данных, содержащая N записей, каждая из которых содержит M+1 поле. Обозначим значение i-го поля j-й записи через xij, где i=1,...,M, j=1,...,N. Обозначим через V(A,S) задачник, в котором ответы заданы в полях с номерами i∈A, а входные данные содержатся в полях с номерами i∈S. Множество А будем называть множеством ответов, а множество S — множеством входных данных. Минимальное множество входных сигналов, полученное при обучении сети на задачнике V(A,S), обозначим через F(A,S). В случае, когда сеть не удалось обучить решению задачи будем считать, что F(A,S)=∅. Число элементов во множестве A будем обозначать через |A|. Через T(A,S) будем обозначать сеть, обученную решать задачу предсказания всех полей (ответов), номера которых содержатся в множестве A, на основе входных сигналов, номера которых содержатся в множестве S.
Задача. Необходимо построить набор входных параметров, который позволяет надежно решать задачу V({0}, {1,...,M}).
Решение задачи будем называть множеством повышенной надежности и обозначать Sпн.
Для решения этой задачи необходимо определит набор параметров, дублирующих минимальный набор S1=F({0}, {1,...,M}). И так как подходов к определению дублирующего набора может быть несколько, то для начала обратимся к классификации дублей.

Классификация дублей
1. По объекту дублирования:
● дубль первого рода — такой дубль позволяет дублировать все множество признаков из минимального набора в целом;
● дубль второго рода — позволяет дублировать конкретный признак (прототип).
2. По способу определения:
● прямой дубль — набор признаков, способный заменить определенный признак (или множество признаков) при получении ответа первоначальной задачи;
● косвенный дубль и набор признаков, позволяющий вычислить дублируемый признак (множество дублируемых признаков).
Исходя из предложенной классификации возможны четыре варианта дублей: прямой дубль первого рода, косвенный дубль первого рода, прямой дубль второго рода, косвенный дубль второго рода.
Рассмотрим последовательно алгоритмы получения дублей всех вышеперечисленных видов.

Прямой дубль первого рода
Для нахождения прямого дубля первого рода требуется найти такое множество признаков D из множества M``= M–M`, которое является минимальным для решения задачи прогнозирования результата. При этом в нашем случае необходимо выполнение условия, что существует сеть T({0},D) и S1|D=∅. Решение этой задачи очевидно. Удалим из общего множества входных признаков те из них, которые вошли в первоначальное минимальное множество признаков S1. Найдем минимальное множество признаков среди оставшихся. Это множество и будет искомым дублем (рис. 1).
Формально описанную выше процедуру можно записать следующей формулой:
D=F({0},{1,...,M}S1).
Множество повышенной надежности в этом случае можно записать в следующем виде:
S1nпн= S1 Υ D=F({0},{1,...,M}) Υ F({0},{1,...,M} F({0},{1,...,M})).
Очевидно, что последнюю формулу можно обобщить, исключив из первоначального множества признаков найденное ранее множество повышенной надежности и попытавшись найти минимальное множество среди оставшихся признаков. С другой стороны, существуют и множество таких задач, для которых не существует прямых дублей первого рода.

Косвенный дубль первого рода
Для нахождения косвенного дубля первого рода необходимо найти такое множество признаков D из множества M`` = M– M`, которое является минимальным и позволяющим вычислить дублируемые признаки множества M`. При этом в нашем случае необходимо выполнение условия, что существует сеть T({0},D) и S1|D=∅. Другими словами, среди множества признаков, не включающего начальное минимальное множество, нужно найти такие признаки, по которым можно восстановит значения признаков начального минимального множества. Схематично процесс формирования косвенного дубля первого рода изображен на рис. 2.
Формально же описанную выше процедуру можно записать следующей формулой:
D=F(S1,{1,...,M}S1).
Множество повышенной надежности в этом случае можно записать в следующем виде:
S1кпн= S1 Υ D=F({0},{1,...,M}) Υ F({0},{1,...,M}){1,...,M} F({0},{1,...,M})).
Эта формула так же допускает обобщение. Однако следует заметить, что косвенные дубли первого рода встречаются еще реже, чем прямые дубли первого рода.
Соотношение между косвенным и прямым дублем первого рода описываются следующей теоремой.
Теорема 1. Если множество D является косвенным дублем первого рода, то оно является и прямым дублем первого рода.
Доказательство. Построим нейронную сеть, состоящую из последовательно соединенных сетей T(S1,D) и T({0},S1), как показано на рис. 3. Очевидно, что на выходе первой сети будут получены те сигналы, которые, будучи поданы на вход второй сети, приведут к получению на выходе второй сети правильного ответа. Сеть, полученная в результате объединения двух сетей T(S1,D) и T({0},S1), является сетью T({0},D). Что и требовалось доказать.
Следствие. Если у множества S1 нет прямого дубля первого рода, то у нее нет и косвенного дубля первого рода
Доказательство. Пусть это не так. Тогда существует косвенный дубль первого рода. Но по теореме 1 он является и прямым дублем первого рода, что противоречит условию теоремы. Полученное противоречие доказывает следствие.
Рис. 1. Процесс формирования ПДПР и набора повышенной надежности
Прямой дубль второго рода
Перенумеруем входные признаки из множества S1={i1,...,ik}, k=|S1|. Множество признаков, являющееся прямым дублем второго рода для признака можно получить, найдя минимальное множество для получения ответа, если из исходного множества входных признаков исключен признак. Таким образом, прямые дубли второго рода получаются следующим образом: Dj=F({0},{1,...,M}{ij}).
Полный прямой дубль второго рода получается объединением всех дублей для отдельных признаков

Множество повышенной надежности для прямого дубля второго рода можно записать в следующем виде:
2nпн= F({0},{1,...,M}) U F({0},{1,...,M}{j}).
j∈F({0},{1,...,M})
При формировании прямого дубля второго рода в зависимости от поставленной задачи можно ограничиться несколькими признаками. В этом случае множество повышенной надежности будет складываться из минимального набора признаков плюс прямые дубли второго рода для интересующих нас признаков. Если же прямой дубль второго рода требуется найти лишь для одного признака из минимального множества, то тогда набор повышенной надежности будет состоять из минимального множества и единственного прямого дубля второго рода.
Заметим, что при построении прямого дубля второго рода не требовалось отсутствия в нем всех элементов множества S1, как это было при построении прямого дубля первого рода. Такое снижение требований приводит к тому, что прямые дубли второго рода встречаются чаще, чем прямые дубли первого рода. Более того, прямой дубль первого рода, очевидно, является прямым дублем второго рода. Более точное соотношение между прямыми дублями первого и второго родов дает следующая теорема.
Теорема 2. Полный прямой дубль второго рода является прямым дублем первого рода тогда и только тогда, когда
F({0},{1,...,M}{j}) |F({0},{1,...,M})=∅
j∈F({0},{1,...,M}) (1)
Доказательство. Построим сеть, состоящую из параллельно работающих сетей, T({0},{1,...,M}{ij}), за которыми следует элемент, выдающий на выход среднее арифметическое своих входов. Такая сеть, очевидно, будет решать задачу, а в силу соотношения (1) она будет сетью T({0},{1,...,M}S1). Таким образом, если соотношение (1) верно, то прямой дубль второго рода является прямым дублем первого рода. Необходимость следует непосредственно из определения прямого дубля первого рода.
Рис. 2. Процесс формирования КДПР и набора повышенной надежности
Рис. 3. Сеть для получения ответа из косвенного дубля
Косвенный дубль второго рода
Косвенный дубль второго рода для признака является минимальным множеством входных признаков, для которых существует сеть T({i1},{1,...,M}{i1}). Другими словами — это такое минимальное множество признаков, по которому можно восстановить значение признака из минимального множества. При этом этот признак перейдет из разряда «признаков» в разряд «результатов».
Таким образом, прямые дубли второго рода получаются следующим образом: Dj=F({ij},{1,...,M}{ij}).
Полный косвенный дубль второго рода строится как объединение косвенных дублей второго рода для всех признаков первоначального минимального множества (2), а множество повышенной надежности можно выразить формулой (3).
|S1|
D=U F({ij},{1,...,M}{ij}). (2)
j=1
nпн= F({0},{1,...,M}) U F({j},{1,...,M}{j}).
j∈F({0},{1,...,M}) (3)
Соотношения между косвенными дублями второго рода и другими видами дублей первого и второго рода задаются теоремами 1, 2 и следующими двумя теоремами.
Теорема 3. Косвенный дубль второго рода всегда является прямым дублем второго рода.
Доказательство данной теоремы полностью аналогично доказательству теоремы 1.
Теорема 4. Полный косвенный дубль второго рода является косвенным дублем первого рода тогда, и только тогда, когда верно соотношение
({j},{1,...,M}{j})|F({0},{1,...,M})=∅
j∈F({0},{1,...,M})
Доказательство данной теоремы полностью аналогично доказательству теоремы 2.

Результат применения технологии
Рассмотрим полученные результаты применения технологии дублирования информации на примере решения задачи классификации объекта потребительского рынка (магазина) на предмет его принадлежности к определенному типу (Бутик, Гипермаркет, Дискаунтер, Магазин у дома, Супермаркет, Универсальный магазин, Универсам). В основу легла база данных, представляющая собой таблицу, и состоящая из 529 примеров, характеризующихся 118 признаками и результатом, в роли которого выступает определенный класс. На основе этих данных была поставлена задача соотнесения объектов выборки к определенному классу, сокращение числа входных сигналов, создание набора повышенной надежности к неумышленным искажениям информации и установление взаимозависимостей между признаками с помощью возможностей алгоритмов дублирования информации. В качестве инструмента технической реализации использованы нейросетевые технологии [3].
В результате работы с нейросетевым имитатором набор прототипов для данной выборки составил 50 признаков из 118, при этом сеть способна классифицировать объекты по заданным классам со 100% точностью. Реализуя последовательно алгоритмы построения дублей, были получены следующие наборы повышенной надежности и иерархические схемы признакового пространства:
S1пп — состоит из 74 признаков (50 прототипов, 24 дублера);
S1кп — отсутствует, так как нейронная сеть не смогла решить задачу одновременного вычисления всего набора прототипов;
S2пп — включает в себя 97 признаков, количество которых совпадает с количеством полного прямого дубля второго рода;
S2кп — в его состав вошло 100 признаков, что так же соответствует полному дублю.

Для проверки надежности полученных наборов были сформированы три выборки на базе исходного задачника. В первой выборке случайным образом внесены искажения информации в наиболее информативный признак в 53 объекта (10% от общего количества). Во второй выборке — в тринадцати прототипах (10%) и том же объеме примеров (686 искажений). В третьей — в 50% прототипах (1325 искажений).
Тестирование качества решения задачи классификации показало, что искажения информации не влияют на качество классификации по задачнику со всем набором признаков и с наборов повышенной надежности, основанном на косвенном дубле второго рода. Однако качество решений задачи на базе других наборов признаков ухудшается в зависимости от роста количества искажений. Наиболее зависимым от точности данных оказалось решение нейронной сети, основанное на минимальном наборе признаков.
В качестве решения задачи предложена выборка, качественный и количественный набор признаков в которой равен набору повышенной надежности на базе косвенного дубля второго рода. Решение задачи классификации по данной выборке является устойчивым.
На примере решения этой задачи показано, что одновременное использование набора прототипов и дублеров позволяет формировать набор признаков, обладающей устойчивостью к искажениям информации во входных данных. Эксперименты показали, что в этих условиях менее устойчивой является система, решающая задачу на выборке с минимальным набором признаков, а более устойчивой — система, основанная на наборах повышенной надежности.
Анализ состава наборов признаков проиллюстрировал, что ряд из них не входит ни в минимальный набор, ни в набор дублеров. А анализ изменения ошибок вычисления позволил сделать вывод, что эти признаки являются зашумляющими, то есть решение задачи осуществляется менее качественно, если они присутствуют в выборке.
При решении задач по сокращению количества входной информации исследователь сталкивается с риском понижения качества решения и полезности их алгоритмов. В этом случае уменьшать погрешность вычислений можно и целесообразно за счет увеличения пространства признаков путем добавления дублирующей информации из набора исходных данных.
Алгоритмы поиска дублеров основаны на минимизации пространства признаков, а процессы формирования на их основе наборов повышенной надежности достаточно просты и имеют самостоятельное значение и не зависят от методов минимизации пространства признаков. Кроме этого, практическое применение данных алгоритмов показывает, что они могут войти в серию методов устанавливающих зависимости между признаками, объясняющих структуру пространства признаков и выявляющих иерархическую зависимость между характеристиками объектов исследования.
Однако предложенная технология дублирования не избавлена от недостатков. Некоторые из предложенных в ней алгоритмов построения дублей и наборов повышенной надежности являются достаточно трудоемкими и требуют от пользователя максимум внимания. Но данная проблема может быть частично устранена при соответствующей технической и аппаратной поддержке решения задачи.
Реализованные алгоритмы дублирования способны выступать в роли помощников в принятии решений. Они позволяют вырабатывать информацию нового содержания и создавать базу для дальнейшего анализа и обработки. С их помощью можно расставлять приоритеты среди признаков, формировать отдельно выборки, состоящие из первичной и вторичной информации, фильтровать данные и т.п.


Литература
1. Аксенов В.В. Использование экономико-математических методов в повышении качества оперативной экономической информации (на примере информационной системы Госснаба СССР): ил РГБ ОД 61:85-8/1162.
2. Бройдо В.Л. Достоверность экономической информации в АСУ. — Л.: Изд-во ЛГУ, 1984. — 199 с.
3. Горбань А.Н., Россиев Д.А. Нейронные сети на персональном компьютере. — Новосибирск: Наука, 1996. — 276 с.
4. Пивоваров А.Н. Опыт использования рациональных приемов и методов обеспечения достоверности обработки постоянной информации в АСУ. — Л., 1978.
5. Пивоваров А.Н. Методы обеспечения достоверности информации в АСУ. — М., Радио и Связь, 1982. — 144 с.
6. Шульц Я. Ограничения влияния ошибок входных данных в АСУ. — Podnikova organizace, 1976, V.30, #12, p 44–46. (ВЦП.№-А-47612).
7. Харкевич А.А. «Борьба с помехами». — М.: Наука, 1992. — С. 192–195.

Вернуться к содержанию номера

Copyright © Проблемы современной экономики 2002 - 2021
ISSN 1818-3395 - печатная версия, ISSN 1818-3409 - электронная (онлайновая) версия