Другие журналы

научное издание МГТУ им. Н.Э. Баумана

НАУКА и ОБРАЗОВАНИЕ

Издатель ФГБОУ ВПО "МГТУ им. Н.Э. Баумана". Эл № ФС 77 - 48211.  ISSN 1994-0408

Информационные критерии качества распознавания состояния объектов и выбор параметров для его осуществления

#9 сентябрь 2004

А

А.С. Вознесенский, канд. техн. наук, МГГУ,

В.А. Вознесенский

Информационные критерии качества распознавания состояния объектов и выбор параметров для его осуществления

В статье рассмотрены информационные критерии необходимости контроля состояния объекта и эффективности параметров контроля: показано, что необоснованное использование параметров (признаков) в некоторых случаях может привести к ухудшению качества распознания: даны рекомендации по выбору параметров.

 

Бурное внедрение мощных средств информационных технологий в повседневную жизнь делает возможным решение таких задач, с которыми часто приходится сталкиваться в практике и которые ранее решались либо интуитивно, либо с недостаточной точностью, либо вообще не решались из-за недопустимо больших затрат на их решение и недостатка исходной информации.

К одной из таких задач относится задача распознавания состояния различных объектов. Наиболее точное решение может быть получено, если оно принимается на основе достаточного количества исходных данных. В большинстве практических задач все многообразие состояний объекта может быть сведено к нескольким классам, число которых невелико ввиду ограниченного набора действий, принимаемых в том или другом состоянии. В простейшем случае речь идет о двух состояниях объекта (опасное или неопасное, устойчивое или не устойчивое и т.д.) В качестве примера может быть при ведено определение состояния геомеханических объектов, таких как подземные выработки и борта карьеров в процессе их разработки [1] и, в первую очередь, их устойчивость. В подобных задачах проводится измерение каких-либо физических параметров, характеризующих состояние объекта, и классификация состояний объекта осуществляется по полученным значениям, В качестве методов для решения этих задач могут быть использованы статистические методы распознавания образов, описанные, в частности, в работах [2] [3]. В любом случае одним из важных вопросов является правильный выбор параметров, поскольку все измерения связаны с затратами, а эффект от привлечения новых величин для распознавания может быть неоправданно мал.

Специфика подходов при анализе состояния объектов и при создании аппаратуры и систем для их контроля требует некоего “мостика” связывающего, на первый взгляд, далеко отстоящие друг от друга области. Роль связующего мостика может сыграть теория информации [1] [2]. Информация является такой же общей характеристикой, как и энергия, что дает основания для этого утверждения.

Информационные критерии эффективности я необходимости контроля. До проведения операции контроля неопределенность состояния объекта контроля характеризуется априорной безусловной энтропией H(ω) (где ω — состояние объекта контроля. После проведения операции контроля путем измерения значений одного или нескольких параметров х неопределенность состояния будет характеризоваться усредненной величиной — полной условной энтропией . Разность этих величин

                                     (1)

представляет собой количество информации, полученной в результате операции контроля, и может характеризовать качество метода или системы контроля [1], [2]. Однако значение этой величины зависит от априорных вероятностей состояния объекта и основания логарифма при ее вычислении. Поэтому более предпочтительной является относительная величина — информационная эффективность

                                     (2)

Она характеризует информационную эффективность параметров контроля и системы в целом безотносительно к основанию логарифма. Значение величины Э изменяется в пределах от 0 до 1. Здесь:

                          (3)

где Pi) — априорные вероятности состояний; k — число состояний; n — основание логарифма (n=2) В случае двух состояний (устойчивое и неустойчивое) энтропия вычисляется по формуле

          (4)

Полная условная энтропия  определяется как

(5)

Здесь Pi)— априорные вероятности состояний ωi:

P() — условные вероятности параметра контроля (одного или нескольких) в состоянии ωi;

р(х) плотность вероятности параметра (параметров) контроля х:

                      (6)

 — частная условная энтропия:

                      (7)

где апостериорные вероятности P() вычисляются по формуле Байеса

                                        (8)

Свойства объекта характеризуются необходимостью контроля, которая оценивается относительным недостатком информации, требуемой для надежного принятия решений. Показатель необходимости контроля

                                         (9)

где HД — допустимое значение энтропии, вычисляемое через допустимые вероятности состояний. Значения N изменяются в пределах от -∞ до 1. Положительные значения свидетельствуют о необходимости контроля, отрицательные — о его необязательности.

В случае двух состояний объекта (ωy и ωH) допустимая вероятность неустойчивого состояния может быть принята равной PДH)=0,00135 из условия граничного значения, равного трем среднеквадратическим отклонениям. В этом случае HД=0,0148 бит при измерении энтропии в двоичных единицах информации. Для соответствия выбранных параметров контроля требованиям, которые обусловлены объектом, следует выполнять условие

Э > N.                             (10)

Расчет плотностей вероятности. Расчет ин формационной эффективности, а также дальнейшие вычисления при определении состояния объекта с использованием критерия Байеса предусматривают использование условных плотностей вероятности параметров контроля, соответствующих различным состояниям объекта. Очень часто при построении условных плотностей вероятности используется нормальный закон распределения, что позволяет значительно упростить вычисления.

Однако для обоснованного применения этого вида распределений требуется соответствующая проверка с привлечением различных критериев согласия. Использование для проверки критерия х требует объема выборок не менее 30 элементов. В то же время во многих случаях, когда речь идет о безопасности людей или особо ценных объектов, приходится иметь дело со сравнительно малым числом опасных явлений, что является естественным следствием стремления различными способами свести число таких явлений к минимуму. Указанная специфика (малое число явлений и малое число наблюдений состояния объекта в опасном состоянии), а также естественное стремление не увеличивать объемы выборок, характеризующих объекты в этом состоянии, заставляют использовать непараметрические методы статистики, позволяющие принимать решения уже при объемах выборок размером от З до 10 элементов. Конечно же, к выводам, полученным при таких условиях, нужно относиться очень осторожно, однако другого пути здесь нет. Поэтому наряду с традиционными методами статистики следует использовать также и методы, предназначенные для обработки малых выборок. К таким методам относится построение плотностей вероятности методом суммы нормальных ядер [3] (оценка Парзена). В этом случае плотность вероятности

          (11)

где Ni,— число опытных данных, соответствующее i-му состоянию объекта; условная плотность вероятности параметра контроля х в состоянии ωi; xj -измеренные значения параметра контроля, в случае контроля по нескольким параметрам в качестве х и хi, рассматриваются векторы значений; h — некоторое число. Обозначим

x - xi=y. Величина  является ядром оценки.

В случае использования нормальных ядер и одного параметра контроля

                                  (12)

Величина h зависит от Ni. Ее выбирают равной

                                (13)

где n — число параметров.

При вычислении на ЭВМ исходными величинами являются выборки нескольких параметров x1, x2, x3,…xn, относящиеся к каждому классу состояний объекта:

                                `(14)

где i — номер состояния;  — j-й вектор параметров контроля в состоянии объекта ωi; N— объем выборки в этом состоянии (число, в общем случае раз личное для каждого класса ωi).

При контроле по нескольким параметрам нормальное ядро вычисляется как многомерная нормальная плотность вероятности [4] по формуле

        (15)

Здесь (x1, x2,…,xn) — вектор текущих значений пара метров контроля при расчете плотности вероятности в состоянии ωi;xl, xj — текущие значения параметров; al, aj — средние значения параметров в рассматриваемом состоянии; σl, σj - среднеквадратические отклонения l-го иj-го параметров в i-м состоянии;D — определитель n-го порядка (корреляционная матрица), имеющий следующий вид:

                                                                   (16)

rlj = rjl коэффициенты корреляции между l-м и j-м пара метрами, а величина Dlj, — алгебраическое дополнение элемента rli, в определителе D.

Выражение для плотности вероятности при контроле по n параметрам имеет вид               (17)

Алгоритм и программы расчета информационной эффективности параметров контроля. Алгоритм расчета информационной эффективности предусматривает следующие этапы,

1. Задают или рассчитывают априорные вероятности Pi).

2. По исходным экспериментальным данным (14),характеризующим объект в различных состояниях, рассчитываются средние значения и среднеквадратические отклонения параметров контроля, а также корреляционная матрица (16). По формуле (13) вычисляют величину h для каждого состояния.

3. По формуле (5) с использованием формул (15) и (17) рассчитывают .

4. По формуле (3) определяют H(ω), а по формуле (2) — величину Э.

Для расчета информационной эффективности на языке ПАСКАЛЬ была написана программа MULTIEFF, позволяющая рассчитывать информационную эффективность Э для числа параметров до 8, максимального числа классов до 10 и максимального числа элементов в каждом классе до 200. Указанные максимальные значения вполне достаточны для практики.

Тестовые расчеты показали, что для достижения точности до двух знаков после запятой минимальное число разбиений при интегрировании должно составлять 150—200. При 300 разбиениях точность составляет до трех знаков после запятой. Время расчета величины Э для двух параметров при 10 исходных точках в каждом классе на IВМ – совместимом компьютере с процессором DX4-100МГц приблизительно равно 5 мин.

Выбор параметров для наиболее эффективного распознавания состояния объекта. Описанные выше информационные критерии позволяют выбрать параметры (признаки) для наиболее эффективного распознавания состояния объекта. С одной стороны, их число не должно быть чрезмерно большим, поскольку использование каждого нового параметра связано с дополнительными затратами, а это далеко не всегда приемлемо. С другой стороны, недостаточное их количество или низкая эффективность параметров может привести к невыполнению условия (10), что в конечном итоге обусловит ошибочные решения относительно состояния контролируемого объекта. Увеличение величины Э часто осуществляется за счет использования параметров, каждый из которых может иметь эффективность, значительно отличающуюся от других.

Для оценки влияния вида распределения, образуемого различными сочетаниями экспериментальных значений, были проведены проверочные расчеты с использованием программы MULTIEFF. В расчетах две одинаковые группы исходных данных смещались одна относительно другой и при этом рассчитывались значения информационной эффективности Э для одного и двух параметров. В качестве исходных использовались тестовые данные, формирующие в одномерном случае одно- и двухмодальные распределения. В двумерном случае при этом образуются соответственно одномодальные (рис. 1) и многомодальные (рис. 2) распределения.

Рис. 1.

Рис. 2

При переходе от двумерного массива исходных данных к одномерному берутся проекции точек на соответствующую ось.

Повторение каждой группы точек со смещением относительно исходной группы позволяет моделировать различные случаи исходных данных. Небольшое смещение по какому-либо параметру соответствует не высокой информационной эффективности. Чем это смещение больше, тем выше информационная эффективность применяемого параметра. На рис. 3 приведена  зависимость информационной эффективности от смещения двух групп исходных данных друг относительно друга (по осям абсцисс и ординат). Применение разных смещений по разным параметрам моделирует использование параметров распознавания с различной информационной эффективностью.

Интерес представляет сравнение зависимости величины Э от смещения для однопараметрового и многопараметрового распознавания. Достаточно наглядно можно сравнить случаи использования одного и двух параметров.

Рис. 3.

На рис. 4, приведены зависимости величины Э от смещения между группами исходных точек для одного и двух параметров, когда в случае двухпараметрового распознавания смещение по одному параметру равно нулю (смещение дано в условных единицах). При этом в качестве исходных данных взяты точки, дающие одномодальные распределения, как в одномерном, так и в двумерном случаях.

Рис. 4.

Как видно на рисунке, никакого выигрыша использование второго параметра не дает по сравнению с использованием одного параметра. На рис. 5 приведены аналогичные зависимости, но для случая, когда смещение по второму параметру также постоянно, но отлично от нуля (равно 0,5). При этом выигрыш, получаемый при использовании двух параметров, по сравнению с использованием одного очевиден.

Рис. 5.

На рис. 6 представлены аналогичные зависимости, но для исходных данных, формирующих многомодальные распределения, как в одномерном, так и в двумерном случаях. Смещение по второму параметру равно нулю, что соответствует низкой эффективности. Использование второго параметра, обладающего низкой информационной эффективностью, даже ухудшает результат по сравнению со случаем использования одного параметра.

Рис. 6.

Полученные результаты свидетельствуют о необходимости расчета информационной эффективности при добавлении каждого нового параметра, поскольку неоправданное введение нового параметра с низкой эффективностью может даже ухудшить распознавание.

Выбор параметров осуществляется по заданному значению N. Для всех методов, которые предполагается использовать, рассчитываются значения Э как для от дельных параметров, так и для их сочетаний. При этом предполагается наличие хотя бы минимальных априорных данных о значениях параметров, соответствующих каждому состоянию объекта. Минимальное число значений может доходить до 3, однако к полученным результатам в этом случае следует относиться очень осторожно. По мере получения новых данных значения величины Э могут уточняться. Полученные значения сравниваются с требуемыми величинами Nи выбирается минимальное число параметров, отвечающее условию(10).

Пример расчета. Рассмотренные задачи могут воз никнуть, в частности, при распознавании напряженного состояния элементов подземных горных выработок в целях определения степени их устойчивости. Так, например, для целиков-столбов, оставляемых в рудниках Жезказганского горно-металлургического комбината для поддержания выработанного пространства, Н. П. Ерофеевым получена формула, позволяющая рассчитать вероятность разрушения в зависимости от запаса прочности целиков и срока их существования [5]:

где Т— срок службы целика: ξ — коэффициент запаса прочности, равный отношению средней прочности цели- как среднему значению нагрузки на него. В таблице приведены значения P(ωH) и N, а также требуемое число параметров контроля для целика с запасом прочности ξ = 3,5. С увеличением срока службы Т возрастает вероятность разрушения целика, а вместе с ней и необходимость его контроля. Требуемое число параметров, рассчитано исходя из ориентировочных значений эффективности, приведенных в [1]. Для одного параметра оно равно 0,57, для двух — 0,79.

Требуемое число параметров контроли устойчивости целика с коэффициентом запаса прочности 3,5

Срок службы

P(ωH)

N

Требуемое число параметров (методов)

1

0,00054

-1,22

0

3

0,00163

0,15

1

5

0,00272

0,45

1

10

0,00543

0,70

2

20

0,01087

0,82

3

 

Из таблицы видно, что в первое время после оформления целика контроль его устойчивости можно не вести. После трех лет следует применять контроль с использованием одного метода (например, путем измерения продольных деформаций целика). После десяти лет эксплуатации следует использовать уже два параметра (помимо измерения деформаций, например, также измерение активности акустической эмиссии). Значения N на 20-м году существования целика свидетельствуют о необходимости использования уже трех методов или параметров. Окончательный вопрос о конкретных методах или параметрах должен решаться по мере накопления опытных данных в процессе контроля.

После того как выбраны методы контроля, распознавание состояния объектов осуществляется с использованием критерия Байеса [2], [5] путем вычисления риска от принятия того или другого решения.

Список литературы

1. Вознесенский А.С. Системы контроля геомеханических процессов. М.: Изд. МГГУ, 1994. 148 с.

2. Горелик А.Л., Скрипкин В.А. Методы распознавания: Учеб. пособие для вузов. М.: Высшая школа, 1977. 222 с.

3. Фукунага К. Введение в статистическую теорию распознавания образов / Пер. с англ. М.: Наука, 1979. 368 с.

4. Левин Б.Р. Теория случайных процессов и ее применение в радиотехнике. М.: Сов. радио, 1960. 664 с.

5. Ямщиков В.С., Сидоров Е.Е., Вознесенский А.С. Контроль процессов горного производства: Учеб, пособие. М.: МГI4, 1985. 88 с.

 

Статья опубликована в журнале "Интеллектуальные системы" №5 1996 г.

 

Поделиться:
 
ПОИСК
 
elibrary crossref ulrichsweb neicon rusycon
 
ЮБИЛЕИ
ФОТОРЕПОРТАЖИ
 
СОБЫТИЯ
 
НОВОСТНАЯ ЛЕНТА



Авторы
Пресс-релизы
Библиотека
Конференции
Выставки
О проекте
Rambler's Top100
Телефон: +7 (915) 336-07-65 (строго: среда; пятница c 11-00 до 17-00)
  RSS
© 2003-2024 «Наука и образование»
Перепечатка материалов журнала без согласования с редакцией запрещена
 Тел.: +7 (915) 336-07-65 (строго: среда; пятница c 11-00 до 17-00)