Описаниями классов элементов среды на языке детерминированных признаков являются их эталоны, представляющие собой множества равноудаленных точек отточек, описывающих элементы среды, относящиеся к конкретным классам алфавита классов распознающей системы.
Описаниями классов элементов среды на языке логических признаков являются установленные зависимости между признаками А, В, С.. . и классами, выраженные на языке алгебры логики (булевых соотношений).
Для описания классов элементов среды, имеющих вероятностное распределение по областям Дik-мерного признакового пространства для всех значении на языке вероятностных признаков необходимо установить характеристики этих распределений, а именно: функции плотности вероятности значений параметров при условии, что элементы среды принадлежат классу, а также априорные вероятности принадлежности элемента среды, случайным образом выбранного из общей совокупности, к классу
Для описания классов элементов среды на языке структурных признаков используются специально создаваемые языки, состоящие из предложений, каждое из которых характеризует структурные особенности элементов среды, относящихся к тому или другому классу распознающей системы.
Целью десятой задачи является разработка алгоритмов распознавания, осуществляющих отнесение исследуемого элемента среды к определенному классу или некой их совокупности. Если исследуемые элементы среды можно отобразить в виде точек k-мерного признакового пространства распознающей системы и ввести понятие расстояния (эвклидова, махаланобисова и т. д.), то точки, расположенные на небольшом расстоянии друг от друга (находящиеся вблизи), можно считать сходными, а соответствующие им элементы среды – принадлежащими одному определенному классу, тогда как точки, разделенные значительным расстоянием (находящимися вдали друг от друга), – различными, а соответствующие им элементы среды – принадлежащими разным классам распознающей системы. Эта идея закладывается в разработку различных алгоритмов распознавания принадлежности исследуемых элементов среды к тем или иным классам базирующихся на сравнении выбранной меры близости (меры сходства) L исследуемого элемента среды w со всеми классами установленного алфавита классов системы распознавания. Решение о принадлежности исследуемого элемента среды к определенному классу принимается из условия его наибольшей близости к этому классу:
В качестве меры близости в алгоритмах, работающих с детерминированными признаками, например, часто принимается среднеквадратичное - расстояние между исследуемым элементом среды и совокупностью элементов, относящихся к классу :
В качестве меры близости в алгоритмах, работающих с вероятностными признаками, принимается риск принятия решения о принадлежности исследуемого элемента среды к определенному классу алфавита классов системы распознавания.
В алгоритмах, работающих с логическими признаками, мера близости не применяется. В них осуществляется подстановка конкретных значений признаков, характеризующих исследуемый объект, в описание классов на языке логических признаков, выполненное в виде булевых соотношений, дающая однозначный ответ, к какому классу принадлежит распознаваемый элемент среды, или указанный ответ можно получить решив соответствующие алгебраические уравнения, описывающие классы на языке логических признаков.
В алгоритмах, работающих со структурными (лингвистическими) признаками, распознавание исследуемого элемента среды осуществляется на основе идентификации предложения, описывающего этот объект, с одним из предложений, характеризующим структурные особенности распознаваемых элементов, относящемуся к тому или другому классу системы распознавания.
Решение одиннадцатой задачи обеспечивает выбор или (и) создание технических средств получения информации для установления значений признаков, включенных в словарь признаков распознающей системы и обеспечения ее функционирования. В виду большого многообразия предметных областей для распознавания создание и функционирование систем распознавания требует применения множества разнообразных технических средств измерения, наблюдения, регистрации, преобразования, обработки, передачи данных. При этом, применяются как стандартные, так и специально создаваемые технические средства. Затраты на приобретение и создание технических средств, необходимых для реализации процесса распознавания на основе априорных алфавита классов и словаря признаков, часто превышают величины реально располагаемых ресурсов. В этих случаях приходится искать компромисс между идеальным с точки зрения достижения целей распознавания вариантом процесса распознавания и реально возможным в условиях имеющихся ограничений. За сокращение затрат приходится расплачиваться снижением эффективности результатов идеального процесса распознавания. Как правило, существует множество путей перехода от идеального к реально возможным вариантам процесса распознавания, т. е. эту проблему можно рассматривать как многовариантную задачу. Математическая постановка указанной задачи и методология ее решения приведена в [4]. Нахождение рационального (оптимального) варианта базовых характеристик процесса распознавания (рабочего алфавита классов, рабочего словаря признаков, окончательных вариантов описания классов на языке признаков и алгоритмов распознавания, и т. д.), а также состава технических средств возлагается на субъекта распознавания создаваемой распознающей системы.
Двенадцатая задача обеспечивает разработку рациональной (оптимальной) структуры распознающей системы и алгоритма эффективного управления процессом распознавания. Сущность этой задачи заключается в разработке решений конструктивно-технологического, организационно-технического, производственного, социально-экономического характера, направленных на материализацию проектных решений создаваемой системы распознавания. Значимость этой задачи возрастает по мере роста сложности распознающих систем. Формирование структуры распознающей системы и разработку алгоритма управления процессом распознавания следует рассматривать как многовариантные оптимизационные задачи. Постановка и решение указанных задач возлагается на субъекта распознавания. Критериями качества решения указанных задач, например, могут быть длительность времени процесса распознавания, затраты, связанные с процессом распознавания, достоверность результатов распознавания и т. п.
Тринадцатая задача состоит в оценке результатов распознавания на основе установленных показателей эффективности. В зависимости от назначения системы распознавания, реализуемых ею целей устанавливаются показатели качества (эффективности) ее функционирования, например, такие как вероятность правильных решений, средняя продолжительность распознавания, затраты на получение апостериорной информации, и т. д. Оценка результатов распознавания осуществляется на основе анализа конкретных данных, полученных как результат экспериментов или моделирования работы распознающей системы или реально действующей системы распознавания, на предмет определения степени достижения установленных показателей качества.
Четырнадцатая задача реализует представление информации о результатах распознавания в среду. Результаты распознавания следует представлять в среду с учетом требований, предъявляемых получателем к форме, содержанию, регламенту, способу и т. п. представления. В этой задаче должна быть реализована разработка интерфейса, связывающего систему распознавания со средой. Указанная работа выполняется разработчиками распознающей системы. С учетом большого разнообразия разрабатываемых распознающих систем при решении данной задачи рекомендуется по возможности пользоваться типовыми модулями и решениями.
Пятнадцатая задача обепечивает поддержание системы распознавания в работоспособном состоянии в процессе эксплуатации. Для этого должна быть разработана и реализована система технического обслуживания системы распознавания, осуществляющая функции контроля состояния ее функционирования, предупреждения влияния возмущающих воздействий, анализа возникающих отклонений и своевременное принятие мер по восстановлению ее работоспособности.
11.4. Математические методы распознавания
С целью обеспечения высокой эффективности сложных, больших систем распознавания наряду с теоретическими исследованиями применяют математическое или (и) физико-математическое моделирование. Например, при построении локационных систем селекции и распознавания разрабатывается комплекс математических моделей, являющийся инструментом для организации исследований на основе выполнения математических экспериментов [7]. Физико-математическое моделирование предусматривает сочетание физических (лабораторных, натурных) и математических экспериментов. При этом, как отмечено в [7], роль математического эксперимента значительнее при лабораторных исследованиях, чем при натурных испытаниях. При разработке большой системы распознавания и ее элементов может реализовываться следующая цепочка: физико-математические исследования – натурные испытания.
Решение задач, возникающих при разработке и эксплуатации распознающих систем, осуществляется с применением математики. Так, для обработки априорной информации логического характера применяется алгебра логики стохастического характера – теория вероятностей, математическая статистика, теория матриц, теория множеств и т. д. А при разработке системы распознавания применяются также методы исследования операций, теории игр, теории принятия решений и др.
В работе [3] проблема распознавания, заключающаяся в нахождении рабочего алфавита классов, рабочего словаря признаков, описания классов на языке признаков, оптимального состава комплекса технических средств системы распознавания, которые при наилучшем решающем правиле обеспечивают наиболее эффективное решение задачи распознавания, в условиях наличия ограничений на используемые ресурсы для создания комплекса технических средств, сформулирована в виде оптимизационной задачи и приведен метод ее решения, основанный на математическом моделировании.
В работе [1] рассматриваются следующие методы анализа данных:
дискриминантный анализ – для построения разделяющих функций в признаковом пространстве;
выделение и выбор признаков –для сужения избыточного множества признаков до подмножества «наилучших признаков» или их комбинаций;
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 |


