Если классы разнесены друг от друга, задача распознавания решается легко. Когда объект попадает в область пересечения классов, задача усложняется. Такая ситуация может возникать, если у объекта часть признаков по отношению ко всем этим классам отсутствует. Проиллюстрируем их на простом примере.
Два непересекающихся класса, A и B, описаны в пространстве признаков {X1, X2}. Объект исследования O представлен одним признаком X1, признак X2 отсутствует. В пространстве признаков {X1} проекции классов пересекаются, и объект попадает в это пересечение.
Назовем классы, в которые попадает объект, дифференциальным рядом объекта. Это означает, что классы нужно дифференцировать друг от друга, добавляя значения недостающих признаков объекта. Но на практике это не всегда возможно. В нашем примере для более точной оценки нужно было бы добавить контрольному объекту значение признака X2.
Опишем формально сущность предложенного метода оценки. Пусть объекты исследования задаются значениями признаков xj, j=
. Назовем этот набор общим набором признаков. Множество объектов разбито на конечное число классов Щp, p=
. В пределах класса Щp объекты представлены набором признаков
, …,
, где p1, …, pn
. Как видно, наборы признаков разных классов могут не совпадать.
Представление классов. Обозначим через
(j![]()
, k![]()
, p![]()
) значение j-го признака k-го объекта p-го класса. Границы класса p по признаку j составим из пар
{
[
],
[
]}
Совокупность таких пар будем считать описанием класса. Геометрическая интерпретация такого описания – многомерный параллелепипед, минимально объемлющий объекты этого класса.
Сравнение объекта и классов. При оценке (распознавании) исследуемый объект сравнивается с проекциями классов на подпространство его признаков. Это значит, что каждый его признак сравнивается с соответствующим диапазоном в описании класса (ребром параллелепипеда), вне связи с другими признаками.
Необходимо определить отношение к классу Щp исследуемого объекта щ, который представлен значениями признаков
,…,
, где щ1,…, щn ![]()
. Будем считать, что объект щ отнесен к классу Щp, если для любого признака
, входящего в набор признаков класса Щp, т. е. для всех щj![]()
![]()
[
]
[
]
Обозначим классы, к которым отнесен объект щ, через pщ (среди них могут быть как все классы, образующие дифференциальный ряд объекта, так и только часть из них, на которой нужно сконцентрировать внимание). Область в подпространстве признаков объекта, где они пересекаются, можно обозначить совокупностью пар
![]()
[
] , ![]()
[
]
по всем признакам
объекта
.
Рассмотрим теперь другой объект ш, представленный значениями признаков
,…,
(ш1,…, шn![]()
).
Объект ш будет считаться аналогом объекта щ на классах pщ, если для каждого непустого признака
имеется соответствующий непустой признак
, и выполняются условия
![]()
[
]
![]()
[
]
В зависимости от сложности, область пересечения, в которую попадает объект, может включать два, три или более классов. Если же в качестве pщ выбрать только один из классов, к которым отнесен объект щ, то его аналогами на этом классе будут все объекты класса pщ.
Когда класс и исследуемый объект имеют несовпадающие наборы признаков, при оценке исследуемого объекта часть его признаков по отношению к выбранному классу может отсутствовать. В общем случае, для того, чтобы проводить сравнение в признаковом пространстве объекта, необходимо переопределить заново ограничивающую поверхность всех классов в этом подпространстве (когда, например, эти поверхности представлены гиперсферами). Предлагаемый метод позволяет избежать пересчета при переходе в подпространство признаков исследуемого объекта, т. к. сравнение происходит по каждому признаку независимо. Кроме того, процедура корректировки описания классов (при повторном обучении или кластеризации) сводится лишь к корректировке соответствующих диапазонов в этих описаниях.
Существуют различные пути построения классов эквивалентности (возможно сочетание указанных методов):
- привлечение экспертного знания, на основе обучающей выборки, предварительная кластеризация.
Детальное рассмотрение этих вопросов выходит за рамки данной работы. Предположим, что база прецедентов уже подверглась предварительной обработке – кластеризации.
При рассмотрении текущего случая точка, соответствующая ему, сравнивается с пространственным расположением полученных кластеров в проекции на пространство его признаков. Близкими считаются аналоги - прецеденты, принадлежащие кластеру, в который попадает случай. Если он попал в область пересечения кластеров, то близкими к нему будут аналоги из соответствующих классов, также находящиеся в области пересечения. В зависимости от сложности пересечения, мы можем разделить все аналоги на группы (рис. 1). Аналоги, находящиеся в общей с текущим случаем области пересечения, естественно считать более близкими к нему, чем те, что находятся только в одном из кластеров, потому что с тем же набором признаков, что и текущий случай, они подобны ему по принадлежности к понятиям, обозначаемым кластерами. Чем больше кластеров, к которым отнесен случай, принято в рассмотрение, тем более высокого ранга аналоги находятся в их общей области пересечения. В конечном счете, аналоги самого высокого ранга находятся в области пересечения всех кластеров, образующих дифференциальный ряд текущего случая.

|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 |


