Партнерка на США и Канаду по недвижимости, выплаты в крипто

30% recurring commission
Выплаты в USDT
Вывод каждую неделю
Комиссия до 5 лет за каждого referral

Исходная поверхность без пленки рассеивает излучение и периодическая структура не прорабатывается (рис. 65). С появлением пленки появляется и изображение структуры, которое становится с ростом толщины пленки контрастнее (рис. 66, 67). Включение признака - контрастность позволяет решить задачу распознавания объектов подложка и подложка с пленкой.

Рис. 64. Отклик от зеркальной поверхности

Рис. 65. Отклик от диффузионной рассеивающей поверхности (нет пленки)

Рис. 66. Отклик от поверхности с пленкой в 10 unit

Рис. 67. Отклик от поверхности с пленкой в 20 unit

Для толстых пленок очень сильно влияние неплоскостности поверхности пленки. На рис.68 приведен вид поверхности пленки. В зоне плоской пленки – a сигнал по форме схож с калибровочным. Наклонные поверхности b, c, d приводят к потере энергии сигнала и к изменению формы сигнала.

Рис.68. Участки a, b,c, d поверхности пленки(эллипс в районе точки а – смещающаяся зона контроля)

Разность коэффициента отражения эталонного сигнала в расчетных зонах может служить флагом неплоской поверхности.

На рис.69 приведены сигналы в расчетных зонах для пленки толщиной 80 unit. Отчетливо видно различие значительно лучшая проработка

Рис. 69. Отклик от поверхности с неоднородной пленкой толщиной 80 unit

Это пример сложной задачи формирования признаков, в которой присутствует определенная физическая модель и сложные измерительные устройства, определяющие значения параметра косвенным путем.

3.6. Корреляционные алгоритмы распознавания

НЕ нашли? Не то? Что вы ищете?

Корреляционный метод широко используется в различных задачах распознавания образов. Рассмотрим конкретику и наработанные методики на реальных примерах.

Распознавание движения применяется во многих областях: наблюдение, движущихся объектов в охранных системах, автоматическое наблюдение за дорожным движением и выявление нарушений, выделение только определенных движущихся объектов, например, автомобилей, распознавание отдельных типов движений. Обычно распознавание движения происходит в реальном режиме времени.

В этом случае происходит сравнение двух последовательных кадров. Кроме простого распознавания наличия движения также часто ставится задача определения параметров движения объекта, таких как скорость, ускорение, форма траектории.

Корреляционный метод при распознавании движения основан на нахождении смещения между двумя изображениями одного объекта. Смещение определяется по максимуму функции взаимной корреляции. В качестве опоры принимается характерные признаки объекта. Чтобы найти характерную особенность из первого изображения во втором, первое изображение g1(t)=g1 сравнивается со вторым g2(t)=g2 в пределах определенного диапазона поиска. Измерение схожести должно “пропускать” изменения в освещении. Т. е. мы считаем, что два образца одинаковы, если они отличаются на константу по яркости, которая отражает изменение освещения и частично по форме.

На языке скалярного произведения векторов это означает, что g1 и g2 параллельны. Это возможно тогда и только тогда, когда будет равенство в неравенстве Коши-Шварца

Иными словами, требуется максимизировать коэффициент взаимной корреляции

Коэффициент взаимной корреляции хороший показатель схожести двух образцов. Он принимает значение нуля для абсолютно несовпадающих (ортогональных) изображений и достигает максимума (единицы) для одинаковых образцов.

Корреляционный метод можно свести к комбинации операции свертки и поточечной операции. На первом шаге в определение коэффициента взаимной корреляции вводится вырезающая функция w.

Вырезающая функция выделяет “окно”, которое движется по изображению, и в пределах которого считается локальной значение искомого коэффициента.

Таким образом, коэффициент взаимной корреляции является функцией в 4-хмерном пространстве, зависящей от положения x и смещения s.

Для ускорения данного процесса вначале осуществляют поиск позиции максимума. Разложим коэффициент корреляции в ряд Тейлора второго порядка в точке максимума

где H матрица Гессе.

Мы не знаем положение максимума. Поэтому мы предполагаем, что вторые производные постоянны в достаточной близости к максимуму и вычисляем его в позиции предыдущей итерации s(i). Если у нас нет другой информации, то мы устанавливаем значение первой итерации в ноль s(0)=0. Пока мы не достигли максимального значения коэффициента, у нас будет присутствовать остаточный сдвиг. Его можно вычислить, если взять производную от

Учитывая, что матрица Гессе инвертируемая, получим следующую итерацию

Данный итерационный метод известен как метод Ньютона - Рафсона. Для определения смещения нам необходимо посчитать только первые и вторые частные производные от искомого коэффициента.

Рассмотрим выше сказанное на примере контроля наличия движения стеклянного полотна при его вытяжке из расплава. Останов полотна приводит к его обрыву, т. е. аварии. При вытяжке в слое стекломассы образуются неоднородности, изображения которых может быть принято за базу. Линейный многоэлементный приемник расположен по ходу движения полотна.

Формируем кольцо отсчетов размерностью близкой к масштабированному выборками времени существования неоднородности в поле зрения. На рис. 70 показаны пары выборок сигналов, полученные с нескольких зон стеклянного полотна. Временной сдвиг постоянен. В дальнейшем анализе в основном будут принимать участие сигналы и . Они нагляднее и последовательность операций на данном примере различима лучше.

Рис. 70. Пары выборок сигналов через постоянные интервалы времени

На рис. 71 приведены выбранные сигналы с большим масштабом по оси , чем на рис. 70. Благодаря увеличению отчетливо видны неоднородности в зонах фотоприемников с номерами 200...300. В финишные сигналы подлежащие корреляционному анализу нецелесообразно включать составляющие не изменяющиеся во время движения, к ним относится общий профиль сигнала. Введем интегрирование в скользящей зоне размером в 40 отсчетов. Результат обработки массива приведен на рисунке 72.

Рис. 71. Сдвинутые в пространстве сигналы

Рис. 72. Результат низкочастотной фильтрации одного из исходных сигналов

Рис. 73. Разностные сигналы

Определяем разностные сигналы в кольце отсчетов, результат приведен на рисунке 73. Внешне форма сигналов немного изменилась, но способность их различия сохранена.

Рис. 74. Вид одного из сечений корреляционной функции

Рис. 75. Вид корреляционной функции с достоверной зоной наличия неоднородности

Рис. 76. Вид корреляционной функции при отсутствии неоднородности

Рассчитываем смещение полотна как положение максимума корреляционной функции для отобранных зон и по полученным данным распознаем факт движения стеклянного полотна (рис. 74).

Внутри основной операции вложена задача распознавания наличия неоднородности на контролируемом участке и выбор зоны, в которой будет определено смещение. На рис. 75 виден локальный участок в котором можно достоверно определить смещение полотна. На рис. 76 такой участок отсутствует (для анализа взята пара с координатами 5200, 6000 рис. 72).

Корреляционные алгоритмы в сжатии изображений также достаточно эффективны. Рассмотрим подход к компрессии видеоматериала, разработанный для формирования слоев сцен в тренажерных комплексах. Этот задачи имеют специфику, которая позволяет допустить большие затраты времени при подготовке кадра и требует соблюдения режима реального времени при его воспроизведении. Отношение этих времен может достигать десятков и сотен тысяч раз.

В рассматриваемой реализации база данных эталонных образов составляет 524288 вариантов 120 байтных описаний Изображение сегмента базы размером 152 образа приведено на рис. 78. На рабочем изображении формируется движущийся сегмент вырезающей маски (на рис. 77 его текущее положение отмечено маркой с координатами 50 по и 30 по ). Результаты компрессии и декомпрессии представлены на рис. 80. Исходные изображения приведены на рис. 79.

Увеличено в 1,5 раза

Рис. 77. Маска

Рис. 78. Эталонны

Рис. 79. Исходное

Рис. 80. Результат

Коэффициент корреляции вычисляется после подготовки сегментов по формуле

где - описание - го образа, - описание рабочего сегмента.

Сегменты подготовлены для ускорения операций – они вытянуты в одну строку, +1 длина этой строки, - номер пикселя в строке. Сегменты нормированы по максимальному значению автокорреляционной функции. По положению максимума определяется индекс , который служит смещением в таблице эталонных образов при воспроизведении.

Вид идентификатора рабочего сегмента приведен на рис. 81. Он состоит из нескольких полей. Байты 5, 4 и три старших бита третьего байта формируют индекс, остальные зоны для рассматриваемого вопроса не важны они используются в различных режимах генерации изображений.

Рис. 81. Идентификатор рабочего сегмента

Индекс разбит на три независимые зоны. Это позволяет повторять операцию определения корреляционной функции раза, а не раз, что к конкретной реализации очень важно, не смотря на то что компрессия ведется на более мощных компьютерах, чем рабочие компьютеры тренажеров. Это ускоряет процесс почти в тысячу раз.

Сто двадцати байтное описание рабочего сегмента заменяется пяти байтным идентификатором. Коэффициент сжатия ~ 20 раз достаточен для организации потока данных от винчестера в реальном времени с отслеживанием действий оператора.

Качество изображений удовлетворительное, это видно из фрагментов пейзажа полученных в результате компрессии и декомпрессии (рис. 80).

В распознавании символов печатного текста по коэффициенту корреляции образов эталонного и рабочего символов рекомендуется следующая последовательность действий:

Ÿ назначьте распознаваемые классы (обычно число классов равно числу распознаваемых типов символов + число типов служебных сообщений);

Ÿ сформируйте эталонные образы (каждый образ целесообразно представить 2...4 эталонами);

Ÿ сформируйте бегущий сегмент рабочего образа;

Ÿ пронормируйте данные рабочего сегмента;

Ÿ вычислите корреляционное соотношение между признаковым описанием рабочего и эталонных сегмента;

Ÿ задав рабочий уровень доверия dr, примите решение о принадлежности рассматриваемого сегмента к одному из классов;

Ÿ если уровень доверия не превышен определите тип служебного сообщения и соответствующего действия.

На рис. 82 приведен выбранный с общего изображения фрагмент текста и выбранные классы символов рис. 83. Каждый класс представлен пикселями по размеру сегмента. При работе над эталонным образом используют два алгоритма:

Ÿ эталонный образ формируется в полуавтоматическом режиме с ручной корректировкой описаний символов;

Ÿ эталонный образ формируется автоматически, путем отбора описаний пикселей в обучающей последовательности, отбор может идти по мажоритарному алгоритму или через параметры гистограмм.

Ÿ Нормировка эталонного образа преследует своей целью устранение влияния таких параметров, как средний уровень фона, освещенность символа и т. п. В простейшем случае нормировка выполняется, через вычитание среднего и масштабирование по уровню сигнала, обеспечивающее заданное максимальное значение параметра доверия dm.

Ниже приведены рекомендуемые формулы расчета bn - нормированного массива признаков:

;

где - новый промежуточный массив с устранением среднего, а - значение автокорреляционной функции, вычисленной с учетом диапазона задания описания пикселя.

Рис. 82. Фрагмент текста

Рис. 83. Эталонные символы

Операции при нормировке рабочего сегмента рекомендуется проводить аналогично расчетам по эталонному образу.

;

где r - рабочий движущийся сегмент.

Рис. 84. Метки найденных положений символа с

Рис. 85. Вид корреляционной функции на различных участках текста

Рабочий уровень доверия dr - сложный параметр, задающий процент ошибок первого и второго рода, возникающих при распознавании. Обычно он выбирается в проценте от максимально заданного параметра доверия dm. Массив указателей Kd на обнаруженные символы можно вычислить по формуле:

На рис. 84 приведены результаты поиска символа “c” на изображении в виде изображения указателей.

Реально близкие по форме символы так же дают значительную величину корреляционного отклика (рис. 85). Много вопросов вызывает масштабирование символов и их разворот. Все эти вопросы находятся в своем развитии, изменяя конкретику эталонных образов.

Математическое обоснование эффективности корреляционных алгоритмов тесно связано с основополагающими положениями оптимальной обработки сигналов.

Пусть - накопленные данные о величине интересующего нас параметра случайного процесса, события или т. п. Неопределенность этой оценки характеризуется среднеквадратичным отклонением .

Поступили новые сведения , например, мнение очередного эксперта, или отсчет сигнала с оценкой неопределенности по среднеквадратичному отклонению . Будем считать и не коррелированными.

Итоговую оценку найдем по формуле

где - коэффициент статистического доверия оценки на фоне .

Ее разброс характеризуется среднеквадратичным отклонением

где - отношение среднеквадратичных отклонений. Вид графика приведен на рис. 86. Видно, что во всем реальном диапазоне изменения имеется в наличии оптимальное значение минимизирующее величину . Например при 3, 0,11 (рис. 87).

Определим оптимальную величину минимизирующую значение . Для этого продифференцируем последнее выражение по , приравняем его нулю и найдем значение , соответствующее положению точки экстремума.

Рис. 86. Вид зависимости от и

Рис. 87. Экстремум среднеквадратичного отклонения при =3

Проделав выше указанные операции получим оптимальное значение коэффициента суммирования

Наличие квадрата отображает метрику оси рисков, которую мы положили квадратичной, минимизируя среднеквадратичное отклонение.

Таким образом делаем вывод об оптимальной стратегии включения новых оценок в расчеты, при которой учет их в итоговом выводе идет с коэффициентом, обратно пропорциональным величине их среднеквадратичного отклонения возведенной в степень, отображающей метрику шкалы рисков.

Перенесем полученный вывод на сигнал произвольной формы, у которого оценивается его амплитуда.

где - искомая амплитуда, - гауссов шум с нулевым математическим ожиданием и среднеквадратичным отклонением .

Пусть на момент прихода текущего отсчета определена оценка с среднеквадратичным отклонением . Среднеквадратичное отклонение оценки в текущем отсчете , а .

Получим оптимальную оценку

Проведя расчеты с первого отсчета до - го получим оптимальную оценку амплитуды

где - известная форма исследуемого сигнала, которая принимается за эталон, - коэффициент учитывающий параметры формы эталонного сигнала в пространстве отсчетов и само количество отсчетов.

Для периодического сигнала с нулевым математическим ожиданием, при большом объеме корректной выборки (раздел 2.2)

и не зависит от исследуемого сигнала.

Уходя от ограничения на форму случайной помехи – белый шум, перейдем в частотную область.

Пусть мы оцениваем сигнал по его частотным составляющим, добавляя описание сигнала включением частот его спектра.

Учитывая частотную зависимость величины среднеквадратичного отклонения шума на элементарной частоте от частоты по аналогии получим

где , , выборки со спектра входного, эталонного сигналов и шума соответственно.

Данные зависимости хорошо известны. Истоком их является новый математический аппарат пришедший в свое время в среду радиофизиков, электронщиков, работающих с сигналами. Тогда он получил термин “желтая опасность” по цвету переплета отчета Винера.

Оптимальный фильтр, вобравший в себя основные моменты новой теории, получил название фильтра Винера-Колмагорова.

Подводя итоги сформулируем основные требования к процедуре распознавания образов с использованием корреляционных соотношений:

1. В алфавит признаков включают только те признаки, которые различны у распознаваемых классов;

2. Эталоны форм классов формируют пропорционально мощности признака в данном классе;

3. Произведения признаков у исследуемого объекта и эталона суммируются с коэффициентами обратно пропорционально их параметрам достоверности;

4. Проводя вычисления и стремясь к оптимальности следует четко определять конечный искомый параметр и решать корреляционную задачу относительно него. Не соблюдение этого условия может существенно снизить эффективность алгоритма. Например, при оценки фазы гармонического сигнала оптимальный эталон – сдвинут на четверть периода относительно исследуемого.

Как следует из рассмотренного материала, корректные корреляционные алгоритмы обеспечивают оптимальное или квазиоптимальное различие объектов и по своей форме близки к оптимальным фильтрам.

В систолических структурах так же, в основном, реализуются корреляционные алгоритмы распознавания с определенными упрощениями.

Оптимальная матрица весовых коэффициентов систолической структуры соответствует эталонному образу искомого сигнала с учетом описанных выше требований.

3.7. Распознавание близко расположенных в пространстве признаков объектов

Существует много задач распознавания, в которых классы видоизменяются во времени и имеют множество схожих признаков. Классический пример – работа с изображением лица человека.

Комплекс задач анализа изображений лица (определения характеристик человека, его состояния по изображению его лица, трансформация изображений лица, распознавание речевых команд по движению губ, идентификация человека по изображениям его лица, анализ выражений лица и т. п.) широко прорабатывается в криминалистике, кинематографии, психологии, медицине и в охранных службах. Примером этому служат работы в областях изучения человеческой способности распознавания «гладких» лицевых форм (наподобие античных статуй), трансформации изображений лиц, а также задачи, которые в перспективе могут оказаться полезными для распознавания - оценка ракурса съемки по полученному в итоге изображению, построение трехмерных моделей лица по двухмерным изображениям.

Исследования в области психологии определили, что существует, как минимум шесть человеческих эмоций, которые могут быть идентифицированы по соответствующим выражениям лица: счастье, грусть, удивление, страх, гнев и отвращение. Следует отметить, что система, основанная на использовании геометрической и физической (мускульной) моделей лица, а также оптимальных оценок оптического потока "метод Кимура и Яшиды ", способна работать с кадрами обычных видеофильмов и определять не только основные эмоции, но и простые мимические изменения лица (улыбка, поднятие бровей).

В то же время основной целью исследований было не только определение некоторых типов выражений лиц, которые можно ассоциировать с человеческими эмоциями, но и оценка "силы" самих эмоций.

Следует подчеркнуть, что решение данной задачи тесно связано с автоматическим выделением черт лица, обработкой видеопоследовательностей и другими направлениями распознавания образов.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11

Курс лекций по специальному курсу «Теория принятия решений и распознавания образов» (стр. 8 )

Партнерка на США и Канаду по недвижимости, выплаты в крипто

Рис. 78. Эталонны

Рис. 79. Исходное

Рис. 80. Результат

Рис. 81. Идентификатор рабочего сегмента

Проделав выше указанные операции получим оптимальное значение коэффициента суммирования

Домашний очаг

Справочная информация

Техника

Общество

Образование и наука

Мир

Бизнес и финансы