Тезисы доклада

Начало формы

1.  НАЗВАНИЕ ДОКЛАДА:

Поиск лиц в электронных коллекциях исторических фотографий

Face searching in digital collection of historical photographs

2.  АВТОРЫ:

,

A. N. Talbonen, A. A. Rogov

3.  ОРГАНИЗАЦИЯ:

Петрозаводский государственный университет

Petrozavodsk state university

4.  ГОРОД:

Петрозаводск

Petrozavodsk

5.  ТЕЛЕФОН: 6-21

6.  ФАКС: 0-00

7.  E-mail: *****@***ru, *****@

8.  ТЕКСТ ТЕЗИСОВ ДОКЛАДА:

В настоящее время активно создаются и развиваются электронные коллекции исторических изображений. Зачастую качество исходных материалов недостаточное для точного распознавания объектов на этих изображениях существующими средствами. К примеру, качество напрямую влияет на размер оцифрованного изображения лица человека. При этом, от данного размера и от качества изображения лица в целом зависит результат поиска людей по базе данных изображений, поэтому для изображений низкого качества требуется отдельное решение. Данная статья посвящена вопросам поиска похожих изображений лиц низкого качества (подробно описано в [1, 2]).

Среди доступных алгоритмов распознавания лиц один из самых высоких результатов показывает алгоритм локальных бинарных шаблонов, адаптированный специально под эту задачу [3].

Алгоритм локальных бинарных шаблонов (ЛШБ) был изначально разработан для распознавания текстур, однако позднее были созданы модификации для распознавания лиц [4]. Алгоритм основан на использовании специального фильтра для обработки изображения и последующего анализа результата обработки, в результате чего вычисляется специальная модель в виде закона распределения значений пикселей после применения фильтра. После этого модель можно использовать для сравнения с аналогичными моделями других изображения. Так, например, можно выполнять сегментацию изображения или выполнять поиск похожих изображений [4-6].

НЕ нашли? Не то? Что вы ищете?

В основных модификациях фильтр для каждой точки изображения вычисляет целочисленный код (код ЛБШ), который принадлежит заранее определенному диапазону. Этот код зависит от значений соседних точек, которые располагаются на окружности (в окрестности) заданного радиуса относительно текущей точки R и с заданными количеством точек N (см. рис. 1). Координаты точек могут быть и нецелыми. Для каждой точки окрестности определяется бит, который равен 0, если ее значение меньше значения центральной точки, 1 – иначе. Полученная последовательность битов определяет код ЛБШ, который принадлежит диапазону от 0 до (см. рис. 2) [3].

Рис. 1. Окрестность N=16, R=2.5. Взято из [3].

Рис. 2. Пример вычисления кода ЛБШ. Взято из [3].

Далее коды ЛБШ отображаются в другое множество, меньшее по размеру. Часто выделяют коды, инвариантные к повороту, или коды, представляющие собой непрерывную цепочку единиц. Это позволяет учитывать при распознавании возможные повороты изображений, а также усиливает влияние на результат наличие границ между цветовыми сегментации на изображении (участки глаз, рта и другие обладают границами, распределение которых может характеризовать отдельное изображение).

Кроме того, для распознавания лиц применяется разбиение изображения на одинаковые участки, например, 7x7, для каждого из которых рассчитывается распределение отображенных кодов ЛБШ, после чего полученные гистограммы объединяются в одну конкатенацией. В результате формируется итоговая модель [3-6].

Для сравнения изображений вычисляется расстояние между моделями. Часто для этого используют расстояние Хи-квадрат [1,3]. Кроме того, участки разбиения исходного изображения могут взвешиваться для акцентирования отдельных участков, например, тех, которые содержат глаза или рот [4-6].

Таким образом, существует масса различных модификаций алгоритма, каждая из которых может проявить оказаться наилучшей при распознавании изображений низкого качества. В данной статье предлагается метод выявления наилучшей модификации на основе эксперимента с обучающей выборкой. В таблице 1 представлена выборка из коллекции исторических изображений.

1)

2)

3)

4)

5)

6)

7)

8)

9)

10)

11)

13)

14)

15)

16)

17)

18)

19)

Таблица 1. Тестовое множество изображений для распознавания лиц.

При этом выборка содержит следующие пары лиц, соответствующих одному и тому же человеку: {3, 14}, {4, 13} и {7, 9}. Обозначим данное множество как . Кроме того, очевидна пара ложных объектов, которые должны быть близки друг к другу: {1, 15} (). Дополним множества и зеркально отраженными элементами данных множеств.

Для исследования работы различных фильтров LBP используется следующий алгоритм:

Для каждого объекта находится ближайший к нему объект . Т. е.

Обозначение

Точность Re

3/8

2/8

4/8

4/8

4/8

6/8

Взвешенный

4/8

Взвешенный

3/8

Взвешенный

5/8

Взвешенный

8/8

Таблица 2. Результаты экспериментов

по распознаванию лиц

Полученное таким образом множество пар сопоставляется с известными парами лиц и ложных объектов.

Обозначим .

Будем рассчитывать точность следующим образом:

В процессе исследования были рассмотрены различные варианты модификаций ЛБШ. В таблице 2 приведены показатели точности использованных модификаций относительно заданного множества . Модификации обозначены как «LBP» с различными индексами (подробно описано в [1]).

Таким образом, наибольшая точность достигается для взвешенного фильтра .

В результате эксперимента, проведенной над небольшой выборкой из коллекции, выявляется модификация, которую можно использовать для обработки всей коллекции.

Работа выполняется при финансовой поддержке Программы стратегического развития ПетрГУ в рамках реализации комплекса мероприятий по развитию научно-исследовательской деятельности.

Список литературы:

1.  , Рогов и методы поиска людей на фотографиях из исторического альбома. Ученые записки Петрозаводского государственного университета. Серия «Естественные и технические науки», 2012, № 6 (127), С. 113-117.

2.  Талбонен. -поисковая система для коллекции исторических фотографий. Информационная среда вуза XXI века: материалы VI Международной научно-практической конференции (4-10 декабря 2012 года). Петрозаводск. 20с. С. 142-144.

3.  Маслий локальных бинарных шаблонов для распознавания лиц на полутоновых изображениях [Электронный ресурс]. URL: http://www. nbuv. /e-journals/vntu/2008-4/2008-4_ru. files/ru/08rvmgsi_ru. pdf (дата обращения: 30.08.2012).

4.  Ahonen T., Hadid A., Pietikäinen M. Face Recognition with Local Binary Patterns [Электронный ресурс]. URL: http://masters. donntu. /2011/frt/dyrul/library/article8.pdf (дата обращения: 30.08.2012).

5.  , , Спиридонов локальных бинарных шаблонов к решению задачи распознавания лиц // Вестник МГТУ им. . Сер. Приборостроение. 2011. Спец. вып. Биометрические технологии. С. 58-63.

6.  Degtyarev N., Seredin parative Testing of Face Detection Algorithms [Электронный ресурс]. URL: http://lda. tsu. *****/papers/degtyarev-2010-icisp-ctfd. pdf (дата обращения: 30.08.2012).