В. Е. ПОПОВА
Научные руководители – П. Е. МИНИН, аспирант,
– А. Д. ЕГОРОВ, аспирант.
Национальный исследовательский ядерный университет «МИФИ»
СИСТЕМА ДИСТАНЦИОННОГО УПРАВЛЕНИЯ
КОМПЬЮТЕРОМ
Рассмотрены основные алгоритмы обнаружения объектов на изображении, отслеживания объектов в видеопотоке и классификации последовательностей объектов, которые ложатся в основу системы управления компьютером с помощью веб-камеры.
Задача распознавания жестов является одной из актуальных в области информационных технологий в современном мире. Решение этой задачи необходимо для создания системы дистанционного управления компьютером, без использования стандартных устройств ввода, таких как мышь, клавиатура или сенсорный экран. Подобная система может использоваться, например, для управления показом презентаций, на производствах, предполагающих загрязнение рук, и в других приложениях.
В настоящий момент существуют решения задачи распознавания жестов, такие как Microsoft Kinect и Leap Motion, однако для их использования необходимо дополнительное оборудование, приобретение которого неоправданно в случае распознавания простых жестов. В данной работе для распознавания используется обычная веб-камера, которая в настоящее время встраивается практически в любой ноутбук и планшет, так же её можно подключить к любому ПК за небольшую цену.
Для того чтобы распознавать жесты рук в видеопотоке, нужно решить три основные задачи. Во-первых, необходимо обнаружить руку на кадре, во-вторых, отследить её местоположение на каждом кадре с момента обнаружения и составить траекторию движения и, в-третьих, определить, к какому из заранее известных классов относится траектория с наибольшей вероятностью.
Для решения первой задачи были опробованы два метода. Первый основывается на сравнении предварительно выбранной «области интереса» с шаблоном [1]. Поиск области производится на бинарном изображении, в котором белые пиксели соответствуют пикселям исходного изображения, имеющим цвет (в модели HSV), входящий в диапазон возможных цветов кожи. В полученном бинарном изображении выделяются связанные области. По результатам сравнения каждой области с шаблоном определяется рука. Второй метод – использование алгоритма Виолы-Джонса. Для улучшения работы алгоритма в каждой найденной области производится подсчёт пикселей цвета кожи, с помощью вышеуказанной маски. Если число таких пикселей в рассматриваемой области достаточно, то область определяется как рука.
Задача определения местоположения обнаруженного объекта на следующих кадрах решается с помощью алгоритмов трекинга. Наиболее простой из них – шаблонный трекинг. Координаты объекта на каждом кадре записываются и образуют траекторию, которую затем нужно сопоставить с одним из известных жестов.
Для решения задачи классификации полученной траектории необходимо, в первую очередь, создать математическую модель, которая позволила бы относить траекторию к одному из нескольких заранее известных классов. Одним из вариантов такой модели являются скрытые Марковские модели, часто демонстрирующие хорошую точность классификации. Во-вторых, необходимо подобрать дескриптор [2], который бы наилучшим образом описывал траектории, т. е. позволил бы получить максимальную точность. Скрытые Марковские модели необходимо предварительно обучить на известных данных [3], после чего уже их можно использовать для классификации, применяя алгоритм Витерби [4].
Список литературы
1. Dardas, Nasser. Real-time Hand Gesture Detection and Recognition for Human Computer Interaction. Ottawa, Canada, 2012
2. Колмогоров понятия теории вероятностей. 1998
3. Sebastien Marcel, Olivier Bernier, Jean-Emmanuel Viallet and Daniel Collobert. Hand Gesture Recognition using Input-Output Hidden Markov Models.
4. R. Movellan, Javier. Tutorial on Hidden Markov Models. 2003.


