УДК 004.738.5.056.523
В.Г. АБАШИН
V. G. ABASHIN
ИДЕНТИФИКАЦИЯ ПОЛЬЗОВАТЕЛЯ И ИДЕНТИФИКАЦИЯ УСТРОЙСТВА В ИНТЕРНЕТ
USER IDENTIFICATION AND DEVICE IDENTIFICATION IN THE INTERNET
В данной статье автор освещает проблему идентификации в Интернет устройств и пользователей, связь этих задач, а также исходные данные для построения распознавателя проводящего идентификацию.
Ключевые слова: идентификация; пользователи; устройства; Интернет.
In given article authors shine a problem of identification in the Internet devices and users, the relationship of these problems, as well as initial data for creating resolver conducting identification.
Keywords: identification; users; devices; Internet.
Задача идентификации пользователя не теряет своей актуальности в связи постоянной гонкой технологий защиты информации и технологий неправомерного получения доступа к информации. Актуальность данной задачи для сети Интернет повышается использованием незащищенных каналов передачи данных. Даже поверхностное исследование пути следования трафика с помощью утилит traceroute и whois показывает, что при движении между соседними городами трафик может покидать как пределы одной страны, так и пределы материка.
Задача идентификации устройства обычно решается с помощью уникальных кодов таких как MAC или IP адрес в сетях Ethernet или IMEI в сетях GSM. Однако использование уникального кода дает ответ на вопрос то же это устройство или нет, но не сообщает точный тип устройства и способ его использования конкретным пользователем. Кроме идентификаторов, возможно использование дополнительной информации, которая востребована в случае обработки косвенных признаков, на основании информации получаемой с датчиков устройства и в результате работы программного обеспечения на устройстве. В данном случае подразумевается применение методов динамической и статической биометрии, таких как клавиатурный почерк, распознавание по голосу и лицу, определение типа деятельности пользователя по данным глобальных систем позиционирования и гироскопа.
Универсальных персональных устройств на сегодняшний день не существует. Часто устройства используются для набора целей. Например, на планшете удобно читать новости в Интернете, общаться в социальных сетях, использовать сервис IP телефонии, но неудобно программировать. На ноутбуке удобно программировать и работать с документами, но неудобно обрабатывать графику, видео. На стационарной ПЭВМ удобно работать с графикой и видео, но неудобно часами читать сообщения или электронную книгу. Человек ежедневно использует множество стационарных и мобильных ПЭВМ, однако построение универсальной модели человека на основании данных получаемых c различных устройств не представляется возможным. В связи с этим возникает необходимость построения моделей для отдельных видов деятельности.
Использование косвенных признаков клавиатурного почерка позволило выявить на стационарном ПЭВМ следующие типы поведения: интернет-серфинг, набор текста, игра в игры в трехмерном пространстве, игра в гонки, использование ПЭВМ для воспроизведения аудио/видео контента.
Используем понятие отпечаток устройства, применительно к информации оставляемой на серверах и прочих регистрирующих устройств, а понятие отпечаток личности в устройстве к информации косвенно характеризующей человека по информации оставшейся в использованном им устройстве. Примером отпечатка устройства служит запись в лог-файле сервера, а отпечатком личности информация об использованных программах, времени и продолжительности использования программ, набор использованных файлов и прочих ресурсов.
Особое место среди программного обеспечения с точки зрения задачи идентификации устройства занимает браузер, как программа, с помощью которой пользователь получает доступ к большинству Интернет-ресурсов. Результат исследования данной проблемы опубликован в работе[1]. Отпечаток устройства по браузеру содержит, по крайней мере, 18,1 бита информации по Шенону. Для идентификации используется информация кукис-файлов, кукис-файлов технологии Adobe flash, информация об установленных шрифтах и плагинах. Также в работе представлен отчет об информативности каждого из приведенных признаков. В результате в выборке из 470161 браузеров, 83,6% браузеров удалось идентифицировать. В приведенном исследований данные о браузере собирались в одну текстовую строку без кодирования. Идентификация браузера заключалась в сравнение строковых данных о браузерах.
Решая задачу идентификации с использованием косвенных признаков, следует учитывать скорость изменения конфигураций аппаратного и версий программного обеспечения применяемого пользователем, а так же биологические ритмы которым подвержен человек. В исследовании[1] было выяснено, обновление браузеров происходит за 5-10 дней у половины браузеров, а за 15 дней изменяется отпечаток почти всех браузеров. Также известно, что обновление телефонов, планшетов и ноутбуков происходит в течение 1-3, реже 5 лет. Динамические биометрические признаки человека изменяются в течение полугода. Статические биометрические признаки сохраняются на протяжении всей жизни.
Решения задачи идентификации человека и устройства будет использоваться при реализации концепции «программный агент», для определения психофизиологического состояния человека и в задачах из области безопасности, для создания механизмов отслеживания пути. Автор предполагает, что при реализации концепции «программный агент» и задач определения психофизиологического состояния человека будут допустимы ошибки первого и второго рода порядка 10-15%, но при задаче идентификации с целью обеспечения безопасности ошибки сохранять значения в долях процентах.
Идентификация устройства и человека являются промежуточными целями. Благодаря идентификации устройства возможна калибровка методов съема информации. Конечной целью идентификации устройства является идентификация человека, получение прямой или косвенной информации о нем.
Исходными данными для идентификации устройства и человека предлагается считать: информацию об устройстве, информацию об окружающем мире, информацию о человеке. Сложность формализации исходных данных заключается в невозможности построения исчерпывающего множества значений некоторых признаков. Для получения информации от манипулятора мышь достаточно знать текущее разрешение экрана и получать от манипулятора информацию в виде: координаты x, y, время события, тип события. Информация об использовании клавиатуры состоит из кода клавиши, времени события, типа события. Однако формализовать признак, связанный с грамматическими и орфографическими ошибками допускаемыми пользователем при наборе текста, как минимум, сложно. Приведем описание исходных данных для идентификации устройства и пользователя в общем виде.
Информация об устройстве складывается из:
- списка и конфигурации используемого аппаратного обеспечения;
- списка и конфигурации установленных программ, и, если это возможно, времени установки программ;
- информации сохраненной на устройстве пользователя в виде кукис-файлов, других временных файлов;
- отпечатка файловой системы устройства.
Под отпечатком файловой системы понимается информация о структуре файловой системы, а неполучение математической свертки данных в файловой системе. Особое внимание уделяется файлам старше месяца, в которых не происходило изменений за это время. Они обладают достаточной стабильностью, чтобы на некоторое время стать идентифицирующим признаком. Для создания отпечатка файловой системы предлагается использовать информацию об их имени, местоположении, размере, дате создания и дате редактирования.
Получение информации об окружающем мире возможно из звука снимаемого микрофоном, а также съемки фото/видеокамеры; например, на сегодняшний день заявлено о создании технологий восстановления изображения помещения на основе фотографий сделанных хаотически.
Информация о пользователе складывается из:
- дней недели, времени суток использования, продолжительности активности программного обеспечения;
- повторяющихся опечатках, словах паразитах, ошибках при наборе текста;
- событиях мыши/тачпада/сенсорного экрана, других манипуляторов;
- событиях клавиатуры/сенсорной клавиатуры.
Конечной целью исследования задачи идентификации человека и устройства является построение распознавателя, способного с удовлетворительной точностью производить идентификацию. Особенность данного распознавателя заключается в не постоянном наборе входных значений, что должно отражаться на внутренней структуре распознавателя.
СПИСОК ЛИТЕРАТУРЫ
1. Peter Eckersley. How Unique Is Your Web Browser? / Electronic Frontier Foundation [Electronic resource]. - URL: https://panopticlick. eff. org/browser-uniqueness. pdf.
ФГБОУ ВПО «Госуниверситет — УНПК», г. Орел
К. т.н., доцент кафедры «Прикладная математика и информатика»
Тел.: +7(48
E-mail: *****@***ru


