
От 13 января 2013 г.
Для Заказчика
Результат аудита баз данных «Заказчика»
08 января 2013 г. представитель Компании DM Solutions получил базы данных Заказчика для проверки состояния баз данных. БД предоставлена в xlsx-формате. Общий объем БД – 1000 записей для проведения экспресс-аудита.
1. Общая информация
· Предположительно данная база является базой уникальных адресатов, однако был обнаружен один дубль

· Язык БД – преимущественно БД состоит из украиноязычных записей. Однако могут встречаться русскоязычные символы (61082, г. Харьков, ул. Гвардейцев Широнинцев 15, кв.23; г.Скадовск,ул. Парижской Коммуны, д.11) и латинские символы.
· Использование справочников и задание формата полей для адресной части и ФИО:
Как показали результаты предварительного аудита, при создании БД не использовались справочники. После машинной обработки к ручному приведению осталось:
Для адресной части:
· 2,7% областей
· 0,7% районов
· 1,6% городов
· 5,0% улиц
Для ФИО:
· 4,7% фамилий
· 2,7% имен
· 2,9% отчеств
Все записи по ФИО, прошли связку 3-х. Существуют записи, где имена/отчества не содержатся в наших справочниках. Эти данные будут оставлены в исходном виде
· Иерархия справочников:
Считаю, что иерархическая структура не использовалась. БД можно разделить более чем на 10 фрагментов с различной структурой. Естественно данный факт влияет на качество, а главное на СКОРОСТЬ обработки данных
2. Полнота данных в базе данных
· Не указан город – 2,7% записей

· Не указана область – 28% записей (восстановлено 27,3% записей);
· Районы восстановлены в 22,5% записей;
· Нет улицы в крупном населенном пункте – 1,5% записей (непригодны к ДМ);
· Нет города в крупном населенному пункте – 1,7% записей (непригодны к ДМ).
3. Некорректность данных
По итогу, кол-во некорректных записей составляет 5,5% записей.
Разбивка по типам некорректности приведена ниже:

Выводы
Проведенный Компанией анализ баз данных показал, что состояние качества БД находится на среднем уровне. Автоматическая обработка проведена для 100% записей, из которых только 53% записей прошли данную обработку. Оставшиеся записи были отправлены на ручную обработку, благодаря которой и удалось достичь достаточно высокого показателя ликвидности БД.
Предполагаемое время обработки массива (1 млн. В2С) составит около 160 ч/часов работы Информационного отдела и около 543 ч/часов работы операторского отдела. Т. к. некоторые процессы могут происходить одновременно, общий срок обработки базы составит 20 рабочих дней.
Direct Marketing Solutions agency
Тел.(+38 0


