От 13 января 2013 г.

Для Заказчика

Результат аудита баз данных «Заказчика»

08 января 2013 г. представитель Компании DM Solutions получил базы данных Заказчика для проверки состояния баз данных. БД предоставлена в xlsx-формате. Общий объем БД – 1000 записей для проведения экспресс-аудита.

1. Общая информация

· Предположительно данная база является базой уникальных адресатов, однако был обнаружен один дубль

· Язык БД – преимущественно БД состоит из украиноязычных записей. Однако могут встречаться русскоязычные символы (61082, г. Харьков, ул. Гвардейцев Широнинцев 15, кв.23; г.Скадовск,ул. Парижской Коммуны, д.11) и латинские символы.

· Использование справочников и задание формата полей для адресной части и ФИО:

Как показали результаты предварительного аудита, при создании БД не использовались справочники. После машинной обработки к ручному приведению осталось:

Для адресной части:

· 2,7% областей

· 0,7% районов

· 1,6% городов

· 5,0% улиц

Для ФИО:

· 4,7% фамилий

· 2,7% имен

· 2,9% отчеств

Все записи по ФИО, прошли связку 3-х. Существуют записи, где имена/отчества не содержатся в наших справочниках. Эти данные будут оставлены в исходном виде

· Иерархия справочников:

Считаю, что иерархическая структура не использовалась. БД можно разделить более чем на 10 фрагментов с различной структурой. Естественно данный факт влияет на качество, а главное на СКОРОСТЬ обработки данных

2. Полнота данных в базе данных

· Не указан город – 2,7% записей

· Не указана область – 28% записей (восстановлено 27,3% записей);

· Районы восстановлены в 22,5% записей;

· Нет улицы в крупном населенном пункте – 1,5% записей (непригодны к ДМ);

· Нет города в крупном населенному пункте – 1,7% записей (непригодны к ДМ).

3. Некорректность данных

По итогу, кол-во некорректных записей составляет 5,5% записей.

Разбивка по типам некорректности приведена ниже:

Выводы

Проведенный Компанией анализ баз данных показал, что состояние качества БД находится на среднем уровне. Автоматическая обработка проведена для 100% записей, из которых только 53% записей прошли данную обработку. Оставшиеся записи были отправлены на ручную обработку, благодаря которой и удалось достичь достаточно высокого показателя ликвидности БД.

Предполагаемое время обработки массива (1 млн. В2С) составит около 160 ч/часов работы Информационного отдела и около 543 ч/часов работы операторского отдела. Т. к. некоторые процессы могут происходить одновременно, общий срок обработки базы составит 20 рабочих дней.

Direct Marketing Solutions agency

Тел.(+38 0