450

451

Использование основных объектов конфигурации

Анализ и прогнозирование данных

•  среднее значение - среднее арифметическое значений
выборки,

•  размах - разность между максимальным и минимальным
значением выборки,

•  стандартное отклонение - среднее квадратичное отклонение
равное корню квадратному из дисперсии выборки,

•  медиана - значение, лежащее в середине выборки
упорядоченной по возрастанию или убыванию. Другими
словами медиана делит выборку пополам; одна половина
выборки имеет значения меньше медианы, другая - больше. В
случае четного числа значений выборки, медиана
рассчитывается как среднее арифметическое двух значений
ближайших к центру выборки.

Для дискретных данных рассчитывается:

•  количество значений - общее количество значений,
присутствующих в исходной выборке,

•  количество уникальных значений - количество уникальных
значений, присутствующих в исходной выборке,

•  мода - значение, наиболее часто встречающееся в исходной
выборке. В выборке могут быть два или более значения, с
максимальной частотой (би - или мультимодальная выборка).
В этом случае в качестве моды будет взято первое найденное
значение с максимальной частотой.

Кроме того, для дискретных значений рассчитывается таблица частот, содержащая следующие показатели:

•  частота - количество вхождений уникального значения в
выборку,

•  относительная частота - частота, выраженная в процентах
от общего количества значений выборки,

•  накопленная частота - сумма частоты значения и частот всех
предыдущих значений выборки,

НЕ нашли? Не то? Что вы ищете?

•  накопленная относительная частота - сумма относительной
частоты и относительных частот всех предыдущих значении
выборки.

При выводе отчета при помощи построителя отчета анализа данных, будет создана круговая диаграмма по относительной частоте значений в выборке.

Типы колонок источника данных:

•  Не используется - колонка не участвует в анализе,

•  Входная - содержит исходные данные для анализа.

Параметры анализа данных при общестатистическом анализе не задаются.

Пример

В

качестве примера общестатистического анализа рассмотрим анализ данных, содержащихся в регистре накопления «Продажи». Для анализа выберем все записи регистра, в которых нас будут интересовать значение ресурсов «Сумма», «Количество» и значение измерения «Контрагент».

Допустим, мы будем иметь следующие исходные данные для

анализа:

452

453

Использование основных объектов конфигурации

Анализ и прогнозирование данных

 




Результат анализа будет выглядеть следующим образом:

Общая статистика

Информация о данных

Количествообьектов: 20

Непрерывные поля

Дискретные поля Контрагент

Количество значений: 20

Количествоуникальных значений; 6

Мода:


Диаграмма частот


Таблица частот

Поиск ассоциаций

Т

ип анализа АнализДанныхПоискАссоциаций предназначен для поиска часто встречаемых вместе групп объектов или значений характеристик, а также выполняет поиск правил ассоциаций. Этот тип анализа может использоваться для определения часто приобретаемых вместе товаров или услуг.

Типы колонок источника данных:

•  Не используется - колонка не используется в анализе.

•  Объект - колонка содержит объект, например документ
«Оказание услуги».

•  Элемент - колонка содержит элемент, например
номенклатуру из документа «Оказание услуги».

Параметры:

•  МинимальныйПроцентСлучаев - (Число) - минимальный
процент случаев, в которых наблюдается группа элементов.
Найденные группы, у которых процент случаев меньше, в
отчет включены не будут.

•  МинимальнаяДостоверностъ - (Число) - минимальная
достоверность правила. Найденные правила, у которых
достоверность меньше, в отчет включены не будут.

•  МинималънаяЗначимостъ - (Число) - минимальная
значимость правила. Найденные правила, значимость которых
меньше, в отчет включены не будут. Значимость правила -
величина, характеризующая насколько правило важно. Чем
выше значимость, тем интересней правило.

•  ПоискПоИерархии - (Булево) - необходимость поиска по
иерархии. При помощи этого параметра можно указать
анализу, что необходимо искать ассоциации не только среди
элементов, но и среди групп.

•  ТипОтсеченияПравил - (избыточные, покрытые) - тип
отсечения найденных правил. Избыточные - отсекать
избыточные правила, покрытые - отсекать правила, покрытые
другими правилами.

•  ТипИсточникаДанных - (объектный, событийный) - тип
источника данных. Анализ работает с двумя типами
источника. Объектный - каждая строка источника содержит

454

455

Использование основных объектов конфигурации

Анализ и прогнозирование данных

 


В

объект с его характеристиками. Событийный - источник данных содержит список событий. Например, состав документа «Оказание услуги».

ИспользованиеЧисловыхЗначений ~ (как булево, как число) как интерпретировать числовые значения. Можно интерпретировать числовые значения как числа или как логические значения, т. е. рассматривать ноль как Ложь, а все остальные ненулевые значения как Истина. ИгнорироватьНезаполненныеЗначения ~ (Булево) - Как использовать незаполненные значения. Т. е. игнорировать их

или нет.

Порядок - (по достоверности, по значимости, по количеству случаев) - определяет порядок отображения данных в результате анализа.

Пример

качестве примера возьмем данные регистра «Продажи»: поле «Регистратор» и измерение «Номенклатура»:

456

457

Использование основных объектов конфигурации

Анализ и прогнозирование

данных

 



Результат анализа будет выглядеть следующим образом:

Поиск ассоциативных правил

Параметры анализа

Минимальный процент случаев:

Минимальнаядостоверность: 60

Минимальная значимость: 0

Отсечениеправил: Избыточные

Колонки источника данных Входные колонки

Информация о данньк

Количество элементов: 12

Количество обьектов: 11

Средиее количество элементов в объекте: 1,82

Результат анализа

Найдено часто встречаемых групп: 4

Найдено ассоциативных правил: 5


Часто встречаемые группы

Поиск последовательностей

Т

ип анализа АнализДанныхПоискПоследовательностей предназначен для выявления в источнике данных последовательных цепочек событий. Например, это может быть цепочка услуг, которые часто последовательно заказывают клиенты.

Поддерживается поиск по иерархии, что позволяет отслеживать не только последовательности конкретных событий, но и последовательности родительских групп.

Набор параметров анализа позволяет ограничивать временные расстояния между элементами искомых последовательностей, а также регулировать точность получаемых результатов.

Типы колонок источника данных:

•  Не используется - колонка не используется в анализе.

•  Элемент - колонка содержит исследуемый элемент.
Например, в случае исследования продаж, это может быть
колонка, содержащая товар.

•  Последовательность - колонка содержащая
последовательности. Например, это может быть контрагент.

•  Время - время события.

Параметры:

•  МинимальныйПроцентСлучаев - (Число) - минимальное
число последовательностей, в которых должен наблюдаться
шаблон последовательности.

•  ПоискПоИерархии - (Булево) - необходимо ли осуществлять
поиск по иерархии.

•  МинимальныйИнтервал - (Булево) - признак того, что
установлен минимальный интервал между наблюдаемыми
событиями. Установка минимального интервала означает, что
для того, чтобы элементы попали в искомую
последовательность необходимо, чтобы временной интервал
между элементами был не менее установленного.

•  ЕдиницаМинимальногоИнтервала - единица минимального
интервала

458

459

Использование основных объектов конфигурации

Анализ и прогнозирование данных

 


В

КратностъМинималъногоИнтервала - (Число) - кратность минимального интервала

МаксималъныйИнтервал - (Булево) - признак того, что установлен максимальный интервал между наблюдаемыми событиями. Установка максимального интервала означает, что для того, чтобы элементы попали в искомую последовательность необходимо, чтобы временной интервал между элементами был не более установленного. ЕдиницаМаксималъногоИнтервала - единица максимального интервала

КратностъМаксималъногоИнтервала - (Число) - кратность максимального интервала

ИнтервапЭквивалентностиВремени - (Булево) - признак того, что установлен интервал эквивалентности времени между наблюдаемыми событиями. Если установлен интервал эквивалентности времени, то события, временной интервал

между которыми меньше интервала эквивалентности времени

считаются произошедшими в одно время.

ЕдиницаИнтервалаЭквталентностиВремени — единица

интервала эквивалентности времени

КратностьИнтервалаЭквталентностиВремени - (Число) -

кратность интервала эквивалентности времени

Минимальная длина - (Число) - минимальная длина

последовательности.

Порядок - (по длине, по количеству случаев) - определяет

порядок отображения данных в результате анализа.

Пример

качестве примера снова возьмем данные регистра «Продажи»: измерения «Номенклатура», «Контрагент» и поле «Период»:

460

461

Использование основных объектов конфигурации

Анализ и прогнозирование данных

Результат анализа будет выглядеть следующим образом:

Поиск последовательностей

Параметры анализа

Минимальный процент случаев: 10

Минимальный интервал:

Максимальный интервал:

Интервал эквивалентности времени:

Минимальная длина последовательности: 2

Информация о данных

Количество элементов: 12

Количество последовательностей: 6

Результат анализа

Найдено последовательностей: 2

Последовательности

Дерево решений

Т

ип анализа АнализДанныхДеревоРешении дерево решений позволяет построить иерархическую структуру классифицирующих правил, представленную в виде дерева.

Для построения дерева решений необходимо выбрать целевой атрибут, по которому будет строиться классификатор и ряд входных атрибутов, которые будут использоваться для создания правил. Целевой атрибут может содержать, например информацию о том, перешел ли клиент к другому поставщику услуг, удачна ли была сделка, качественно ли была выполнена работа и т. д. Входными атрибутами, для примера, могут выступать возраст сотрудника, стаж его работы, материальное состояние клиента, количество сотрудников в компании и т. п.

Результат работы анализа представляется в виде дерева, каждый узел которого содержит некоторое условие. Для принятия решения к

какому классу следует отнести некий новый объект, необходимо отвечая на вопросы в узлах пройти цепочку от корня до листа дерева, переходя к дочерним узлам в случае утвердительного ответа и к соседнему узлу в случае отрицательного.

Набор параметров анализа позволяет регулировать точность полученного дерева.

Типы колонок источника данных:

•  Неиспользуемая - колонка не используется в анализе,

•  Входная - колонка будет использоваться как атрибут для
создания узлов дерева, содержит характеристику
исследуемого объекта.

•  Прогнозируемая - колонка, содержащая классификацию.
Например - признак того, что контрагент перешел к другому
поставщику.

Параметры:

•  МинимальноеКоличествоСлучаев - (Число) - минимальное
количество случаев в узле.

•  МаксимальнаяГлубина - (Число) - максимальная глубина
дерева.

•  ТипУпрощения - (не упрощать, упрощать) - тип упрощения
дерева решений. Упрощать или не упрощать построенное
дерево решений.

462

463

Использование основных объектов конфигурации

Анализ и прогнозирование данных

Пример

Н

а этот раз мы проанализируем данные справочника
«Контрагенты». В качестве входных колонок мы используем
поля реквизитов справочника

«КоличествоРозничныхТочек», «КоличествоАвтомобилей»

«ВремяРаботыОрганизации» и «ВремяЗаключенияДоговора»' Прогнозируемой колонкой будет поле реквизита справочника «Контрагенты» - «ПрекращениеОтношений».

Результат анализа будет иметь следующий вид:

Дерево решений

Параметры анализа

Минимальноеколичествоэлементов вузле: 0

Максимальная глубина дерева: 1 000

Тип упрощения дерева решений: Упрошать

Колонки источника данных Входные колонки

Имя колонки

Тип данных

Количест в оРозничныхТочек

Непреры в ный

Количест во А в томобилей

Непрерывный

ВремяРаботыОрганизации

Дискретный

ВремяЗаключенияДоговора

Дискретный

Прогнозируемые колонки

Имя колонки

Тип данных

ПрекрашениеОтношений

Дискретный



Информация о данных

Количество объектов Количество классов:

Результат анализа

Глубина дерева решений: Количество внутренних узлов: Количество листьев' Ошибка, %:

ч 3

3 2

3

11,11

Дерево решений





464

465

Использование основных объектов конфигурации

Анализ и прогнозирование данных

 



Ошибки кпассиФикзции


Кластерный анализ

Т

ип анализа АнализДанныхКластеризация позволяет разделить исходный набор исследуемых объектов на группы объектов, таким образом, чтобы каждый объект был более схож с объектами из своей группы, чем с объектами других групп. Анализируя в дальнейшем полученные группы, называемые кластерами, можно определить, чем характеризуется та или иная группа, принять решение о методах работы с объектами различных групп.

Например, при помощи кластерного анализа можно разделить клиентов, с которыми работает компания на группы, для того, чтобы применять различные стратегии при работе с ними.

При помощи параметров кластерного анализа аналитик может настроить алгоритм, по которому будет производиться разбиение, а также может динамически изменять состав характеристик, учитываемых при анализе, настраивать для них весовые коэффициенты.

Результат кластеризации может быть выведен в дендрограмму специальный объект, предназначенный для отображения последовательных связей между объектами.

Типы колонок источника данных:

•  Не используется - колонка не используется при анализе.

•  Входная - колонка используется для группирования объектов.

•  Прогнозируемая - будет создан прогноз для значения колонки
для каждого кластера.

•  ВходнаяИПрогнозируемая - колонка используется как
входная и как прогнозируемая.

•  Ключ - ключевая колонка, предназначенная для
идентификации объекта.

Параметры:

•  КоличествоКластеров - (Число) - количество искомых
кластеров.

•  ТипЗаполненияТаблицы - (все поля, используемые поля,
ключевые поля, не заполнять) - какие поля выводить в таблицу
кластеризации.

•  Стандартизация - (не стандартизировать, стандартизировать) -
необходимость стандартизации данных. Если необходимо
стандартизировать данные, то анализатор предварительно
приведет все характеристики объектов к одной весовой
категории.

•  МераРасстояния - (ЕвклидоваМетрика,
ЕвклидоваМетрикаВКвадрате, МетрикаГорода,
МетрикаДоминирования) - каким образом вычислять
расстояние между объектами.

•  МетодКластеризации - (БлижняяСвязь, ДальняяСвязь,
КСредних, ЦентрТяжести) - каким методом выполнять
кластеризацию.

Пример

д

ля анализа мы возьмем те же поля справочника «Контрагенты», что и в предыдущем примере: «КоличествоРозничныхТочек», «КоличествоАвтомобилей»,

466

467

Использование основных объектов конфигурации

Анализ и прогнозирование данных

 




«ВремяРаботыОрганизации» «ПрекращениеОтношений». значение поля «Ссылка»:

«ВремяЗаключенияДоговора» и В качестве ключа мы используем

Центры кластеров




Результат анализа будет выглядеть следующим образом:

Расстояния между кластерами

Кластерный анализ

Денрограмма связей



Параметры анализа

Количество искомых кластеров: 3

Стандартизация: Стандартизировать

Мера расстояния: Евклидова метрика в квадрате

Метод кластеризации: Метод центра тяжести

Колонки источника данных Входные колонки

Информация о данных

Количествообъектов: 9

Результат анализа

Найденокластеров: 3

 





468

469

Использование основных объектов конфигурации

Анализ и прогнозирование данных

Модель прогноза

О

бъект модель прогноза представляет собой специальный объект, который создается из результата анализа данных, и позволяет в дальнейшем строить прогнозы для новых данных.

Например, модель прогноза поиска ассоциаций, созданная при анализе покупок клиентов, может быть использована при работе с осуществляющим покупку клиентом, для того, чтобы предложить ему товары, которые он с определенной степенью вероятности приобретет вместе с теми товарами, которые он уже выбрал.

Объект Модель прогноза можно получить из соответствующих объектов результат анализа путем выполнения метода СоздатьМодельПрогноза().




В дальнейшем для модели прогноза можно задать некоторый набор исходных данных и получить результат прогноза в виде таблицы значений.

Источник данных для модели прогноза задается при помощи свойства ИсходныеДанные, а для получения результата прогноза необходимо выполнить метод Выполнить().

Используя соответствующие свойства модели прогноза можно настраивать для нее входные колонки, колонки самой модели и колонки результата.

Кроме этого каждая из моделей прогноза содержит дополнительные свойства, определяемые типом анализа, к которому относится модель прогноза.

Пример

В

качестве примера мы рассмотрим использование модели прогноза данных при оформлении покупки, выполняемой контрагентом.

Предположим, что периодически проводится анализ данных базы типа поиск ассоциаций, и сохраняется актуальная модель прогноза.

Тогда, при формировании расходной накладной контрагента, мы можем использовать эту модель прогноза для того, чтобы исходя из состава расходной накладной, предложить контрагенту дополнительные товары, которые он, с большой долей вероятности, может приобрести.

Предположим, контрагент оформляет следующую покупку:

470

471

Использование основных объектов конфигурации

Анализ и прогнозирование данных

 




Тогда менеджер, нажав на кнопку «Предложение», может откры список товаров, которые, с большой долей вероятности, также имеет смысл предложить этому клиенту:

Построитель отчета анализа данных

О

бъект ПостроительОтчетаАнализаДанных позволяет представить данные анализа в виде табличного документа. Структура такого табличного документа определяется типом анализа, для каждого из типов анализа документ будет содержать определенный набор областей.

Объект ПостроительОтчетаАнализаДанных может

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29