Системный анализ (стр. 8 )

Партнерка на США и Канаду по недвижимости, выплаты в крипто

30% recurring commission
Выплаты в USDT
Вывод каждую неделю
Комиссия до 5 лет за каждого referral

Анализируя метод канонической корреляции, можно прийти к выводу, что линейные комбинации и выводятся из К-х главных компонент, построенных по корреляционной матрице R всех признаков . Оптимальная же структура значений показателей определяется не иначе, как путем проекции точки, представленной реальными значениями показателей в году на первую главную компоненту, построенную по всей совокупности признаков . Таким образом, переходим от n-мерного случая к одномерному, где в качестве оси, на которую осуществляется проекция, выступает первая главная компонента.

Нами предлагается более совершенный метод, суть которого заключается в следующем.

Каждый показатель системы представляется в параметрической форме, где в качестве параметра выступает время t. С этой целью значения каждого показателя, представленные в динамике за исследуемый период, аппроксимируются на основе метода наименьших квадратов. В результате расчетов каждый признак имеет вид =(t). Благодаря этим преобразованиям, пространственная кривая, отражающая траекторию эволюционного процесса развития объекта, будет представлена в параметрической форме

=(t), =(t), …, =(t).

Поскольку n-мерное признаковое пространство описано афинной системой координат, осями которой являются OZ1, OZ2, …, OZn, то перпендикулярные проекции пространственной кривой на одну из координатных плоскостей трудно выразить аналитически. Необходимо перейти от афинной системы координат к прямоугольной и осуществить перпендикулярную проекцию пространственной кривой на координатную плоскость в новой системе координат.

НЕ нашли? Не то? Что вы ищете?

Как известно, прямоугольной является система координат, осями которой служат главные компоненты, построенные по всему комплексу признаков Z1, Z2, …, Zn. Таких главных компонент будет n, в частности Y1, Y2, …, Yn и они выражаются как линейные комбинации исходных признаков Z:

……………………………..

В качестве координатной плоскости, на которую осуществляется перпендикулярная проекция пространственной кривой, берется плоскость , так как именно две первые главные компоненты аккумулируют большую долю дисперсии по всему комплексу признаков.

Проектируя каждую точку с координатами , соответствующую моменту времени ретроспективного периода, на плоскость , получим след пространственной кривой, отражающей траекторию эволюционного процесса развития объекта. Аналитически координаты точек на выбранной координатной плоскости рассчитываются путем подставления в линейные комбинации исходных признаков , описывающих первые две главные компоненты Y1 и Y2 реальных значений , то есть

Таким образом, найдем совокупность точек на координатной плоскости. Аппроксимируя эти точки некоторой функциональной зависимостью при помощи метода наименьших квадратов, получим зависимость типа .

Для прогноза оптимальной структуры значений показателей, обусловленных взаимным влиянием друг на друга показателей блоков, необходимо в первую очередь рассчитать прогнозные значения показателей по значению t, которое представляет собой момент времени периода прогноза, где форма зависимостей определялась ранее.

Поскольку нами найдена функциональная зависимость между первыми главными компонентами, то по значениям находится значение первой главной компоненты Р1. Используя зависимость , вычисляем «выровненное» значение второй главной компоненты, соответствующей точке с координатами . Зная кривую, заданную параметрически как , , …, , и подставляя в линейную комбинацию, описывающую вторую главную компоненту у2, переходим к параметрической форме этой главной компоненты в виде у2 = γ(t). Подставляя вместо у2 значение Р2 в это уравнение и решая его, находим значение t, соответствующее точке, расположенной на линии . Это значение t является скорректированным, обусловленным аппроксимацией. Если при решении уравнения получается несколько значений параметра t, то нужно брать ближайший к исходному значению данного параметра, для которого решается поставленная задача.

Подставляя в формулу параметрического задания пространственной кривой скорректированное значение параметра t, получим расчетные значения , где

при

при .

Таким образом, мы получаем оптимальную структуру значений показателей Х и У, обусловленных их взаимным влиянием друг на друга.

Предлагаемый метод является, по сути, продолжением метода канонической корреляции. Он позволяет расширить возможности анализа развития исследуемого объекта путем перехода от перпендикулярной проекции траектории эволюционного процесса развития этого объекта на координатную ось прямоугольной системы координат к проекции на координатную плоскость. Это, в свою очередь, дает больше информации о развитии объекта исследования.

В заключение следует отметить, что метод канонической корреляции приемлем как для анализа, так и для прогноза и, более того, управления объектом.

5.4. Моделирование случайного процесса

В исследовании социально-экономических процессов важнейшее место занимают методы, позволяющие адекватно проанализировать и дать прогноз развития многомерного объекта. Многомерность объекта исследования существенно затрудняет решение поставленных задач. Естественно, что традиционные методы не дают должного эффекта, следовательно, необходимо сочетание традиционных методов одномерного анализа с менее традиционными методами многомерного статистического анализа. При этом всевозможные методы многомерного анализа позволяют глубже и всесторонне исследовать тот или иной социально-экономический процесс. Особую актуальность это приобретает в условиях кризиса экономики. Одним из этих методов является исследование Марковского процесса.

Марковский процесс — случайный процесс, состояние которого после любого заданного момента времени t0 не зависит от его эволюции за предшествующий период, а зависит только от состояния в момент времени t0.

Для моделирования Марковского процесса необходимо иметь матрицу перехода В. Элементы этой матрицы bij есть коэффициенты перехода, отражающие то явление, что объект, находящийся в момент времени t в состоянии i к моменту времени t + τ, перейдет в состояние j, причем переходная матрица постоянна во времени, если случайный процесс стационарный, то есть

В случае, если процесс развития многомерного объекта представляет собой Марковский процесс, то при известном состоянии объекта в момент времени t0 ретроспективного периода, которое представляется упорядоченным набором чисел

можно осуществить прогноз его состояния в момент t > t0 периода прогноза

причем за один временной шаг следующим образом:

Остановимся на методах построения матрицы перехода В по исходной статистической информации, сведенной в матрицу «время — признак», элементами которой являются значения j-го признака в момент времени ti.

Метод 1.

Рассмотрим возможность использования матрицы парных коэффициентов корреляции в качестве переходной матрицы. С этой целью построим корреляционную матрицу, используя матричные преобразования исходного информационного массива.

Итак, информация о поведении объекта за период исследования сведена в матрицу

где n — число признаков; N — число наблюдений.

Стандартизуем элементы данной матрицы по правилу

где — среднее значение j-го признака; — среднее квадратическое отклонение j-го признака.

В результате получим матрицу

Z = .

Преобразованные признаки имеют нулевую среднюю и единичную дисперсию. Корреляционная матрица вычисляется как

где T — знак транспонирования.

В развернутом виде

Полученная матрица R имеет по главной диагонали единицы и симметричные элементы относительно главной диагонали

Геометрическая интерпретация

парных коэффициентов корреляции

Элементы матрицы R получаются следующим образом:

Так как второй сомножитель представляет собой длину вектора и обозначается как , то

аналогично

В связи с этим

Выражение под знаком суммы в числителе дроби представляет собой скалярное произведение векторов и . Учитывая это и произведя сокращение дроби, получим

Правая часть данного выражения представляет собой косинус угла между векторами, выраженный через скалярное произведение этих векторов. Поскольку они отличаются от исходных и лишь параллельным переносом, то углы между парами соответствующих векторов равны между собой. Таким образом, парный коэффициент корреляции между любыми двумя признаками системы показателей представляет собой косинус угла между ними

Каждый элемент корреляционной матрицы R можно интерпретировать как коэффициент перехода из состояния i в состояние j. Действительно, используя парный коэффициент корреляции , мы можем по координате точки, расположенной на оси ОХi, найти координату проекции этой точки, расположенной на оси ОХj, и наоборот, следующим образом:

и ,

где и — проекции на соответствующие оси. Однако следует отметить, что Марковский процесс — случайный, следовательно, имеют место вероятностные моменты. В частности, чтобы точки, лежащие на оси ОХi, спроектировались на ось ОХj, нужно из всего множества наблюдений выбрать то, которое перейдет в другое состояние. Вероятность этого события равна 1/n, где n — число показателей.

Таким образом, элементы переходной матрицы Марковского процесса будут вычисляться по формуле

а матрицы перехода Марковского процесса по формуле

Метод 2.

Наряду с этим можно предложить еще одну методику расчета переходной матрицы.

Пусть за два последних периода изучаемый объект имеет следующие значения своих признаков:

и переходная матрица имеет вид

Тогда .

Представим это матричное уравнение в развернутом виде. Запишем его в виде системы линейных алгебраических уравнений:

Разделим каждое уравнение системы на соответствующие правые части:

Так как принимают конкретные значения, то возникает вопрос: каковы должны быть значения коэффициентов переходной матрицы В? Поскольку их бесконечное множество, то можно взять, допустим,

то есть число, равное обратной величине соответствующих сомножителей. Но в этом случае в левой части каждого уравнения получим в качестве суммы число n. Разделим каждое слагаемое на n, в результате получим, что элемент переходной матрицы

Коэффициенты имеют, в свою очередь, вероятностный смысл, который заключается в следующем. Чтобы значение перешло в состояние , нужно сначала зафиксировать состояние , а вероятность этого события по классическому определению равна 1/n, и лишь тогда перейдет в .

Для прогнозирования состояния необходимо следующее преобразование:

Однако Марковский процесс — стационарный случайный процесс. В большинстве же случаев на практике приходится сталкиваться с нестационарными случайными процессами.

Для моделирования нестационарного случайного процесса на основе стационарного нами предлагается ввести матрицу рисков прогноза, которая формируется датчиком случайных чисел и имеет вид

при этом Р j могут быть как положительные, так и отрицательные, попадающие в интервал, например от -10 % до +10 %. Фактически Рj представляют собой вероятности отклонения ожидаемых значений в положительную или отрицательную сторону от прогнозных значений этих показателей. Тогда модель нестационарного случайного процесса в матричной форме запишется так:

Х (t) = В · Х (t o) + Р · В · Х (t o).

Осуществив соответствующие преобразования данного матричного уравнения, получим

Х (t) = (I + P) · В · Х (t o),

где I — единичная матрица порядка n.

Следует отметить, что модели как стационарного, так и нестационарного случайных процессов позволяют осуществлять многомерное прогнозирование одновременно всех показателей, описывающих объект исследования и при этом сохраняется эффект эмерджентности, то есть взаимовлияния и взаимообусловленности показателей в отличие от трендовых моделей, где система показателей искусственно разлагается на составляющие, нарушая эффект эмерджентности.

5.5. Методология формирования системы

информативных признаков

Одним из важнейших разделов статистического анализа является анализ данных, заключающийся в исследовании исходной статистической информации, представленной в виде информационного массива, описывающего объект исследования. При этом, как правило, исследуемый объект описывается в динамике множеством признаков. Следовательно, он представляет собой многомерный динамический объект. Статистический анализ этого информационного массива предполагает осуществление мероприятий по оценке информативности признаков, описывающих объект.

Для оценки информативности признаков системы требуется ряд методов и методик, использование которых позволяет решить данную задачу. Если говорить о том, что эти методы не разработаны, то мы погрешим против истины. Существует много подходов и методик оценки информативности признаков, относящихся как к эвристическим, так и аналитическим методам. Однако почти все из них сводятся к использованию экспертных оценок на том или ином этапе решения задачи.

Нами предлагается методология оценки информативности признаков системы на основе анализа исходного информационного массива. Эта методология включает следующие методики:

1. Оценка степени однородности эмпирических данных по каждому признаку.

2. Оценка мультиколлинеарности признаков на основе матрицы парных коэффициентов корреляции.

3. Интегральная оценка потенциала объекта по комплексу показателей.

4. Формирование системы информативных признаков для описания объекта.

Для решения поставленных задач в рамках предлагаемой методологии необходима формализация перечисленных методик, входящих в нее. Пусть многомерный динамический объект исследования описывается множеством признаков х1, х2, …, хn. При этом динамика развития объекта представлена за период . Описание динамики развития объекта исследования за данный период в рамках перечисленных признаков представляется в виде матрицы «время — признак», элементами которой являются значения j-го признака в момент времени .

Рассмотрим методологию оценки информативности признаков системы, описывающей многомерный динамический объект, в разрезе каждой из обозначенных методик.

Оценка степени однородности эмпирических данных

Одной из задач анализа данных выступает задача оценки однородности исходных эмпирических данных, отражающих динамику развития многомерного динамического объекта, представленных в виде матрицы «время — признак».

Как известно, обобщенными показателями, отражающими однородность исходных эмпирических данных, являются среднее квадратическое отклонение и коэффициент вариации. Эти характеристики дают оценки меры разброса значений того или иного признака относительно своего среднего значения. Они показывают, что чем меньше их значения, тем эмпирические данные более однородны.

Наряду с этим оценка однородности совокупности эмпирических данных осуществляется по степени равномерности.

где — степень равномерности j-го признака;

— среднее значение j-го признака;

— среднее квадратическое отклонение j-го признака.

Мера приближения степени равномерности к 100 % показывает степень однородности эмпирических данных в разрезе каждого признака.

Оценка мультиколлинеарности признаков

В большинстве случаев признаки системы, описывающие многомерный динамический объект, находятся в зависимости друг от друга и эта зависимость не очевидна, даже трудно определяется средствами качественного анализа. В связи с этим для выявления этой зависимости, и особенно ее меры, необходимо применение методов количественного анализа.

Одним из методов оценки зависимости является метод корреляционного анализа. Сущность этого метода заключается в том, что по исходному информационному массиву рассчитывается корреляционная матрица — матрица парных коэффициентов корреляции между признаками системы.

Высокая корреляция, которая имеется между двумя признаками, называется коллинеарностью, а между несколькими признаками — мультиколлинеарностью.

Чтобы исключить мультиколлинеарность, распространено формальное правило, заключающееся в том, что из исследования исключается один или несколько из связанных между собой признаков, когда корреляция между ними и оставшимся признаком более 0,8 по абсолютной величине. Однако так поступают только тогда, когда исследователь считает, что это не затронет существа рассматриваемой проблемы.

Расчет парного коэффициента корреляции между признаками и осуществляется по формуле

где — парный коэффициент корреляции между признаками и ;

— среднее значение произведений признаков и ;

— среднее значение признака ;

— среднее квадратическое отклонение признака ;

— среднее квадратическое отклонение признака .

Парные коэффициенты корреляции сводятся в корреляционную матрицу

Данная матрица симметрична, т. е. .

По данной матрице выбираются те парные коэффициенты корреляции, значения которых больше, чем 0,8. Признаки, для которых это условие выполняется, являются коллинеарными или мультиколлинеарными.

Таким образом, выполнение этих действий позволяет дать оценку мультиколлинеарности признаков системы, описывающей исследуемый многомерный динамический объект по исходному информационному массиву.

Интегральная оценка потенциала объекта

В решении задач социально-экономического характера в подавляющем большинстве случаев приходится сталкиваться с изучением процессов развития многомерного динамического объекта, а также оценкой его потенциала в динамике.

Так как потенциал объекта есть уровень его развития, то для определения уровня следует построить некоторую ось с началом и направлением. Значение проекции состояния объекта в момент наблюдения будет представлять собой количественную меру уровня развития объекта.

В качестве потенциальной функции нами предлагается следующая:

при этом уровень развития будет равен нулю, если признаки принимают нулевые значения.

Возникает проблема определения наивысшего уровня развития. Пусть объект стремится достичь такого состояния в перспективе, которое называется эталонным . Это эталонное состояние объекта будет соответствовать уровню развития, равному 100, то есть

Чтобы определить уровень развития объекта в момент времени , нужно вычислить значение . Поскольку нами определена ось, на которой отмечается уровень развития объекта, необходимо еще ввести масштаб. Так как мы определили уровни развития, равные 0 и 100, то на этой же шкале значение будет рассчитываться следующим образом:

— 100

Из этой пропорции определим как

или в развернутом виде

что соответствует значению потенциала на построенной шкале.

Данная шкала позволяет наглядно проследить уровень развития в динамике или потенциал многомерного динамического объекта, оцененного по комплексу показателей, описывающих его, который является интегральной оценкой состояния объекта в определенный момент времени.

Для расчета потенциала многомерного динамического объекта в определенный момент наблюдения можно воспользоваться следующим алгоритмом.

Пусть объект исследования описывается системой показателей и в динамике за период он представлен матрицей «время — признак», элементами которой являются значения j-го признака в момент времени . Необходимо осуществить следующие вычисления.

1. Рассчитать средние значения признаков

2. Рассчитать средние квадратические отклонения признаков

3. Рассчитать стандартизованные значения признаков

4. Определить экспертным путем эталонные значения показателей

5. Рассчитать стандартизованные значения эталонов

6. Рассчитать веса признаков в потенциальной функции

7. Построить потенциальную функцию

8. Рассчитать значения потенциальной функции для каждого момента наблюдения

9. Рассчитать эталонное значение потенциальной функции

10. Рассчитать потенциалы объекта для каждого момента наблюдения

Формирование системы информативных признаков

Формирование системы информативных признаков по исходной системе показателей осуществляется в зависимости от цели исследования. Как правило, в любом исследовании интерес представляет оценка потенциала по комплексу показателей. Это, в свою очередь, обуславливает отбор информативных признаков, то есть исключение из системы тех признаков, которые имеют наименьшие веса в потенциальной функции. Наряду с этим и признаки, имеющие большие веса, но мультиколлинеарные также могут быть исключены из системы показателей.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Партнерка на США и Канаду по недвижимости, выплаты в крипто

Домашний очаг

Справочная информация

Техника

Общество

Образование и наука

Мир

Бизнес и финансы