Парный линейный коэффициент корреляции характеризует степень тесноты связи между исследуемыми переменными. Он рассчитывается только для количественных переменных. Чем ближе модуль значения коэффициента корреляции к единице, тем более тесной является связь между исследуемыми переменными. Данный коэффициент изменяется в пределах [-1; +1]. Если значение коэффициента корреляции находится в пределах от нуля до единицы, то связь между переменными прямая, т. е. с увеличением независимой переменной увеличивается и зависимая переменная, и наборот. Если коэффициент корреляции находится в пределах от минус еиницы до нуля, то связь между переменными обратная, т. е. с увеличением независимой переменной уменьшается зависимая переменная, и наоборот. Если коэффициент корреляции равен нулю, то связь между переменными отсутствует. Если коэффициент корреляции равен единице или минус единице, то связь между переменными существует функциональная связь, т. е. изменения независимой и зависимой переменных полностью соответствуют друг другу.

2) коэффициент детерминации рассчитывается как квадрат парного линейного коэффициента корреляции и обозначается как ryx2. Данный коэффициент характеризует в процентном отношении вариацию зависимой переменной, объяснённой вариацией независимой переменной, в общем объёме вариации.

Качество линейной модели множественной регрессии характеризуется с помощью показателей, построенных на основе теоремы о разложении дисперсий. Теорема. Общая дисперсия зависимой переменной может быть разложена на объяснённую и необъяснённую построенной моделью регрессии дисперсии.

НЕ нашли? Не то? Что вы ищете?

В настоящее время существует две основных концепции в борьбе за повышение качества прогнозных регрессионных моделей:

− выявление с последующим исключением из анализа единственной аномальной невязки (выявление с последующим устранением нескольких аномальных невязок на основе  поэтапного устранения по одному выбросу);

− нахождение с последующим исключением большего количества невязок, которые не всегда являются аномальными и их совместное отбрасывание приводит к минимальным изменениям параметров исходного регрессионного уравнения.

Первую концепцию реализуют методы Эктона, Титьена-Мура-Бекмана, а так же Прескотта-Лунда. Эти методы предназначены для выявления с последующим удалением единственного аномального измерения при нормальном законе распределения случайных величин невязок и их количестве n ≥ 30.

Вторая концепция - первый метод принципиально новой концепции − метод Кука.  Несколько позднее появились методы Белсли-Ку-Уэлша и Аткинсона. Сущность метода Кука заключается в нахождении при отбрасывании уравнивающих измерений, которые стабилизируют параметры, нового регрессионного уравнения по отношению к исходному.

11. Множественная регрессия. Ее преимущества и недостатки. Основная область применения в экологии и почвоведении.

Общее назначение множественной регрессии (этот термин был впервые использован в работе Пирсона - Pearson, 1908) состоит в анализе связи между несколькими независимыми переменными (называемыми также регрессорами или предикторами) и зависимой переменной. Специалисты по кадрам обычно используют процедуры множественной регрессии для определения вознаграждения адекватного выполненной работе.

В общественных и естественных науках процедуры множественной регрессии чрезвычайно широко используются в исследованиях. В общем, множественная регрессия позволяет исследователю задать вопрос (и, вероятно, получить ответ) о том, "что является лучшим предиктором для...". Например, исследователь в области образования мог бы пожелать узнать, какие факторы являются лучшими предикторами успешной учебы в средней школе. А психолога мог быть заинтересовать вопрос, какие индивидуальные качества позволяют лучше предсказать степень социальной адаптации индивида. Социологи, вероятно, хотели бы найти те социальные индикаторы, которые лучше других предсказывают результат адаптации новой иммигрантской группы и степень ее слияния с обществом. Заметим, что термин "множественная" указывает на наличие нескольких предикторов или регрессоров, которые используются в модели.

М. p. — метод многомерного анализа, посредством к-рого зависимая переменная (или критерий) Y связывается с совокупностью независимых переменных (или предикторов) X посредством линейного уравнения: Y' = а + b1Х1 + b2Х2 + ... + bkXk.

Коэффициенты регрессии или, по-другому, весовые коэффициенты b обычно определяют методом наименьших квадратов, минимизируя сумму квадратов отклонений фактических значений зависимой переменной от соотв. предсказанных значений.

При «пошаговом» («stepwise») подходе переменные добавляются (или удаляются) по одному за раз к (из) совокупности независимых переменных до тех пор, пока изменения не становятся статистически незначимыми (или значимыми). Кроме того, совокупность переменных может добавляться (или удаляться) в целях оценки их вклада в множественную корреляцию; в этом случае для определения статистической значимости их эффекта применяется F-критерий. Нелинейные связи можно оценить путем включения в правую часть уравнения регрессии членов более высокого порядка и/или мультипликативных членов.

Веса или коэффициенты регрессии определяются с наибольшей надежностью в тех случаях, когда независимые переменные являются относительно некоррелированными. Наличие высоких интеркорреляций между нек-рыми из них называется «мультиколлинеарностью» и приводит к получению коэффициентов регрессии, величина к-рых может заметно и нерегулярно изменяться от выборки к выборке. М. р. широко применяется для решения следующих задач:

1. Получение наилучшего линейного уравнения прогноза.

2. Контроль за смешиванием переменных (факторов).

3. Оценка вклада определенной совокупности переменных.

4. Объяснение сложного на вид многомерного комплекса взаимосвязей.

5. Проведение дисперсионного и ковариационного анализов посредством кодирования уровней независимых переменных.

12. Пространственные модели. Основная область применения в экологии и почвоведении.

Для решения информационных и расчетных задач, анализа, моделирования, отображения обстановки и местности многочисленные пользователи применяют пространственные (трехмерные) модели местности. Вместе с электронными картами они являются составной частью картографического обеспечения имеющихся и создаваемых систем управления, информационно-расчетных систем.

Пространственные модели местности позволяют решить следующие задачи:

- общую оценку местности;

- изучение и оценку свойств местности и отдельных наземных и подземных (подводных) объектов;

- ориентирование на местности;

- отображение данных о местности и обстановке;

- моделирование обстановки;

- решение информационных, расчетных и навигационных задач;

- обучение пользователей на тренажерах реального времени;

- проведение учебных занятий, тренировок и других мероприятий, связанных с подготовкой специалистов для решения задач на местности;

- повышение качества создаваемых пространственных моделей местности;

- информационную совместимость различных систем управления и навигации, геоинформационных систем и тренажеров.

Область применения – для организаций и предприятий независимо от форм собственности и подчинения, которые занимаются сбором, систематизацией, анализом, обработкой и передачей пространственных данных, созданием и применением пространственных моделей местности, организацией баз и банков пространственных данных. Пространственная модель местности: Наглядное и измеримое трехмерное изображение земной поверхности на электронных средствах отображения информации, воспроизведенное в соответствии с заданными условиями наблюдения (обзора) на основе цифровой информации о местности (электронных карт, цифровых моделей местности), полученной с географических карт, кадастровых планов и космоаэрофотографических материалов, рельефных карт и видеоизображений.

Пространственная модель местности может быть представлена в виде двух изображений на экранах мониторов, обеспечивающих объемное (стереоскопическое) наблюдение участка местности и объектов (наземных, подземных, подводных).

Требования к пространственным моделям местности: должны обеспечивать

- возможность наглядного представления трехмерного образа местности с топологическими связями и характеристиками в зависимости от времени суток, года и обстановки на экранах индивидуального и коллективного пользования;

- возможность наглядного зрительного восприятия рельефа, пространственных форм, размеров и положения наземных и подземных объектов местности, коммуникаций;

- читаемость и распознаваемость элементов и объектов местности;

- многоплановость изображения элементов и объектов местности;

- измеримость изображения;

- визуальную оценку взаимного пространственного расположения объектов.

Математическая основа моделей местности (проекция, масштаб) должна обеспечивать получение наглядного и топографически точного без разрывов изображения местности в определенном масштабе.

Содержание модели местности должно включать следующие элементы: рельеф, гидрографию, населенные пункты, сельскохозяйственные, промышленные и социально-культурные объекты, дорожную сеть, растительный покров и грунты, границы, подписи названий объектов местности и их характеристик, в том числе подземных (подводных) объектов и топологических связей между ними с необходимыми характеристиками.

13. ARIMA. Основные представления. Возможности применения.

ARIMA (англ. autoregressive integrated moving average) — интегрированная модель авторегрессии — скользящего среднего — модель и методология анализа временных рядов, иногда называемых моделями (или методологией) Бокса-Дженкинса. Являются расширением моделей ARMA для нестационарных временных рядов, которые можно сделать стационарными взятием разностей некоторого порядка от исходного временного ряда (так называемые интегрированные или разностно-стационарные временные ряды). Модель означает, что разности временного ряда порядка подчиняются модели ARMA(p, q). Эти модели используются при работе с временными рядами для более глубокого понимания данных или предсказания будущих точек ряда. Обычно модель упоминается, как ARIMA(p, d,q), где p, d и q — целые неотрицательные числа, характеризующие порядок для частей модели (соответственно авторегрессионной, интегрированной и скользящего среднего).

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17