Министерство науки, высшей школы
и технической политики РФ
Ульяноский политехнический институт
Статистические методы
в инженерых исследоваиях
Специальные главы математики
Методичские указания
для студентов специальности 1903
Составитель
Ульяновск 1993
Предисловие
Дисциплина «Статистические методы в инженерных исследованиях» (СМИИ) представляет специальные главы математики и включена в учебный план специальности «Авиаприборостроение». Включение этого предмета в список основных профилирующих дисциплин вызвано большим методическим значением, которое имеет наука об эксперименте для любого инженера-исследователя: современные экспериментально-статистические методы позволяют ускорить исследование сложных объектов и повысить его эффективность в 2-10 раз и более в зависимости от изученности и сложности объектов. Применение же средств вычислительной техники и автоматизации эксперимента дает возможность ускорить эти исследования еще в 10-ки раз.
Математическая теория эксперимента открывает новый подход к инженерным экспериментальным исследованиям. Что же нового внесла математическая теория эксперимента (МТЭ) в практическую деятельность инженера-исследователя, какие задачи могут быть поставлены и решены с помощью этих методов? На эти вопросы кратко следует заметить, что:
- внедрение экспериментально-статистических методов позволяет свести к минимуму интуитивный, «волевой» подход к организации (планированию) эксперимента, заменить его научно обоснованной программой проведения экспериментального исследования, причем субъективные оценки уступают место достаточно надежным статистическим оценкам результатов эксперимента на всех этапах экспериментального исследования;
- основная цель большинства экспериментальных исследований, состоящая в нахождении такой совокупности входных управляемых переменных (факторов), при которых оптимизируемая целевая функция принимает экспериментальное значение, достигается с помощью минимально возможного числа опытов при минимуме затрат времени и средств;
- даже при неполном знании внутренних закономерностей изучаемых явлений в объектах путем направленного эксперимента можно получить математическую модель объекта, включающую наиболее существенные факторы, независимо от их физической природы; такая математическая модель может быть с успехом использована не только для управления и нахождения необходимых режимов работы, но и для обнаружения ряда взаимосвязей в объекте, которые ранее были неизвестны или просто не замечались, для корректирования и уточнения сложившихся представлений об изучаемом явлении;
- МТЭ учит многофакторному, системному подходу в изучении сложных явлений вместо старого традиционного однофакторного одностороннего подхода; современная МТЭ по существу, использует все законы диалектики, требующей изучать сложные явления во всем богатстве обуславливающих их причин, взаимосвязей и их развития;
- используемый при решении вышеперечисленных задач математический аппарат является достаточно общим, что позволяет применить его как при исследовании реальных установок, приборов и схем, так и при исследовании физических и математических моделей; стандартизация обсуждаемых методов планирования опытов математической обработки полученных данных и статистического оценивания результатов позволяет обеспечить плодотворный обмен опытом различных коллективов.
МТЭ в теоретическом плане базируется на методах теории вероятностей и математической статистике, практически она опирается на современную вычислительную технику, применение которой необходимо для проведения большого объема вычислений, связанных с обработкой экспериментальных данных, при решении исследовательских задач, а также для сравнительного анализа экспериментальных планов методики цифрового моделирования.
Методические указания к дисциплине «Статистические методы в инженерных исследованиях» содержат две части. В первой части излагаются теоретические основы математических методов планирования эксперимента. Это по существу конспект лекций специальных глав математики по «Статистическим методам исследования в инженерных исследованиях». Во второй части (лабораторно-практический практикум [10]) описывается лабораторный исследовательский комплекс, т. е. объект исследований, на котором проводится эксперимент и студенты выполняют все этапы статистической обработки результатов эксперимента.
Лабораторные работы проводятся на специально разработанной кафедрой исследовательской установке АСФИ-САУ в виде электронной модели объекта управления (летательный аппарат в курсовом движении), система автопилотирования (автомата курса) и автоматического вариатора действующих в системе факторов (передаточных чисел автомата курса), выполненного по авторскому свидетельству № 000. На этой установке можно изучать влияние трех факторов и их взаимодействий. Характеристики объекта управления могут задаваться преподавателем для каждой бригады студентов. Студенты при выполнении лабораторных работ объединяются в бригады минимум по три человека для сбора статистического материала на одном объекте управления и далее ведут обработку результатов исследования по темам курса индивидуально. В целях закрепления знаний по методикам статистической обработки результатов исследования все расчеты проводятся «вручную» на микрокалькуляторах, а на завершающем этапе исследование проводится на вычислительной технике с использованием диалоговой системы «Диспас» (диалоговая система проектирования систем автоматического управления). Методические указания по последней части работ изложены в отдельном пособии [9].
В приложении [10] даны все необходимые для расчетов статистические таблицы. В целом дачное пособие позволяет изучить основы математического планирования эксперимента и получить практические навыки его применения, не прибегая к дополнительной литературе.
1. ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
1.1. Элементы теории вероятностей
Случайной величиной называет такую величину, значения которой изменяются при повторении опытов некоторым, заранее непредсказуемым образом. В отличие от неслучайных, детерминированных величин, для случайной величины нельзя заранее точно сказать, какое конкретное значение она примет в определенных условиях, а можно только указать закон ее распределения. Закон распределения считается заданным, если: 1) указано множество возможных значения случайной величины; 2) указан способ количественного определения вероятности попадания случайной величины в любую область множества возможных значений.
Вероятность попадания в заданную область может быть определена следующим образом:
![]()
,
(1.1)
где Nm - число наблюдений случайной величины, оказавшихся в заданной области, N - число (общее) наблюдений.
Аналитическими выражениями законов распределения случайных величин являются функции распределения вероятностей – интегральная и дифференциальная.
Интегральная функция распределения F(y) случайной величины Y показывает вероятность того, что случайная величина не превышает некоторого заданного или текущего значения y, т. е.
Следовательно, вероятность того, что значение случайной величины У заключено между y1 и y2 равна разности значений функции распределения, вычисленных в этих точках:
P {y1<Y<y2}=F (y2)-F (y1), (1.2)
аналогично
P {Y>y}=1-F (y).
Возможный вид функции распределения непрерывной случайной величины F(y).
Свойства интегральной функции распределения случайной величины:


для всех y,
4) F (y2) ³ F (y1), если y2 > y1.
Если F дифференцируема для всех значений У, то закон распределения вероятностей может аналитически выражен с помощью дифференциальной функции распределения вероятностей или функции плотности распределения вероятности (плотность вероятности)
(1.4)

Ее свойства:
1) f(y) > 0; 2) ![]()
3)
(1.5)
4) 
z - переменная интегрирования.
С помощью функции плотности вероятности определяется вероятность нахождения сл. величины в любой области из ее возможных значений
![]() |

Однако некоторые основные свойства случайных величин могут быть описаны более просто с помощью определенных числовых параметров. Наибольшую роль среди них на практике играют два параметра, характеризующие центр рассеяния (центр распределения) случайной величины и степень ее рассеяния вокруг этого центра. Наиболее распространенной характеристикой центра распределения является математическое ожидание mу случайной величины (генеральное среднее значение):
(1.6)
Степень рассеяния случайной величины относительно mу характеризуется генеральной дисперсией sу2
(1.7)
Если f(y) все в большей степени концентрируется вблизи my, то значения sу2 уменьшаются. Если же имеются весьма удаленнее от my значения случайной величины Y , то sу2 увеличивается.
- среднее квадратическое отклонение.
Bce описанные характеристики и связанные с ними параметры являются теоретическими и в общем случае неизвестны. Встает задача экспериментального определения характеристик случайных величин на основе наблюдений.
1.2. Элементарные статистические процедуры
Статистическое оценивание параметров распределения
При решении многих прикладных задач необходимые вероятностные характеристики случайных величин неизвестны исследователю и добываются экспериментально. Такое статистическое описание результатов наблюдений составляет содержание математической статистики.
Фундаментальным понятием статистической теории являются понятия генеральной совокупности и выборки.
Генеральная совокупность обычно интерпретируется как совокупность всех мыслимых результатов наблюдений над случайной величиной, которые в принципе могут быть проведены в данных условиях.
Для определения свойств ГС исследуется некоторая ее часть, называемая выборкой, т. е. это конечный набор значений случайной величины. Число элементов выборки назевается ее объемом. Если, например, y1 , y2,….., yn - наблюдаемые значения случайной величины Y, то объем данной выборки равен N.
Смысл статистических методов заключается в том, чтобы по выборке ограниченного объема N высказать, обоснованное суждение о свойствах ГС в целом. Подобное суждение может быть получено оцениванием параметров (характеристик) ГС с помощью некоторых подходящих функций от результатов наблюдений - оценок.
При многократном извлечении выборок одного и того же объема и последующем нахождении множества оценок одного и того же параметра подучаются различные числовые значения этих оценок. Т. е. любая оценка произвольного параметра Q есть случайная величина. В этом ее принципиальное отличие от самого оцениваемого параметра Q, являющегося неслучайным. Чтобы подчеркнуть указанное существенное обстоятельство для параметров генеральной совокупности и их оценок, вводятся различные обозначения. В общем случае оценка произвольного параметра обозначается через
. Оценка математического ожидания my чаше обозначается через
, оценка дисперсии s2y через S2y,
Для оценивания одного и того же параметра ГС можно использовать различные оценки. Чтобы выбрать наилучшие из них необходимо сформулировать некоторые требования к свойствам оценок, желательные с точки зрений практики.
Оценка
параметра Q называется состоятельной, если при неограниченном увеличении объема выборки N значение
с полной мерой достоверности (с вероятностью единица) стремится к теоретическому значению Q. Т. е. при Nൠматематическое ожидание оценки стремится к оцениваемому параметру, а ее дисперсия к нулю.
Оценка
называется несмещенной, если m
для любого N. Несмещенность означает отсутствие систематической погрешности яри оценивании параметра Q.
Оценка
называется эффективной если среди оценок параметра Q она обладает наименьшей дисперсией s2
, т. е. оценка имеет min случайную ошибку и в этом смысле является наиболее точной.
Точечные оценки математического ожидания и дисперсии
Точечные оценки – это оценки некоторых неизвестных числовых параметров распределения. Они представляют собой числа, полученные путем подстановки выборочных значений y1,y2,…..,yN в формулу для оценивания искомого параметра. Математическое ожидание и дисперсию обычно оценивают
(1.8)
(1.9)
Указанные оценки являются состоятельными и несмещенными. Несмещенность оценки S2y достигается использованием в знаменателе величины fQ=N-1 вместо очевидного на первый взгляд значения N . Величину fQ называют числом степеней свободы.
Оценку S2y часто называет средним квадратом отклонений опытных значений yi oт среднего
. В математической статистике он определяется как отношение некоторой суммы квадратов отклонений Q к числу степеней свободы этой суммы fQ
(1.10)
Число степеней свободы fQ равно числу независимых слагаемых в сумме квадратов. Так в формуле S2y имеется N слагаемых (yi-
) , но в силу вычисления среднего наложена одна связь
Поэтому число независимых слагаемых (N-1) и эта величина является числом степеней свободы fQ , (fQ – равна разности между числом имеющихся экспериментальных значений N по которым вычисляют оценку дисперсии, и количеством дополнительных параметров, входящих в формулу для оценки этой дисперсии и вычисляемых в виде линейных комбинаций тех же самых наблюдений (в данном случае это всего один параметр
).
Вычисления по формуле (1.9) трудоемки и при малых значениях разностей (yi-
) могут порождать большие ошибки. Поэтому вместо выражения (1.9), играющего роль определяющего понятия, пользуются тождественными соотношениями:
Здесь основные преобразования:

Сумма всех отклонений от среднеарифметического равна нулю.
Интервальные оценки математического ожидания и дисперсии.
Точечные оценки параметров не дают информации о степени близости оценки
к соответствующему теоретическому параметру Q. Поэтому более информативный способ оценивания неизвестных параметров состоит не в определении единичного точечного значения, а в построении интервала, в котором с заданной степенью достоверности окажется оцениваемый параметр, т. е. в построении так называемой интервальной оценки.
Интервальной оценкой параметра Q называется интервал, границы которого
являются функциями выборочных значений y1,y2,…..,yN и который с заданной вероятностью p накрывает оцениваемый параметр Q
(1.12)
Интервал (
) называется доверительным, его границы
изъявляющиеся случайными величинами, соответственно нижним и верхним доверительными интервалами, а вероятность р – доверительной вероятностью, а величина a=1-р уровнем значимости, используемым при построении доверительного интервала и при проверке различных гипотез.
Проверка статистических гипотез
Статистическая гипотеза есть некоторое предположение относительно свойств генеральной совокупности, из которой извлекается выборка.
Критерий статистической гипотезы – это правило позволяющее принять или отвергнуть данную гипотезу на основании выборки. При построении такого правила используются определение функции результатов наблюдений g(y1,y2,…..,yN) называемые статистиками для проверки гипотез. Все возможные значения подобных статистик делятся на две части: область принятия гипотезы и критическая область. Проверка гипотезы сводится к выяснению того, попадает или нет конкретное значение статистики, вычисленное по выборке, в критическую область: если нет – гипотеза принимается, как не противоречащая результатам наблюдения, если да – гипотеза отвергается. При этом всегда возможно совершить ошибку, различные типы которых показаны в таблице:
Гипотеза | Объективно верна | Объективно неверна |
Принимается | Правильное решение | Ошибка рода |
Отвергается | Ошибка рода | Правильное решение |
Вероятность совершить ошибку I рода называется уровнем значимости критерия и обозначается a. Обычно уровень значимости выбирается 0,01; 0,1 и наиболее часто 0,05.
Критерии значимости – это критерии, с помощью которых проверяют гипотезы об абсолютных значениях или о соотношениях между ними для генеральных совокупностей с известной функцией распределения.
Для пояснения идеи построения критериев значимости предположим, что некоторая оценка
(mx,sx и т. д.), используемая затем в качестве статистики, вычислена по выборке объема N. Пусть имеется причина считать, что истинное значение оцениваемого параметра Q в генеральной совокупности равно Qо. Это проверяемое предположение называется нулевой гипотезой H0 и пишут H0: Q=Q0
Если, даже нулевая гипотеза справедлива, то выборочное значение
обычно не совпадает с Q0 , поскольку оно является одним из конкретных значений случайной величины
, порожденной всевозможными выборками объема N . Спрашивается: насколько сильно
должно отличаться от Q0 , чтобы в достаточной мере обоснованно можно было бы отвергнуть нулевую гипотезу? Если известна функция плотности вероятности оценки f(
), построенная теоретически в предположении справедливости нулевой гипотезы, то с ее помощью несложно найти такую зону, вероятность случайного попадания в которую (когда Но верна) мала (равна малому значению q). Эта зона и может использоваться в качестве критической.
Вид критической области полностью определяется характером альтернативной гипотезы Hi , т. е. гипотезы, противопоставляемой нулевой, той гипотезы, в пользу которой склоняется исследователь, отвергая проверяемую гипотезу. Если нулевой гипотезе Н0: Q=Q0 противопоставлена альтернативная гипотеза Н1: Q¹Q0, то критерии для проверки Н0 будет двухсторонний.
Мы будем пользоваться t – критерием, F,
и т. д. и заданный критерий значимости a будем находить по таблицам в зависимости от степеней свободы.
2. ПОЛНЫЙ И ДРОБНЫЙ ФАКТОРНЫЕ ЭКСПЕРИМЕНТЫ
2.1. Введение в математическую теорию эксперимента
Математическая теория планирования эксперимента – пример системного подхода в изучении сложных систем.
В настоящее время при изучении сложных технических объектов широко применяется системный подход, исходные предпосылки которого заключаются в стремлении с максимальной полнотой учесть все входные и выходные характеристики объекта и в проблемно-ориентированной организации исследования.
Наиболее разработанными и эффективными методами практической реализации системного подхода являются, методы математической теории эксперимента или планирования эксперимента, представляющие собой развитие идей многофакторного анализа. Эти методы в короткий срок получили широкое применение в большинстве областей исследования – в химии, металлургий, промышленности строительных материалов, медицине, биологии, электронике, автоматике, вычислительной технике и др. областях, благодаря своей универсальности и существенному повышению эффективности исследований.
Хотя математические методы планирования наиболее эффективно работают при исследовании физических объектов путем постановки опытов с этими объектами в реальных условиях их работе, планирование эксперимента, если под экспериментом иметь в виду любое действие с системой или ее моделью, позволяет существенно поднять эффективность решений на математических моделях, набранных на АВМ и ЦВМ, как в линейной, так и нелинейной постановке задач. И в этом плане применение математической теории эксперимента при моделировании задач на вычислительных машинах дозволяет поднять производительность научного труда на всех стадиях исследования, разработки и проектирования сложных систем.
Математические методы планирования эксперимента основаны на кибернетическом представлении об объеме исследования. В этом случае наиболее подходящей моделью исследуемого объекта являются кибернетическая система, называемая «черным ящиком» и изображенная на рис 2.1.

Рис. 2.1. Схема кибернетической системы
При рассмотрении такой кибернетической системы различают входы – независимые переменные (управляемые факторы) х1,х2,х3,…,хк, соответствующие состоянию системы или воздействиям на систему и выходы (параметры процесса или численные характеристики целей исследования) – параметры (критерии) оптимизации h1,h2,h3,….,hв.
Каждый фактор может принимать одно из нескольких значений, называемых уровнями. Фиксированный набор уровней факторов определяет одно из возможных состояний кибернетической системы.
Каждому сочетанию фиксированных значений факторов в многомерном факторном пространстве соответствует определенная точка (см. рис.2.2., точка "О") и определенная реакция (отклик) системы. Между уровнями факторов и реакцией системы существует вполне определенная связь, которая характеризуется так
hв = ¦(χ1, χ 2, χ 3,……, χ к), l = 1,2,3,….,m. (2.1)
Геометрический образ соответствующей функции отклика, называют поверхностью отклика (рис. 2.2.)
Рис. 2.2. Факторное пространство и поверхность
Знание функции отклика равносильно знанию оптимизирующего процесса. Однако, исследователю в общем случае заранее не известен вид функции. Поэтому для описания поверхности отклика используют разложение этой функции в степенной ряд, т. е. представляют функцию отклика в виде полинома (этo один из наиболее удобных и разработанных способов ее представления) степени от «К» переменных
(2.2)
где b0, bi, bij,…, bijq – коэффициенты регрессии, значения которых определяют форму поверхности отклика в изучаемой области. Такое уравнение обычно называют уравнением регрессии.
Таким образом, задача отыскания функции отклика может быть сведена к получение эксперимента по данным функции отклика (выборочной оценки для h) в виде:
(2.3)
Здесь b0,bi,bij,…,bijq - является оценками для теоретических коэффициентов регрессии.
Функцию отклика y назовем математической моделью системы.
Основная задача планирования эксперимента заключается в такой постановке эксперимента, чтобы при минимальном количестве опытов, варьируя значения независимых переменных по специально сформулированным правилам, построить математическую модель системы и найти оптимальные значения свойств системы.
Отметим основные возможности, которые дает исследователям теория эксперимента.
1. Прежде всего, математическая статистика ввела в теорию эксперимента концепцию «случая», заставив исследователя искусственно создать случайную ситуацию в эксперименте. Программу эксперимента стали составлять специалисты по математической статистике так, чтобы рандомизировать (т. е. сделать случайными) систематически действующие факторы, которые трудно поддаются учету или контролю с тем, чтобы можно было рассмотреть их как случайные величины и, следовательно, учитывать статистически. Рандомизация условий проведения эксперимента стала одной из основных предпосылок в концепции планирования эксперимента. Полная рандомизация не всегда возможна, что привело к необходимости создания особо рандомизированных экспериментальных планов с ограничением на рандомизацию (неполноблочные сбалансированные планы, латинские, греко-латинские квадраты, кубы и т. д.).
2. Планирование эксперимента позволяет резко повысить эффективность эксперимента за счет оптимального использования пространства независимых переменных. Это означает, что параметры, интересующие исследователя, могут быть определены со значительно меньшей ошибкой, чем при традиционных методах исследования. Разработана концепция многофакторного исследования, когда в эксперименте варьируются все факторы сразу. В силу известного свойства многомерного пространства при этом растет радиус обследуемой области, происходит повышение точности многофакторного исследования.
3. Планирование эксперимента позволяет построить стратегию исследования, основанную на последовательности частных, логически осмысленных, операций. При этом развивается стратегия последовательного эксперимента, когда исследователь отказывается от попытки заранее задать строго фиксированную схему проведения эксперимента. Принимаемая им стратегия предусматривает возможность принятия решений в зависимости от результатов, полученных на отдельных этапах исследования. Трудно переоценить выигрыш, который обеспечивается логически упорядоченной стратегией, особенно при решении экспериментальных задач (поиск оптимальных условий протекания процесса).
4. В планировании эксперимента разработана концепция редукции (свертки) полученной информации, результатов исследования. После того, как эксперимент поставлен и получены результаты, возникает еще одна задача – представить эти результаты в компактной форме, удобной для опубликования, хранения и сопоставления с другими данными. Результат каждого эксперимента всегда несвободен от некоторого элемента неопределенности. Раньше исследователь пытался дать представление о достоверности своих результатов путей пространного описания условий проведения эксперимента. Теперь достоверность полученных результатов оценивается числом, подученным путем статистического анализа результатов наблюдений. В планировании эксперимента оценки параметров и установление доверительных границ для них производится некоторым стандартным образом. И, наконец, математическая теория эксперимента позволяет получить сопоставимые результаты исследований, проведенных не только в различных организациях, но в различных странах.
2.2 Факторы, параметры оптимизации и модели.
Выбор факторов, параметров оптимизации и моделей осуществляется с учетом цели исследований и имеющихся условий для проведения эксперимента.
Факторами называются переменные величины, принимающие в некоторый момент времени определенное значение и соответствующие способам воздействия на объект. Они определяют как сам объект, так и его состояние.
Факторы могут быть количественными и качественными. Количественными факторами являются переменные величины, которые можно оценить количественно. Качественные факторы, если это нужно экспериментатору, всегда можно сделать количественными, построив условную порядковую шкалу для кодирования уровня качества числами натурального ряда. Наиболее простой пример такого кодирования: оценка качества по пятибалльной системе.
Основные требования к факторам: факторы должны быть управляемы и однозначны, они должны непосредственно воздействовать на объект, исследования, не должны быть коррелируемыми, а совокупность факторов должна быть совместимой.
Под управляемостью фактора подразумевается возможность установки и поддержания выбранного уровня фактора постоянным в течение всего опыта или его изменения по заданному плану.
Требование непосредственного воздействия на объект имеет большое значение в связи с тем, что трудно управлять фактором, если он является функцией других переменных. Факторы нужно определить операционно, т. е. должен быть известен способ придания фактору любого возможного значения.
Некоррелируемость факторов означает, что каждый фактор можно устанавливать на любой уровень независимо друг от друга. Последнее обстоятельство не означает, что между факторами не существует никакой связи. Достаточно, чтобы связь между ними не была линейной.
Требование совместимости всей совокупности факторов означает, что комбинации значений факторов должны быть осуществимы.
Не менее важной, чем определение факторов, является задача выбора параметра оптимизации, которая определяется целью исследований. Цель исследований должна быть сформулирована очень четко и допускать количественную оценку. К параметру оптимизации предъявляется ряд требований. Это эффективность с точки зрения достижения цели, универсальность, количественное выражение одним числом, статистическая эффективность, физический смысл, простота и достоверность вычисления, существование для всех различных состояний системы.
Главным, определяющим корректность постановки задачи, является требование эффективности с точки зрения достижения цели. Параметр оптимизации должен оценивать выход системы в целом, а не отдельных ее подсистем.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 |



