Российский государственный университет нефти и газа

им.

Кафедра «Стандартизации, сертификации и управления

качеством производства нефтегазового оборудования»

МЕТОДИЧЕСКИЕ УКАЗАНИЯ

к проведению практических занятий и выполнению самостоятельных расчетных заданий по дисциплине «Планирование и организация эксперимента»

Для бакалавров направления подготовки 27.03.01 «Стандартизация и метрология», профиля подготовки «Стандартизация и сертификация в нефтяной и газовой промышленности»

Москва

2015

Методические указания к проведению практических занятий и выполнению расчетных заданий по дисциплине «Планирование и организация эксперимента».

В процессе обучения со студентами по дисциплине «Планирование и организация эксперимента» проводятся практические занятия П1-П8, представленные в рабочей программе данного УМКД. При их выполнении для иллюстрации рассматриваемых расчетных методик используются демонстрационные примеры, имеющиеся в статистическом пакете «Stadia» проводятся расчетные задания, представляемые преподавателем.

Практическое занятие №1.

«Первичный статистический анализ экспериментальных данных» (проверка гипотез о виде распределения данных, оценка их параметров, сравнение выборок по значениям таких параметров, определение необходимого объёма выборки).

Содержание занятий – разбор назначения и содержание первичного статистического анализа.

Первичный статистический анализ данных включает свертку полученной информации – выявление вида распределения данных по интересующему показателю y, вычисление его основных параметров – среднего выборочного значения y и его изменчивости S2y, определение интервальной оценки показателя y в виде тройки чисел: y,  ∆ , Р, включая погрешность его определения  ∆  в долях или процентах от истинного среднего (математического ожидания µ) и доверительную вероятность Р{y-∆<µ<y+∆}=в, характеризующую частоту подтверждения впервые полученного результата в последующих повторных или ревизионных опытах. Уровень доверительной вероятности в выбирается различным для различных областей приложений (0,95 – для технических и экономических исследований, 0,99 – для медицинских, 0,999 – для специальных и оборонных исследований), соответственно, уровень значимости проверки гипотез

НЕ нашли? Не то? Что вы ищете?

б=1-Р=0,05;0,01;0,001). С этим уровнем протабулированы все используемые статистические критерии. В их числе ч2, D, W – критерии проверки соответствия экспериментального распределения выбранному теоретическому, t – критерий Стьюдента и F – критерий Фишера для проверки различия сравниваемых выборок по значениям средних y и изменчивости показателей S2y.

Освоение методики проверки гипотез о соответствии наблюдаемого распределения выбранному теоретическому и гипотез о наличии различий сравниваемых выборок по их среднему и изменчивости с помощью        ч 2, и D критерия и, соответственно, с помощью t и F критериев проводится на демонстрационных примерах пакета «Stadia» (модуль «параметрические критерии»).

Практическое занятие №2.

Методика проверки нормальности экспериментального распределения при малых выборках.

Содержание занятий – разбор практической методики использования W-критерия для проверки соответствия экспериментального распределения выбранному теоретическому при малых объёмах выборки наблюдений. Иллюстрация методики на примере анализа выборки объёма N=5.

Освоение методики предусматривает выполнение студентами расчётного задания по проверке нормальности распределения данных выборки из N=10 результатов со следующими базовыми значениями

22,9 ; 0,1 ; 1,1 ; 16,1 ; 13,6; 5,2 ; 8,3; 13,1 ; 11,1; 6,1

Первый по списку студент работает с этой выборкой. каждый следующий студент по списку формирует для анализа свою выборку, добавляя к каждому элементу базовой выборки 1,2, и т.., т. е. на единицу больше чем элементы выборки предыдущего студента.

Для проведения расчетов студентам заданы критическое значение W – критерия Wб(n)=W0,5(10)=0,938 и необходимые значения коэффициентов

a1=0,5739

a2=0,3291

a3=0,2141

a4=0,1224

a5=0,0399

Процедура расчета включает:

1)упорядочивание данных y исходной выборки  по их величине

2)вычисление суммы квадратов отклонений каждого результата  от их среднего ∑=∑ (yi – y)2

3)определение вспомогательного параметра b

4)вычисление расчетного значения W=b2/∑                и сравнения его с табличным W0,5(10)= 0,938.

Если расчетное значение W превышает табличное, то исходные данные соответствуют нормальному распределению.

В расчетном задании необходимо охарактеризовать достоинства W критерия по сравнению с традиционными ч 2 и D критериями.

       Практическое занятие №3.

Планирование необходимого объема выборки.

Для оценки выборочного среднего значения показателя y с имеющейся изменчивостью S2y при уровне задаваемой ошибки определения ∆ необходим объем выборки n=( tб(б)/∆)2S2y.        

Здесь                tб(f) -        табличное значения критерия Стьюдента для уровня значимости  б и числа степеней свободы f=n-1, с которым определена S2y Значение S2y  определяют по имеющемуся архиву данных или предварительной выборке из n’ элементов для получения оценки изменчивости показателя y. Если S2y  определена по выборке большого объёма, то в указанном выражении для расчёта n вместо значения  t – критерия используют квантиль нормального распределения Zб. В данном задании в качестве S2y каждый студент использует её оценку, полученную в его предыдущем задании П2. Величина задаваемой ошибки  ∆ для первого студента по списку группы  ∆=0,01 ; для каждого последующего она увеличивается на        0,005 и т. д. до ∆=0,1 для 20-го студента и ∆=0,2 ; 0,3 ; 0,4 ; 0,5 – для последующих студентов по списку.

       Практическое занятие №4.

Построение однофакторной статистической модели методом наименьших квадратов.

       Содержание занятий:

-разбор методики построения статистической модели методом наименьших квадратов (МНК), характеристика его достоинств по сравнению с методом наименьших модулей(МНМ)

-демонстрация расчётной процедуры построения модели по данным выборки из N=10 объектов, представленных в табл. 4.1 учебного пособия [1], в списке литературы в программе данного УМКД.

       Для освоения методики каждый студент выполняет расчётное задание по построению и анализу модели по выборке, сформированной из указанной выше базовой выборки путём добавления к значениям элементов столбца y своего номера по списку группы. Расчётное задание включает построение диаграммы рассеяния данных, по визуальному анализу которой делается вывод о наличии статистической связи между показателями y и x или её отсутствии.

       Далее вычисляют коэффициенты линейной модели

у=b0+bx, используя МНК и проводят её анализ. Анализ включает вычисление ошибок в определении коэффициентов модели, их доверительных интервалов и ошибки прогноза S2{y} по модели. Полученную зависимость y=f(x) и её доверительные границы отображают графически.

       Практическое занятие №5.

Построение и анализ многофакторных моделей планов 2к.

Содержание занятий:

-характеристика назначения и достоинств планов многофакторного эксперимента для построения моделей объектов и их оптимизации;

-демонстрация расчётной процедуры построения и анализа модели плана 23 по данным, представленным в табл. 5.2 учебного пособия [1]. Здесь первые 8 элементов столбца y соответствуют результатам опытов по плану 23, а элементы 9-12 представляют результаты y в исходном режиме для вычисления дисперсии воспроизводимости S2y  по четырём повторным опытам. Анализ полученной модели состоит в проверке значимости её коэффициентов и проверке адекватности (работоспособности) с помощью F-критерия Фишера.

Рассматриваемые планы 2к удобны также в задачах многофакторных испытаний для учета неуправляемого дрейфа выходного показателя y и возможных порядковых эффектов факторов. Например, в случае линейного дрейфа в матрице плана 2к не используют для варьирования исследуемыми факторами первые к столбцов, так как они входят в разложение дрейфа. Учет порядковых эффектов факторов осуществляют приравниванием различных порядков воздействия двух факторов уровнем столбца взаимодействий высшего порядка в указанной матрице плана 2к (см п. 8 данных методических указаний).

Освоение рассматриваемой методики предусматривает выполнение студентами расчётного задания по получению и анализу модели плана 23 с результатами опытов y, задаваемых преподавателем. Каждый студент использует значения y из столбца таблицы представленной в пособии [1], соответствующего номеру студента по списку группы.

Расчётное задание включает определение коэффициентов модели, ошибки в их определении S{b} доверительных интервалов коэффициентов ∆b=tб(f) S{b}, проверку значимости коэффициентов, чтобы исключить как незначимые те из них, модуль которых меньше доверительного интервала |b|< ∆b; проверку адекватности модели, включающую только значимые коэффициенты, используя F-критерий Фишера.

В случае значимости всех коэффициентов модели проверка её адекватности по F-критерию не проводится. Из неё исключают один или несколько членов с наименьшими коэффициентами и определяют ошибку аппроксимации, с которой полученная модель описывает исследуемую зависимость: д=max (|ŷ-y|/ y) 100%.

Заключительный этап анализа сводится к интерпретации коэффициентов полученной модели в кодированных переменных и последующей её записи в исходных физических значениях факторов.

Практическое занятие №6.

Построение статистических моделей с использованием ортогональных полиномов Чебышева.

Содержание занятий - разбор назначения и достоинств метода построения статистических моделей с помощью полиномов Чебышева.

Этот метод предусматривает описание исследуемой зависимости y=f(x) вместо обычного полинома в виде суммы степеней независимой переменной

y=b0+b1x+b2x2+b3x3+…

её представление в виде разложения по ортогональным полиномам Чебышева

y=б0+б1P1(x)+ б2P2(x)+ б3P3(x)+…,

где Pл(x) – полиномы Чебышева порядка л.

Благодаря ортогональности полиномов искомые МНК-коэффициенты модели вычисляют по простой формуле

бл=(∑yuPлu )/∑ Pлu2, используя таблицы целочисленных значений таких полиномов (представляемых преподавателем).

Построение и анализ получаемой модели сводится к последовательному вычислению её коэффициентов бл с проверкой их значимости по F-критерию Фишера. Увеличение порядка полиномов прекращают после получения двух последовательных его членов (чётного и нечётного порядков) с незначимыми коэффициентами бл, для которых

F=(SSл/fл)/( SSост/fост)<Fб(fл, fост),

где SSл=бл2∑ Pлu2 , SSост =∑( ŷu-yu)2=∑ yu2-∑ бл2∑ (Pлu2)

На заключительном этапе анализа переходят к обычной форме записи искомой модели, подставляя в неё известные выражения Pl(x) , как обычные полиномы степени л.

Методика демонстрируется на примере построения модели зависимости показателя y от фактора x на четырёх равноотстоящих уровнях по следующим данным, приведенным в таблице.


x

y

P1

P2

P3

1

15

12

-3

1

-1

2

20

13,6

-1

-1

3

3

25

27,2

1

-1

-3

4

30

28,4

3

1

1

С

2

1

10/3


В полученной модели

y=20,3 +3,14 P1(x) – 0,01 P2(x) – 1,22 P3(x)

следует подставить

P1(x)=с1 (x-x)/d=2((x-22,5)/5)

P2(x)= с2{ ((x-x)/d)2 – (m2-1)/12}

P3(x)= с3{ ((x-x)/d)3 – ((x-x)/d)( m2-7)/20}

Здесь сл – множители, обеспечивающие целочисленность значений полиномов Чебышева, m=4 – число уровней фактора, d=5 – интервал между уровнями.

Для выполнения расчётного задания из приведенного базового варианта данных образовано 4 блока значений у путём перестановки их в следующих порядках

1  4  3  2

2  1  4  3

3  2  1  4

4  3  2  1

Например, первый вариант второго блока соответствует следующим данным

x

y

1

15

28,4

2

20

12

3

25

13,6

4

30

27,2


В первом блоке первый по списку студент работает со значениями y первого столбца. Второй студент осуществляет перестановку местами значений y в первых двух опытах, т. е. из исходного порядка 12 в порядок 21, третий студент делает перестановку 13 –> 31, четвертый 14–>41, пятый 23–> 32, шестой 24 –> 42, седьмой 34 –> 43, получая семь вариантов, которые с оставшимися тремя последовательностями (блоками) образуют всего 10 вариантов. Аналогичным образом образуют ещё по шесть вариантов из каждого из 3х оставшихся блоков. В результате получаем всего 28 варианта индивидуальных заданий.

После получения модели в виде разложения по полиномам Чебышева переходят к записи исследуемой зависимости в виде обычного полинома.

Практическое занятие №7.

Многокритериальная оценка объектов и построение их интегрального показателя с использованием функции потерь качества(ФПК) и методом главных компонент.

Содержание занятий – разбор практической методики многокритериальной оценки объектов с помощью ФПК.

Современные объекты управления характеризуются наличием не одного, а комплекса показателей качества или эффективности их функционирования. В таких ситуациях желательно построить интегральный показатель (ИП) оценки объектов, пригодный для выбора наилучшего объекта и проведения его оптимизации. Один из способов построения таких ИП является использование функции потерь качества, характеризующей истинное качество продукции, проявляемое в процессе её эксплуатации и удобной для оценки эффективности и конкурентоспособности производств и их продукции в условиях рыночной экономики. Этот новый экономический показатель легко вычисляется в денежном выражении для производства любой продукции через изменчивость контролируемого показателя качества(ПК)  S2y в своих физических единицах

L=k S2y

Здесь k=Ld/(D/2)2, D - допуск на значения контролируемого ПК, S2y – его изменчивость, получаемая по выборке изделий, Ld-отпускная цена изделий производителя.

Вычисляя потери L для каждого индивидуального показателя y в своих физических единицах можно оценить суммарные потери в денежном выражении по всем таким индивидуальным показателям и использовать полученную сумму, как ИП для сравнения эффективности и конкурентоспособности производств.

Излагаемая методика использования ФПК демонстрируется на примере сравнения трёх производств однотипной продукции с одинаковым допуском на значение контролируемого ПК, но разным видом распределения продукции в этом допуске (нормальным, треугольным, равномерным) при наличии выборки из n=5 объектов с их значениями ПК.

Освоение методики студентами осуществляется через выполнение расчётного задания по сравнению трёх таких производств при наличии выборки из n=10 изделий.

Значения ПК в этой выборке используются те же, что и в приведенном ранее расчётном задании П2 для каждого студента по проверке  нормальности таких данных с помощью W-критерия.

Содержание расчётного задания включает:

Проверку используемой выборки данных на соответствие нормальному закону распределения Вычисление изменчивости показателя S2y для производства с нормальным распределением и величины допуска на значение ПК по правилу «три сигма»| D|=6 Sy Определение коэффициента k пересчета изменчивости S2y в денежные потери L Определение через величину вычисленного допуска значения показателя изменчивости S2y для производств с треугольным и равномерным распределениями. Расчёт величины потерь L для каждого из трёх производств и проверка контрольного соотношения потерь L3/L2/L1= 3.0/1.5/1.0

Заключительная часть работы должна содержать интерпретацию полученных результатов об эффективности сравниваемых производств  и её смысл.

Многомерное шкалирование на основе метода главных компонент при решении типовых задач многокритериального оценивания в нефтегазовой отрасли.

Метод ГК предусматривает переход от множества исходных индивидуальных показателей y, характеризующих объект к новым формальным показателям, являющихся линейными комбинациями исходных y:

ГК j= ∑aji yi  , j=1,2,3…

Эти ГК ортогональны друг другу и упорядочены по величине изменчивости исходных показателей y, которую они объясняют:

D{ГК1}> D{ГК2}>…

При этом первые 2-3 ГК могут объяснять более 60-90% указанной общей изменчивости. Таким образом, переход к ГК позволяет осуществить свертку многомерной информации о значениях исходных показателей у и представить ее в пространстве 2-3 новых переменных, удобном для визуального анализа исследуемой выборки объектов. Величина радиуса объекта в пространстве таких ГК можно трактовать как интегральный показатель оценки объектов и использовать его для выявления типологии объектов и их классификации.

Для понимания возможностей методики многомерного шкалирования на основе метода ГК студентам демонстрируется примеры ее использования при решении комплекса типовых практических задач в нефтегазовой отрасли:

Выявление по комплексу косвенных показателей наиболее перспективного для пробного бурения газоносного месторождения из ряда имеющихся. Профотбор операторов газоизмерительной станции по результатам их многокритериального тестирования (личностным и профессиональным качествам). Аттестация сотрудников одного из филиалов - по комплексу их деловых качеств.

При демонстрации решения указанных задач внимание студентов обращается на простоту использования метода ГК, освоение ими используемого формата входных данных пакета «Stadia» в виде матрицы (Nxn) для N объектов с n показателями. Наиболее важным при этом является интерпретация получаемых методом ГК результатов в соответствующем формате. Последний включает визуализацию проекции расположения объектов на плоскостях первых ГК, значения радиуса каждого объекта в пространстве этих ГК, веса исходных признаков в выражениях ГК.

Практическое занятие №9.

Построение статистических моделей по данным пассивного эксперимента, оценка их качества, процедура его улучшения.

       Цель занятий – освоение студентами навыков построения статистических моделей объектов по данным пассивного эксперимента с использованием отечественного программного пакета «Stadia» (модуль множественной линейной регрессии) на демонстрационных примерах, представленных в этом пакете. Студенты знакомятся с форматов входных данных в виде матрицы (Nхk) значений k входных переменных для N опытов и вектор – столбец (Nх1) значений выходного показателя; форматом выходных данных, включая значения коэффициентов, получаемой модели и результаты ее анализа (проверка значимости коэффициентов и оценка качества модели). Особое внимание обращается на интерпретацию получаемой модели и тот факт, что оценку ее качества необходимо проводить не только по коэффициенту множественной корреляции R2, но с обязательным сравнением дисперсии показателя y, обусловленной моделью с остаточной дисперсии, используя F – критерий Фишера. Для повышения качества модели целесообразно проводить предварительный анализ структуры исходных данных для выявления их однородных групп с помощью рассмотренного в П8 метода ГК. Модели, построенные по данным каждой такой группы, обладают лучшим качеством, чем модель, построенная по общей выборке исходных данных.

П Многофакторная оптимизация методом крутого восхождения (КВ) и симплексным методом оптимизации (СМО)

Цель занятий – освоение методики оптимизации объектов методом КВ на основе модели плана 23 , полученной ранее в расчетном задании П3. При этом осуществляется вычисление шагов движения по факторам методом КВ пропорционально величинам полученных коэффициентов с учетом их знаков при таких факторов. Каждый из студентов рассчитывает условия трёх первых шагов по траектории КВ с вычислением в каждом из таких 3х опытов значений выходного показателя у.

Для иллюстрации СМО в указанном примере осуществляют оптимизацию по двум из трех указанных факторов графически. При этом вычисляют значения у в вершинах исходного симплекса, и проводится их сравнение. Далее выявляют худшую вершину, находят ее зеркальное отображение – координаты точки в котором ставят новый опыт, образующий с двумя оставшимися опытами новый симплекс. Далее проводят сравнение значений у в вершинах нового симплекса, выявляют «худшую» из них по значению у и реализуют опыт являющийся зеркальным отображением отброшенного. Каждый студент реализует три последовательных шага процедуры СМО, вычисляя в каждой точке значения у по полученной ранее модели.

П Специальные задачи планирования эксперимента ( многофакторные испытания объектов, их робастное проектирование, построение полиномиальных аппроксимаций аналитических моделей)

Цель занятий – ознакомление студентов с постановкой задач указанных типов и методикой их решения с использованием многофакторных планов.

Для задач многофакторных испытаний, характеризующихся наличием неуправляемого дрейфа выходного показателя у и порядковых эффектов факторов рассмотрена методика использования планов 2к, обеспечивающих получение наиболее полной модели зависимости выходного показателя у от исследуемых факторов объекта с учетом как эффектов дрейфа так и порядковых эффектов факторов. Для учета например, линейного дрейфа в матрице плана 2к  не используются первые k столбцов, которые входят в разложение дрейфа и варьирование исследуемыми факторами х осуществляют по оставшимся столбцам. Учет порядковых эффектов достигается приравниванием различных порядков воздействий факторами уровням столбцов взаимодействий факторов высшего порядка в указанной матрице плана 2к.

Методика иллюстрируется на примере построения модели, учитывающей кроме влияния самих факторов и их взаимного влияния еще и эффектов линейного дрейфа выходного показателя у и порядковых эффектов факторов одновременно.

Методика робастного проектирования многофакторных систем состоит в исследовании их основных факторов (режимных и конструктивных параметров) по экономным планам неполного перебора вариантов и имитации действия дестабилизирующих факторов (возникающих после проектирования на этапах производства, хранения и эксплуатации продукции) также по экономным планам неполного перебора вариантов. Использование такого подхода рассмотрено в представленном в П1 на примере выбора оптимального варианта конструкции теплообменника минимизирующей его стоимость по Т-критерию Тагути.

Методика использования плана 2к  и планов второго порядка экономных по числу опытов демонстрируется на примерах получения полиномиальных аппроксимаций аналитических моделей конкретного производства. Такие аппроксимации удобны для разработки алгоритмов управления в АСУ ТП. Качество таких полиномиальных аппроксимаций определяется относительной погрешностью прогноза по ней значений показателя у в опытах плана д=max (|ŷ-y|/ y) 100%.

Контрольные вопросы по дисциплине «Планирование и организация эксперимента»:

Контроль №1- 4 вопроса с максимальной оценкой 4 балла каждый

Принципы многофакторного эксперимента и его достоинства. Классификация задач планирования экспериментов. Построение дробных планов 2k. Их анализ и назначение. Интерпретация коэффициентов взаимодействий в моделях планов 2k.

Контроль №2 – 2 вопроса с максимальной оценкой 4 балла каждый

Основные отличия метода «крутого восхождения» от симплексного метода оптимизации. Характеристика достоинств и недостатков симплексного метода оптимизации.

Контроль 3 - 2 вопроса с максимальной оценкой 4 балла каждый

Композиционные планы второго порядка, критерии их оптимальности, построение и анализ. Характеристика качества моделей, получаемых методом пассивного эксперимента, способы его оценки и улучшения.