ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

Государственное образовательное учреждение

высшего профессионального образования

«Алтайский государственный технический университет

имени »

Бийский технологический институт (филиал)

ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА И СТАТИСТИЧЕСКАЯ ОБРАБОТКА ОПЫТНЫХ ДАННЫХ В ПРОЦЕССАХ ОБРАБОТКИ МЕТАЛЛОВ ДАВЛЕНИЕМ

Методические рекомендации по выполнению лабораторных работ
для студентов специальности 170104 «Высокоэнергетические устройства автоматических систем»

Бийск 2007

УДК 621.77

Б 43

Беляев, эксперимента и статистическая обработка опытных данных в процессах обработки металлов давлением: методические рекомендации по выполнению лабораторных работ для студентов специальности 170104 «Высокоэнергетические устройства автоматических систем» / .

Алт. гос. тех. ун-т, БТИ. - Бийск.

Изд-во Алт. гос. тех. ун-та, 20с.

Представлены лабораторные работы по дисциплине «Основы НИР»; приведены сведения о методах планирования экспериментов и статистической обработки опытных данных; рассмотрены методики определения характеристик выборки данных, проведения дисперсионного и корреляционного анализа, планирования эксперимента; даны рекомендации по выбору статистических моделей.

Рассмотрены и одобрены

на заседании кафедры «Автоматические роторные линии».

Протокол № 49 от 01.01.2001 г.

Рецензент: доцент, к. т.н. (БТИ АлтГТУ, г. Бийск)

© БТИ , 2007

 
© БТИ АлтГТУ, 2007

ВВЕДЕНИЕ

При проектировании технологических процессов обработки металлов давлением (ОМД) одним из определяющих факторов является получение и корректное использование математической модели процесса. Ввиду сложности процессов ОМД во многих случаях используются статистические модели процессов, полученные на основе экспериментальных методов исследования, теории планирования эксперимента и статистической обработки данных. Статистические модели количественно описывают связи между параметрами и функцией и не выявляют качественных взаимосвязей.

НЕ нашли? Не то? Что вы ищете?

В настоящее время достаточно хорошо разработаны методы статистического моделирования, включающие планирование эксперимента, предварительную обработку опытных данных и их подготовку для последующего регрессионного анализа, оценку адекватности получаемой при регрессионном анализе статистической модели и др. Однако конкретизация этих методов применительно к процессам ОМД требует учета особенностей этих процессов.

К таким особенностям следует отнести относительно небольшое число повторений в каждом опыте, обычно не превышающее 5 ÷ 10. Это определяется материальными соображениями и трудностью проведения технологического эксперимента. Относительно малое число опытов не позволяет достоверно определить закон распределения выборки данных, что накладывает ряд ограничений на применяемые методы математической статистики. Кроме того, величина погрешности большинства задач ОМД составляет 15 ÷ 20 %, что связано с точностью задания основных характеристик металлов.

После того, как выбрана функциональная форма статистической модели, можно спланировать эксперимент для сбора опытных данных для определения параметров модели. Однако перед аппроксимацией опытных данных необходимо выяснить: достаточно ли близко распределение искомой случайной величины к нормальному закону, достаточно ли число повторных наблюдений, правильно ли выбраны независимые параметры и значимы ли они. На первые два вопроса можно ответить, определив характеристики выборки данных, а значимость параметров и их независимость выявляют соответственно с помощью дисперсионного и корреляционного анализов. Этому и посвящен комплекс лабораторных работ, представленный в методических рекомендациях.

2 ЛАБОРАТОРНАЯ РАБОТА № 1 (4 часа).
Определение характеристик выборки данных

1.1 Цель работы

Практическое овладение методикой определения выборки экспериментальных данных.

1.2 Содержание работы

Несовершенство измерительных приборов и органов чувств человека, а часто и природа самой измеряемой величины приводят к тому, что при любых измерениях результаты получаются с определенной точностью, т. е. эксперимент дает не истинное значение измеряемой величины, а лишь ее приближенное значение.

Точность измерения определяется близостью его результата к истинному значению измеряемой величины. Точность прибора определяется степенью приближения его показаний к истинному значению искомой величины (инструментальной погрешностью), а точность метода – физическим явлением, на котором он основан.

Ошибки (погрешности) измерений характеризуются отклонением результатов измерений от истинного значения измеряемой величины. Ошибки делят на грубые (промахи), систематические и случайные.

Грубые ошибки возникают вследствие нарушения основных условий измерения или в результате недосмотра экспериментатора. Внешним признаком результата, содержащего грубую ошибку, является его резкое отличие по величине от остальных результатов. На этом основаны некоторые критерии исключения грубых ошибок по их величине, однако самым надежным и эффективным способом браковки неверных результатов является браковка их непосредственно в процессе самих измерений.

Систематические ошибки остаются постоянными или закономерно изменяются при повторных измерениях одной и той же величины. Они появляются из-за неправильной регулировки приборов, неточности метода измерения, какого-либо упущения экспериментатора, использования для вычисления неточных данных (например, усредненных величин механических свойств металлов и сплавов, взятых из справочной литературы). Систематические ошибки возникают также при проведении сложных измерений. Экспериментатор может и не догадываться о них, хотя они могут быть очень большими. Поэтому в таких случаях нужно тщательно проанализировать методику измерений. Такие ошибки можно обнаружить, в частности, проведя измерения искомой величины другим методом. Совпадение результатов измерений обоими методами служит определенной гарантией отсутствия систематических погрешностей. При измерениях необходимо сделать все возможное, чтобы исключить систематические ошибки, так как они могут быть так велики, что сильно исказят результаты. Выявленные ошибки устраняют введением поправок.

Случайной ошибкой является составляющая погрешности измерения, которая изменяется случайным образом, т. е. это ошибка измерения, остающаяся после устранения всех выявленных систематических и грубых ошибок. Случайные ошибки вызываются большим числом как объективных, так и субъективных факторов, которые нельзя выделить и учесть в отдельности. Поскольку причины, приводящие к случайным ошибкам, не одинаковы, в каждом эксперименте и не могут быть учтены, исключить такие ошибки нельзя, можно лишь оценить их значение. С помощью методов теории вероятностей можно учесть их влияние на оценку истинного значения измеряемой величины со значительно меньшей ошибкой, чем ошибки отдельных измерений. Поэтому, когда случайная погрешность больше погрешности измерительного прибора, необходимо многократно повторять одно и то же измерение для уменьшения ее значения. Это позволяет минимизировать случайную погрешность и сделать ее сравнимой с погрешностью прибора. Если же случайная ошибка меньше погрешности прибора, то уменьшать ее не имеет смысла и достаточно одного измерения.

Подпись:Если измерения искомой величины y проведены много раз, то частоты появления zk того или иного значения уi можно представить в виде графика, имеющего вид ступенчатой кривой – гистограммы (рисунок 1.1). Для построения гистограммы весь диапазон наблюдаемых значений (ymin, ymax) разбивают на определенное количество равных интервалов Dу и подсчитывают, сколько отсчетов mk попало в k-й интервал. По оси абсцисс откладывают границы интервалов Dу, а по оси ординат соответствующие частоты появления zk, определяемые по формуле

,

(1.1)

где n – количество измерений, наблюдений (размер выборки).

С увеличением числа измерений (n → ∞) и уменьшением интервала (Dу → 0) гистограмма переходит в непрерывную кривую, характеризующую плотность распределения вероятности р(y) того, что величина уi окажется в интервале Dу. Функция р(уi) характерна тем, что произведение р(уi)dу есть вероятность оказаться отдельному, случайно выбранному значению измеряемой величины в интервале (уi, уi + dу). График плотности распределения вероятностей называется кривой распределения.

В общем случае эта вероятность может определяться различными законами распределений. В физических экспериментах ошибки измерений опытных величин чаще всего описываются нормальным законом распределения (законом Гаусса):

,

(1.2)

где m – математическое ожидание, являющееся наиболее вероятным значением случайной величины;

s2 – дисперсия генеральной совокупности.

Дисперсия является средним квадратом отклонения результатов измерений от их математического ожидания по всему распределению.

Генеральной совокупностью называют все множество возможных значений измерений уi или возможных значений погрешностей Dуi.

Широкое использование закона Гаусса в теории ошибок объясняется следующими причинами:

1) равные по абсолютному значению погрешности встречаются одинаково часто при большом числе измерений;

2) чем больше значение погрешности, тем реже оно встречается;

3) погрешности измерений принимают непрерывный ряд значений.

Однако на практике невозможно провести слишком много измерений, поэтому нельзя построить нормальное распределение, чтобы точно определить истинное значение. В этом случае хорошим приближением к истинному значению вместо математического ожидания m можно считать среднее арифметическое , а достаточно точной оценкой ошибки измерений вместо дисперсии генеральной совокупности – выборочную дисперсию , вытекающую из нормального закона распределения, но относящуюся к конечному числу измерений. Такое название величины объясняется тем, что из всего множества значений у, т. е. генеральной совокупности, выбирают (измеряют) лишь конечное число значений (равное n), называемых выборкой. Выборка характеризуется уже выборочным средним арифметическим значением и выборочной дисперсией.

В реальных технологических экспериментах размер выборки n редко превышает 5 ÷ 10 значений. Ее увеличение, как правило, связано с большими временными и материальными затратами. При таких размерах выборки широко применяемые методы определения вида функции плотности распределения вероятности р(y) недостаточно селективны, чтобы отличить нормальное распределение от какого-либо другого. В общем случае можно исходить из того, что погрешности обусловлены рядом независимых друг от друга причин и суммируются. Поэтому можно полагать, что ошибка распределена по нормальному закону. Такое предположение значительно упрощает оценки статистических характеристик.

Каждая выборка характеризуется совокупностью следующих статистических характеристик:

1. Среднее арифметическое:

.

(1.3)

2. Дисперсия смещенная:

.

(1.4)

3. Дисперсия несмещенная:

.

(1.5)

Несмещенная дисперсия S2 является наиболее вероятной степенью отклонения yi от среднего значения . Дисперсия называется несмещенной, если при любом размере выборки ее величина не изменяется.

4. Среднеквадратичное отклонение:

.

(1.6)

Поскольку мера рассеяния результатов отдельных измерений от среднего значения должна выражаться в тех же единицах, что и значения измеряемой величины, то вместо дисперсии используют среднеквадратичное отклонение. Оно является важнейшей характеристикой результатов измерений и остается постоянным при неизменности условий эксперимента. Среднеквадратичное отклонение на графике плотности распределения р(у) определяется расстоянием от оси симметрии до точек перегиба кривой.

5. Коэффициент асимметрии:

.

(1.7)

Коэффициент асимметрии А характеризует скошенность рассматриваемой функции плотности распределения вероятностей по сравнению с нормальным законом распределения. При А = 0 она симметрична, при А > 0 вытянут правый, а при А < 0 – левый участок спада кривой.

6. Коэффициент эксцесса:

.

(1.8)

Коэффициент эксцесса Е характеризует степень остроты пика рассматриваемой кривой по сравнению с кривой нормального распределения. Если Е > 0, то кривая рассматриваемой выборки имеет более острый пик, чем кривая нормального распределения, а при Е < 0 пик менее острый.

7. Коэффициенты оценки нормальности распределения:

;

(1.9)

.

(1.10)

Коэффициенты С1 и С2 служат для количественной оценки близости рассматриваемого распределения к нормальному. На практике (при n > 4) распределение можно считать нормальным, если выполнены неравенства │С1│ < 2 ÷ 3; │С2│ < 2 ÷ 3.

8. Доверительный интервал:

,

(1.11)

где размах u определяется соотношением

,

(1.12)

где t – коэффициент Стьюдента, определяемый в зависимости от доверительной вероятности р и числа степеней свободы f = n – 1. Значения коэффициента Стьюдента приведены в таблице А.1 Приложения А.

Под доверительной вероятностью понимается вероятность того, что истинное значение измеряемой величины попадает в данный доверительный интервал. Она характеризует достоверность или надежность измерения. Обычно в технологиях ОМД р = 0,95.

Число степеней свободы – это понятие, учитывающее связи, ограничивающие свободу изменения случайных величин. Это число определяется разностью между числом выполненных опытов и числом констант (средних, коэффициентов и пр.), подсчитанных по результатам тех же опытов.

Доверительный интервал служит для оценки области изменения параметра y, в которой с некоторой вероятностью р будет заключено истинное среднее. Можно интерпретировать его по-другому: если провести ряд наблюдений (опытов, измерений), то доля попавших в интервал измерений составит величину р.

9. Интервал необходимого числа опытов:

,

(1.13)

где d – допускаемый исследователем относительный размах ошибки опыта. В технологических экспериментах ОМД обычно принимается d = 0,10 ÷ 0,15.

Оценка необходимого числа опытов важна при постановке любого эксперимента. Часто априорно такую оценку сделать не представляется возможным и ее делают на основе n проведенных опытов. Так как опытные данные являются случайными величинами, то такая оценка должна носить интервальный характер: [nр] определяется доверительной вероятностью и допускаемой относительной ошибкой опыта. По формуле (1.13) нижняя граница интервала определяется со знаком «минус», а верхняя со знаком «плюс».

Можно считать, что число опытов достаточно, если n попадает в вычисленный интервал [nр].

1.3 Оборудование, технические средства, инструмент

Средства измерения: штангенциркуль, микрометр; партии полуфабрикатов, полученные обработкой давлением.

1.4 Порядок проведения работы

1. С помощью измерительного инструмента определить значение указанного преподавателем параметра для каждой заготовки из партии (выборки).

2. Рассчитать статистические характеристики исследуемой выборки по формулам (1.3)-(1.13).

3. Проанализировать выполненную работу, сделать выводы о близости полученного распределения к нормальному и определить достаточность числа опытов для обеспечения заданной погрешности.

4. Предоставить отчет, содержащий: цель, порядок выполнения работы, результаты и выводы по работе. При оформлении отчета необходимо руководствоваться правилами и требованиями, представленными в Приложении Б.

1.5 Контрольные вопросы

1. Перечислите основные статистические характеристики выборки.

2. С какой целью определяют интервал необходимого числа опытов?

3. Что показывает доверительный интервал?

4. Какими характеристиками можно оценивать близость закона распределения к нормальному?

3 ЛАБОРАТОРНАЯ РАБОТА № 2 (4 часа).
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

2.1 Цель работы

Закрепление, углубление и расширение знаний студентов о корреляционном анализе; практическое овладение методикой выявления корреляционных связей между исследуемыми факторами.

2.2 Содержание работы

Корреляционный анализ позволяет установить статистические связи (как правило, линейные) между параметрами модели и оказывает значительную помощь при оптимизации в ситуациях со многими параметрами. Суть корреляционного анализа заключается в определении коэффициентов парной корреляции между каждыми двумя параметрами (попарно) на основании имеющихся экспериментальных данных. При наличии высокой корреляции между параметрами любой из них можно исключить из рассмотрения, так как он не содержит какой-либо дополнительной информации об объекте исследования, кроме полученной с помощью другого параметра. Исключать нужно те параметры, которые труднее определять экспериментально или физический смысл которых менее ясен.

Количественно статистические связи между параметрами оценивают с помощью коэффициента парной корреляции r, который является мерой тесноты линейной связи между двумя случайными величинами. В общем случае его величина может меняться от минус 1 до 1. Если r равен 0, то связь либо вообще отсутствует, либо отлична от линейной. Если он равен минус 1 или 1, то связь идеально линейная. Знак коэффициента корреляции указывает на направление связи: увеличение одной из переменных при положительной корреляции влечет за собой увеличение, а при отрицательной – уменьшение другой.

Коэффициент корреляции между парой параметров хk и хm определяется по формуле:

,

(2.1)

где N – число опытов.

После расчета коэффициентов корреляции между всеми возможными парами параметров устанавливают статистическую значимость коэффициентов, а именно проверяют гипотезу об отличии вычисленного значения коэффициента от нуля (нуль-гипотезу). С этой целью по таблицам распределения коэффициентов корреляции при выбранном значении доверительной вероятности р (чаще всего в технологических задачах ОМД p = 0,95) и числе степеней свободы f = N – 2 находят критическое значение коэффициента корреляции rкр (таблица А.1 Приложения А). Линейная связь считается статистически значимой в случае, если

.

(2.2)

Выявленные с помощью корреляционного анализа линейные связи между параметрами графически интерпретируют в виде графа (рисунок 2.1), представляющего собой фигуру, состоящую из точек (вершин) и отрезков (ребер), соединяющих некоторые вершины. Вершинами графа являются исследуемые параметры, а ребра графа указывают на наличие статистически значимых линейных связей между параметрами. Так, из рисунка видно, что при оптимизации в качестве независимых можно использовать экспериментально определяемые параметры х4 и х2, а х1 и х3 можно рассчитывать через х2.

Следует отметить, что выявленные корреляционные связи часто не являются причинными, то есть параметры зависят не прямо друг от друга, а через какие-то другие неустановленные факторы. Кроме того, надежная интерпретация коэффициента корреляции возможна только в слу­чае нормального распределения исследуемых случайных величин.

Подпись: 

Рисунок 2.1 – Граф корреляционных связей

После установления статистически значимых корреляционных связей между парой параметров можно построить уравнение регрессии, позволяющее предсказывать один из параметров по другому. Если, например, предполагается предсказывать хk по значениям экспериментально определенного хm, то строят следующее уравнение линейной регрессии:

,

(2.3)

коэффициенты a0 и a1 которого находят из выражений

;

(2.4)

.

(2.5)

В качестве примера эффективного использования корреляционного анализа рассмотрим работу, в которой изучали литейные свойства сталей 25Л и 45Л. При каждой выплавке стали экспериментально определяли следующие параметры: жидкотекучесть Ж, объем Vур и высоту Нур усадочной раковины, усадочную микропористость М. Кроме того, значения последнего свойства оценивали расчетом (параметр Мр). По данным имевшихся выплавок согласно формуле (2.1) рассчитали коэффициенты корреляции между каждой парой параметров. Результаты расчетов сведены в таблицу 2.1.

Таблица 2.1 – Коэффициенты корреляции между параметрами
литейных свойств сталей 25Л и 45Л

Ж

Vур

Нур

М

Мр

Ж

1

– 0,81*

0,82*

0,36

0,70*

Vур

1

– 0,82*

– 0,46

– 0,94*

Нур

1

0,38

0,69*

М

1

0,49*

Мр

1

Анализ был проведен по 17-ти выплавкам (N = 17). Следовательно, f = 17 – 2 = 15 и при р = 0,95 критический коэффициент корреляции согласно таблице А.1 Приложения А равен 0,482. Определенные по условию (2.2) статистически значимые коэффициенты отмечены в таблице 2.1 звездочкой (*).

Подпись: 

Рисунок 2.2 – Граф корреляционных связей литейных свойств сталей 25Л и 45Л

Выявленные с помощью корреляционного анализа линейные связи между свойствами отображены в виде графа на рисунке 2.2. Анализ полученного графа показывает, что все литейные свойства статистически связаны между собой (правда, не во всех случаях прямыми связями). В результате можно выбрать в качестве параметра оптимизации расчетные значения микропористости Мр, а уже по этому параметру оценивать уровень всех остальных свойств.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7