Ячейка Формула
I3 =МЕДИАНА(G6:H6), скопируйте ее для всего столбца
С6 =CP3HAЧ(A2:F4)
Выделите диапазон J3: J 7
J3 =ЧACTOTA(A3:F5; I3: I5)
К3 = I 3* J3
J8 =СУММ(J3: J7)
К8 =CУMM(К3: К8)
С9 = К8/ J8
ДИСПЕРСИЯ
Часто в жизни приходится обрабатывать данные наблюдений. Причем наблюдать можно что угодно. Например, каждый день вы ходите в школу и обратно. Сколько шагов вы делаете, преодолевая это расстояние? Если в течение нескольких дней вы из любопытства проведете подсчеты, то наверняка у вас получатся близкие друг к другу, но всё же разные числа. Никому, конечно, и в голову не придет, что меняется расстояние между школой и домом. Ясно, что на количество шагов влияют различные внешние факторы: скажем, в школу вы шли быстро, чтобы не опоздать, и ваш шаг был шире, а по дороге домой вы шли не спеша, с одноклассницей, и ваш шаг был короче. Можно сказать, что количество шагов от дома до школы — величина случайная.
Проведя 20 наблюдений, вы получите 20 значений случайной величины.
Пусть при таком измерении некий школьник Иванов получил следующую последовательность чисел:
372, 376, 374, 375, 373, 3, 374, 377, 375, 376, 373, 375, 374, 373, 3, 373, 374, 376.
Их удобнее расположить в виде линейной таблицы. Какое же количество шагов естественно взять в качестве расстояния от школы до дома? Каждому ясно — среднее арифметическое. В данном случае это 374.
Выясним, какие значения получил Иванов. Пусть это набор чисел от А до В. У другого ученика, естественно, будет другой набор, но тоже в каком-то промежутке. Возьмем данные, полученные четырьмя учениками и занесем их в таблицу.
Это будет двумерный массив размером 4 х 20 (у каждого из 4 учеников 20 наблюдений). Распечатаем полученную таблицу и найдем среднее арифметическое для каждой строки.
Конечно, среднее арифметическое уберегает нас от ошибочных выводов. Но как же достаточно точно определить расстояние, проведя то или иное количество наблюдений?
Математики для этой цели ввели специальную величину и назвали ее дисперсией (от лат. dispersio — рассеяние, т. е. разброс данных). Обозначим значения случайной величины через А,, А2, AN, а среднее арифметическое этих значений — через М.
Дисперсия — это среднее арифметическое квадратов разностей между значениями случайной величины и ее средним значением. В наших обозначениях:
D= ((A1-M)2+(A2-M)2+…(AN-M)2)/N
Из этой формулы видно, что чем меньше дисперсия, тем меньше отличаются результаты наблюдении от своего среднего значения и тем ближе среднее значение к истинному. В частности, если дисперсия равна нулю, то все числа А. совпадают между собой (и со своим средним значением).
Вновь вернемся к наблюдениям Иванова.
Конечно, среднее значение (374) числа шагов от дома до школы характеризует не только расстояние, но и длину человеческого шага: у разных людей длина шага разная. Куда больше можно узнать о человеке, его характере, темпераменте и некоторых наклонностях, имея всю последовательность наблюдений.
Например, рассматривая приведенную выше последовательность, можно предположить, что значение 364 получилось в тот день, когда Иванов опаздывал в школу. Вообще же характер у него довольно ровный, темперамент скорее флегматичный — лишь один раз (получив, наверное, двойку) он шел заметно медленнее, чем обычно, сделав 380 шагов. Подумайте, что еще можно сказать об Иванове.
Допустим, что Иванов сагитировал нескольких своих товарищей провести тот же эксперимент. Через 10 дней каждый из них, в том числе и Иванов, представили по 20 результатов наблюдений, не указав своих фамилий.
Можно ли узнать, какие из результатов принадлежат Иванову, а какие нет? Да, можно.
Математики установили, что для этого, как правило, достаточно сравнить дисперсии и средние значения.
Дисперсия и среднее значение так же индивидуальны, как отпечатки пальцев.
Если наблюдения делал один и тот же человек, то дисперсии и средние значения во всех этих наблюдениях будут близки, если разные люди, то далеки. Осталось выяснить: какие значения считать близкими, а какие далекими.
На этот вопрос ответ дает специальный раздел математики — статистика. Оказывается, достоверность ответа зависит от числа наблюдений. Если число наблюдений от 25 до 50, то дисперсии можно считать далекими, когда отношение большей дисперсии к меньшей больше 2. Чтобы говорить о близости средних значений двух последовательностей результатов, надо найти модуль разности средних и разделить его на квадратный корень из суммы дисперсий. Если полученное число больше 0,6, то средние значения считаются далекими. В том случае, когда близки и дисперсии, и средние значения, можно сделать вывод, что наблюдения почти наверняка проводились одним и тем же человеком.
У любознательных учеников возникает вопрос: откуда эти числа (2 и 0,6) взялись? Отвечаем: из специальных таблиц, которые были составлены математиками. Их можно найти в любом справочнике по математической статистике.
Метод сравнения средних значений и дисперсий используется в самых разных отраслях человеческой деятельности. В медицине — для установления диагноза, в литературоведении — для определения автора произведения (когда авторство является спорным), в криминалистике — для розыска преступников.
Практическая работа в электронных таблицах Excel
Задача 1
Составьте математическую модель, алгоритм и программу решения следующей задачи.
Известны данные о продолжительности горения (в часах) электрических ламп, изготовленных на двух заводах.
Лампы 1-го завода: 1600, 1510, 1610, 1650, 1530, 1688, 1570, 1600, 1700, 1720, 1680, 1800, 1780, 1690, 1710, Г530, 1720, 1750, 1810,
Лампы 2-го завода: 1580, 1460, 1640, 1550, 1600, 1620, 1780, 1640, 1750, 1820, 1860, 1740, 1750, 1730, 1590, 1610, 1700, J580, 1670.
Можно ли утверждать, что на заводах поддерживаются одинаковые технологические условия производства?
Для решения задачи введите формулы в расчетные ячейки:
Ячейка Формула
A25 =СРЗНАЧ(A6:A24)
B26 =СРЗНАЧ(B6:B24)
A26 =ДИСПР(A6:A24)
B26 =ДИСПР(B6:B24)
A27 =ЕСЛИ(A26/B26>1;A26/B26;B26/A26)
A29 =ABS(B25 - A25)/КОРЕНЬ(B26+A26
А | В | С | |
1 | ЗАДАЧА. Практическая работа. | ||
2 | Известны данные о продолжительности горения электрических ламп, изготовленных на двух заводах. Можно ли утверждать, что на заводах поддерживаются одинаковые технологические условия производства? | ||
3 | |||
4 | |||
5 | 1 завод | 2 завод | |
6 | 1600 | 1580 | Продолжительность горения электрических ламп |
7 | 1510 | 1460 | |
8 | 1610 | 1640 | |
9 | 1650 | 1550 | |
10 | 1530 | 1600 | |
11 | 1688 | 1620 | |
12 | 1570 | 1780 | |
13 | 1600 | 1640 | |
14 | 1700 | 1750 | |
15 | 1720 | 1820 | |
16 | 1680 | 1860 | |
17 | 1800 | 1740 | |
18 | 1780 | 1750 | |
19 | 1690 | 1730 | |
20 | 1710 | 1590 | |
21 | 1630 | 1610 | |
22 | 1720 | 1700 | |
23 | 1750 | 1580 | |
1810 | 1670 | ||
1670,947368 | 1666,842105 | Среднее значение | |
7047,734072 | 9821,606648 | Дисперсия | |
1, | Отношение дисперсий | ||
дисперсии близки | |||
0, | Отношение средних | ||
средние близки |
Вывод: Можно утверждать, что на заводах поддерживаются одинаковые технологические условия.
Задача2.
Органами милиции задержан грузовик с помидорами, похищенными на овощной базе. В городе всего четыре базы, каждая из них получает помидоры из своего сельскохозяйственного района. Определите, с какой базы были вывезены помидоры. Расследование осложняется тем, что помидоры на всех базах одного сорта.
Решение.
Воспользуемся методом сравнения средних значений и дисперсий.
В каждом сельскохозяйственном районе свои условия произрастания помидоров, поэтому помидоры разных районов отличаются, например, удельным весом (диаметром, весом и др.). Выберем по 20—25 помидоров (реально, конечно, больше) на каждой овощной базе и из грузовика. У нас получится 5 последовательностей — по одной для каждой базы (всего 4) и еще одна для грузовика, с которой мы и будем сравнивать первые четыре. Это наши исходные данные. Результатом является номер овощной базы, где совершено хищение.
Чтобы добиться результата, нужно, как уже сказано выше, вычислить средние значения и дисперсии всех пяти последовательностей и провести сравнение.
Пусть вес одного помидора на соответствующих базах и в грузовике изменяется в следующих пределах (в г): 1-я база: (70, 100); 2-я база: (80, 90); 3-я база: (75, 95); 4-я база: (90, 120); грузовик: (80, 90).
Технология работы.
Запустите табличный процессор Excel.
Заполните таблицу в соответствии с образцом:
A | B | C | D | E | F | |
1 | 1 база | 2 база | 3 база | 4 база | Грузовик | |
2 | Вес помидоров | Формула 1 | Формула 2 | Формула 3 | Формула 4 | Формула 5 |
3 | Копирование вниз | Копирование вниз | Копирование вниз | Копирование вниз | Копирование вниз | |
… | ||||||
31 | ||||||
32 | Средние значения | Формула 6 | Копирование вправо | Копирование вправо | Копирование вправо | Копирование вправо |
33 | Дисперсия | Формула 7 | Копирование вправо | Копирование вправо | Копирование вправо | Копирование вправо |
34 | Промежуточ-ные вычисления | Формула 8 | Копирование вправо | Копирование вправо | Копирование вправо | Копирование вправо |
35 | Формула 9 | Копирование вправо | Копирование вправо | Копирование вправо | Копирование вправо | |
36 | Близость дисперсий | Формула 10 | Копирование вправо | Копирование вправо | Копирование вправо | Копирование вправо |
37 | Близость средних значений | Формула 11 | Копирование вправо | Копирование вправо | Копирование вправо | Копирование вправо |
38 | Вывод |
В2 =СЛЧИС()*(100—70)+70 (1)
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 |


