Научно-практическая конференция «Первые шаги в науку»

ГУО «Гомельская Ирининская гимназия»

Задача о прогнозировании проходного балла

(секция информатика-математика)

Выполнила

, учащаяся 9 «Б» класса

Руководитель

,

учитель информатики

Гомель, 2017

Оглавление

Введение. 3

1. Понятие тренда. 4

2. Задача о прогнозировании проходного балла. 5

2.1. Решение задачи. 5

2.2. Анализ полученных трендов. 8

2.3. Расчет прогнозного значения. 9

2.4. Оценка точности полученного прогноза. 10

3. Проверка построенной модели. 12

Заключение. 16

Список использованных источников и литературы.. 18

Введение

Данная работа посвящена изучению возможности прогнозирования проходного балла, на основе имеющихся данных о проходных баллах прошлых лет.

Любого абитуриента волнует вопрос о формировании проходного балла на специальность, куда он планирует поступать. Если известна информация о проходных баллах на данную специальность за ряд предыдущих лет, как можно предварительно рассчитать величину проходного балла на будущий год?

Изучив материалы о возможностях прогнозирования различных явлений, я пришла к выводу, что данную задачу можно решить, с помощью трендов, на основе моделирования рядов динамики в табличном процессоре MS Excel.

Целью моей работы было создание модели для решения задачи о прогнозировании проходного балла, в табличном процессоре MS Excel, получение прогнозного значения и оценка точности, полученного прогноза.

Для достижения поставленной цели необходимо было решить следующие задачи:

НЕ нашли? Не то? Что вы ищете?

·  изучить технологию анализа и прогнозирования на основе трендов, с использованием табличного процессора MS Excel;

·  найти значения проходных баллов с 2010 по 2016 года;

·  создать компьютерную модель;

·  построить тренды и выполнить анализ;

·  получить прогнозное значение;

·  оценить точность полученного прогноза;

·  проверить качество построенной модели.

1.  Понятие тренда

Тренд – это основная тенденция изменения временного ряда.

Временной ряд – это последовательность упорядоченных во времени числовых показателей, характеризующих уровни состояния и изменения изучаемого явления.

Тренд служит для выявления тенденций развития процесса, представленного в виде диаграммы, и обеспечивает прогноз на заданный период.

В MS Excel предусмотрено несколько стандартных типов тренда: линейный, логарифмический, степенной, экспоненциальный, полиномиальный, скользящее среднее. Необходимые условия для построения тренда: период времени, за который изучается исследуемый процесс, должен быть достаточным для выявления закономерности; тренд в анализируемый период должен развиваться эволюционно; процесс, представленный диаграммой, должен обладать определенной инертностью. Тренд можно строить для диаграмм типа: линейчатый график, гистограмма, диаграмма с областями, XY-точечная диаграмма. При установлении наиболее подходящего типа регрессионной зависимости для описания процесса изменения показателей какой-либо величины используют показатель достоверности описания функции.

Тип трендовой линии считается установленным, если величина достоверности аппроксимации R2 =1. Если R2 < 0,6, то тип зависимости для описания процесса изменения показателя не подходит.

Если ни в одном из вариантов исследуемых типов трендов величина достоверности аппроксимации не равна единице, то выбирают тот тип, для которого величина достоверности аппроксимации максимальна.

2.  Задача о прогнозировании проходного балла

Постановка задачи: имеются значения проходных баллов на специальность «Программное обеспечение информационных технологий» ГГУ им. Ф.Скорины, в период с 2010 по 2016 года, необходимо рассчитать прогнозное значение величины проходного балла в 2017 году.

2.1.  Решение задачи

Для того чтобы построить прогноз развития какой-либо ситуации на практике необходимо знать закономерность изменения исследуемой величины.

У нас имеются две наблюдаемые величины x и y, х – года (период с 2010 по 2016), у – значения проходных баллов. Сначала нам необходимо выяснить какая из наиболее распространенных функциональных зависимостей подходит для описания процесса формирования величины проходного балла.

Для этого необходимо построить тренды и осуществить их анализ. Построим и проанализируем, как описывают процесс формирования проходного балла, линейная, логарифмическая, полиномиальная, степенная и экспоненциальная зависимости.

В MS Excel создадим таблицу:

Рис.1 Таблица с исходными данными

Для дальнейших вычислений в Excel, значения периодов представим их номерами, начиная с 1 по 7 (ячейки А12:А18).

На основе таблицы с исходными данными, построим точечную диаграмму.

Рис.2 Диаграмма по проходным баллам 2010-2016гг.

Построим линейный тренд для диаграммы:

Рис.3 Диаграмма по проходным баллам с линейным трендом

Аналогичным образом построим Логарифмический, Полиномиальный, Степенной и Экспоненциальный тренд для диаграммы по проходным баллам.

Получаем,

Рис.4 Диаграмма по проходным баллам с логарифмическим трендом

Рис.5 Диаграмма по проходным баллам с полиномиальным трендом

Рис.6 Диаграмма по проходным баллам со степенным трендом

Рис.7 Диаграмма по проходным баллам с экспоненциальным трендом

2.2.  Анализ полученных трендов

В Excel для анализа трендов автоматически выводится коэффициент детерминации (R2).

Получили следующие значения коэффициента детерминации (R2):

Название тренда

Значение R2

Линейный

0,6519

Логарифмический

0,4767

Полиномиальный

0,839

Степенной

0,4832

Экспоненциальный

0,6519

Коэффициент R2 показывает степень соответствия динамики формирования проходного балла и предложенной кривой тренда.

Наиболее приближенное к 1 значение имеет Полиномиальный тренд второго порядка.

Значит, для получения более точного прогноза необходимо выбрать уравнение полиномиальной линии второго порядка.

Воспользуемся также методом сверки контрольных сумм.

Для этого построим ряды теоретических значений по найденным уравнениям трендов.

Рис.8 Лист с отображением формул анализа трендов

Рис.9 Расчеты анализа трендов

В результате получили множество числовых рядов исходных данных, сглаженных по исследуемым трендам (D12:D18; E12:E18; F12:F18; G12:G18; H12:H18), множество вспомогательных контрольных сумм (D20:H20) для выявления наилучшего тренда путем сверки их с главной контрольной суммой (C20).

2.3.  Расчет прогнозного значения

Поскольку величина достоверности аппроксимации R2 максимальна для регрессионной линии, описываемой полиномиальной зависимостью второй степени R2=0,839, то эта зависимость, описываемая y = 2,7619x2 –13,167x + 238,43, где х – номер года, у – величина проходного балла, является наиболее подходящей для описания динамики формирования проходного балла.

Контрольная сумма баллов за анализируемый период, вычисленная по этой зависимости, равна по значению 1687 и равна контрольной сумме статистических данных1687.

Вывод: Для прогнозирования величины проходного балла следует воспользоваться указанной зависимостью.

Выполним расчет прогнозного значения проходного балла на специальность «Программное обеспечение информационных технологий» в ГГУ им. Ф.Скорины на 2017 год: y = 2,7619*8*8 –13,167*8 + 238,43310.

2.4.  Оценка точности полученного прогноза

1.  Рассчитаем среднюю абсолютную оценку по формуле:

, где где – фактическое значение исследуемого явления, – расчетное значение исследуемого явления, n – число уровней временного ряда.

–8,12*10-15.

2.  Рассчитаем среднюю относительную оценку по формуле:

, получаем e=3,2.

Рис.10 Расчеты оценок точности прогноза

Поскольку значение средней абсолютной оценки близко к нулю, а средняя относительная оценка меньше 10, можно сделать вывод о высокой точности прогноза.

3.  Проверка построенной модели

Применим созданную модель для расчета прогнозного значения проходного балла на специальность «Программное обеспечение информационных технологий» ГГУ им. Ф.Скорины на 2016 год и сравним его значение с реальным баллом 2016 года.

Изменим исходную таблицу, удалив данные за 2016 год.

Рис.11 Измененная начальная таблица

Построим точечную диаграмму.

Рис.12 Диаграмма по проходным баллам 2010-2015гг.

Построим тренды для диаграммы:

Рис.13 Диаграмма по проходным баллам с линейным трендом

Рис.14 Диаграмма по проходным баллам с логарифмическим трендом

Рис.15 Диаграмма по проходным баллам с полиномиальным трендом

Рис.16 Диаграмма по проходным баллам со степенным трендом

Рис.17 Диаграмма по проходным баллам с экспоненциальным трендом

Значения коэффициента детерминации (R2):

Название тренда

Значение R2

Линейный

0,444

Логарифмический

0,3341

Полиномиальный

0,6471

Степенной

0,341

Экспоненциальный

0,4455

Наиболее приближенное к 1 значение имеет Полиномиальный тренд второго порядка.

Воспользуемся методом сверки контрольных сумм.

Построим ряды теоретических значений по найденным уравнениям трендов (рисунок 18).

Контрольная сумма баллов, вычисленная по полиномиальной зависимости, равна 1406,0047 и наиболее близка по значению к контрольной сумме статистических данных 1406.

Рис.18 Расчет контрольных сумм

Для прогнозирования воспользоваться данной зависимостью и выполним расчет прогнозного значения проходного балла на специальность «Программное обеспечение информационных технологий» в ГГУ им. Ф.Скорины на 2016 год: y = 2,9107*7*7 –14,089*7 + 239,5283,5.

В 2016 году реальный проходной балл 281, рассчитаем абсолютную и относительную ошибки, полученного прогноза.

Абсолютная ошибка прогноза определяется как разность между эмпирическим и прогнозным значениями:

Относительная ошибка прогноза определяется как отношение разности между эмпирическим и прогнозным значениями к эмпирическому значению:

Полученные данные позволяют сделать вывод о высоком качестве построенной модели.

Заключение

В результате работы была изучена технологии анализа и прогнозирования на основе трендов, с использованием табличного процессора MS Excel, были найдены значения проходных баллов на специальность «Программное обеспечение информационных технологий» в ГГУ им. Ф.Скорины в период с 2010 по 2016 года.

Для выявления тенденций развития процесса формирования проходного балла, были построены линейный, логарифмический, полиномиальный, степенной и экспоненциальный тренды в MS Excel. В ходе анализа, было проведено сравнение значений коэффициентов R2 у каждого тренда. Наиболее приближенное к 1 значение получил коэффициент R2=0,839 у Полиномиального тренда второго порядка. Значит, для получения более точного прогноза необходимо было выбрать уравнение полиномиальной зависимости второго порядка y = 2,7619x2 –13,167x + 238,43, где х – номер года, у – величина проходного балла.

Также был проведен метод сверки контрольных сумм, в результате которого был получен аналогичный вывод, о предпочтении выполнения прогноза с помощью полиномиальной зависимости второго порядка.

Было получено прогнозное значения проходного балла на специальность «Программное обеспечение информационных технологий» в ГГУ им. Ф.Скорины на 2017 год – 310.

Для оценки точности полученного прогноза были рассчитаны средняя абсолютная оценка –8,12*10-15 и средняя относительная оценка e=3,2.

И, так как значение средней абсолютной оценки близко к нулю, а средняя относительная оценка меньше 10, можно сделать вывод о высокой точности прогноза.

Для проверки качества построенной модели был выполнен расчет прогнозного значения проходного балла на 2016 год, по имеющимся данным за 2010-2015 года. Полученное значение 283,5 (реальный проходной балл 281) и рассчитанные абсолютные и относительные ошибки: 2,5 и 0,89%, соответственно, позволили сделать вывод о высоком качестве модели.

Но следует помнить и о различных факторах, влияющих на формирование проходного балла: контрольные цифры приёма, суммарные баллы абитуриентов, подавших документы, общее количество абитуриентов, подавших документы, количество "льготников", победителей международных, республиканских и областных олимпиад.

Используя построенную модель можно рассчитывать ориентировочные прогнозные значения проходных баллов на любую специальность и проводить сравнительный анализ полученных баллов по различным вузам, что может помочь будущим абитуриентам в выборе учебного заведения и специальности в соответствии с набранными баллами в ходе вступительной компании.

В дальнейшем планируется усложнение созданной модели до многофакторной.

Список использованных источников и литературы

1.  , . Решение задач аппроксимации средствами Excel // Компьютеры + программы, 2012. – № 12. – С.42–47.

2.  , «Экономико-математические методы и модели: компьютерное моделирование»: Учеб. Пособие. – М.: Вузовский учебник, 2007. – 365 с.

3.  , . Статистика в Excel: Учебное пособие. – М.: Финансы и статистика, 2012. – 368с.

4.  Справочный ресурс для поступающих. //[Электронный ресурс]. URL : http://www. .

5.  А. Батурин. Временные ряди и модели прогнозирования. //[Электронный ресурс]. URL: http://4analytics. ru/prognozirovanie/tipi-vremennix-ryadov-i-podxodyashix-dlya-nix-modeleie-prognozirovaniya. html.

6.  Методы исследования.// [Электронный ресурс]. URL: http://www. ekonomika-st. ru/drugie/metodi/metodi-prognoz-1-2.html.