Определение 2. Если
не может быть редуцировано на
, то отношение эквивалентности
является независимым, в противном случае
является взаимосвязанным.
Определение 3. Пусть
- информационная система. Если
удовлетворяет условию
, и
- независимое, то
называется редукцией R.
Верхняя, нижняя аппроксимации и границы неточного множества
Определение 4. База знаний
, записанная как
- установленная нижняя аппроксимация
, а
- положительная область определения R,
, которая состоит из элементов
, полностью принадлежащих
. То есть, элементы
, которые является положительной областью определения R могут быть корректно классифицированы.
Определение 5. База знаний
, записанная как
- верхняя аппроксимация
.
это также некоторая коллекция, которая составлена из элементов U, которые могут содержатся в X. Она составлена из элементов, классы эквивалентности которых для
Ш пересекаются с
.
Для
, x должен находится в одном из
классах эквивалентности
. Когда
Ш, некоторые элементы
лежат в
. Тогда
может быть элементом
, что означает -
является элементом
. Таким образом
обозначает коллекцию всех возможных элементов
в наборе
. Это c большой вероятностью будут правильно классифицированные элементы.
Пример: прогнозирование спроса на уголь
Таблица 5. Факторы, влияющие на спрос угля
Рост ВВП |
Цена покупки горючего |
Скорость притока населения из сельской местности в города |
Доля угля в потреблении энергии |
Производство угля |
Повышение или понижение спроса на импортный уголь |
Число рабочих, занятых в угольной промышленности |
Уровень заработной платы в угольной промышленности в пересчете на одного рабочего |
Инвестиции в основные средства угольной промышленности |
Рост потребления угля |
Эластичность спроса на уголь |
Потребление угля |
Скорость роста численности населения |
Уровень образования населения |
После применения метода редукции факторов, основанного на неточных множествах, оказалось что 14 факторов, указанные выше, содержат избыточную информацию, взаимно влияют друг на друга, и некоторые из них можно устранить. На следующей таблице показано 11 оставшихся факторов.
Таблица 6. Факторы, влияющие на спрос угля, после редуцирования
Рост ВВП |
Цена покупки горючего |
Скорость роста располагаемого дохода |
Доля угля в потреблении энергии |
Производство угля |
Уровень заработной платы в угольной промышленности в пересчете на одного рабочего |
Инвестиции в основные средства угольной промышленности |
Рост потребления угля |
Эластичность спроса на уголь |
Потребление угля |
Таблица 7. Результаты прогнозирования на 4 года (в млн. тонн)
Годы | 2008 | 2009 | 2010 | 2011 |
Прогнозное значение | 274472 | 281352 | 285210 | 288560 |
Литература
Р. Каллан. Основные концепции нейронных сетей. – М.: «Вильямс», 2001 – 287 с.
Z. Pawlak. Rough sets. International Journal of Parallel Programming. – 1982, 11 (5): pp. 341–356.
W. L. Charles. Training feedforward neural networks: an algorithm, giving improved generalization. Neural Networks, 1997, 10 (1): pp. 61-68.
Z. Cai, X. Ma. The forecast of coal demand based on RoughSet and BP neural network model.// Proceedings of Management and Service Science (MASS) 2010 International Conference. pp. 1-4.
Метод Бокса-Дженкинса (ARIMA)
В середине 90-х годов прошлого века был разработан принципиально новый и достаточно мощный класс алгоритмов для прогнозирования временных рядов. Большую часть работы по исследованию методологии и проверке моделей была проведена двумя статистиками, Г. (G. E.P. Box) и (G. M. Jenkins). С тех пор построение подобных моделей и получение на их основе прогнозов иногда называться методами Бокса-Дженкинса. В это семейство входит несколько алгоритмов, самым известным и используемым из них является алгоритм ARIMA. Он встроен практически в любой специализированный пакет для прогнозирования. В классическом варианте ARIMA не используются независимые переменные. Модели опираются только на информацию, содержащуюся в предыстории прогнозируемых рядов, что ограничивает возможности алгоритма. В методологии ARIMA не предполагается какой-либо четкой модели для прогнозирования данной временной серии. Задается лишь общий класс моделей, описывающих временной ряд и позволяющих как-то выражать текущее значение переменной через ее предыдущие значения. Затем алгоритм, подстраивая внутренние параметры, сам выбирает наиболее подходящую модель прогнозирования.
Часто модель записывается как ARIMA(p, d, q), где p, d и q обозначают порядки соответствующих подмоделей: авторегрессионную модель порядка p, интегрированную модель порядка d и модель со скользящим средним порядка q.
Пусть задана серия временных данных
, где t – числовой индекс, и
- вещественный ряд.
Тогда модель ARIMA будет иметь вид:
,
где L – это оператор временного лага(или смещения),
- параметры авторегрессионной части модели,
- параметры скользящего среднего и
- значения ошибки (остаточные члены).
являются независимыми, имеющими одинаковое распределение переменными, выраженное нормальным распределением с нулевым средним.
Положим, что
имеет унитарный корень кратности d. Тогда выражение можно переписать как:
.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 |


