Рассмотрим задачу оценки результатов испытаний обучающейся системы научных исследований в общем случае. На i-й (i=1, 2, ..., N) серии испытаний совокупности из п систем получаем п реализаций случайного процесса испытаний данной системы, отличающихся случайным значением координат X, Z, U, Y. Отдельное испытание v-й (v=l, ..., п) системы можно представить как игру, а именно: объект (игрок 1) в i-м испытании выбирает стратегию Zv,i, а управляющее устройство (игрок 2) — Uv,i. После выбора стратегий происходит игра (испытание системы) при входных воздействиях Xv,i. Считаем, что задание Zv,i и Uv,i при Xv,i определяет процесс Yv,i, полностью описывающий поведение системы «объект — управляющее устройство»:
![]()
Процесс Yv,i определяет значение некоторого функционала Gv,i, величина которого различается с точки зрения качества системы. Тогда Ω(G) является пространством возможных значений функционалов G. Если на каждом этапе испытаний число испытуемых систем велико, то на множестве реализаций случайного процесса Yv,i полностью определяется плотность распределения pi(G) случайной величины G.
За критерий качества системы научных исследований будем принимать некоторый функционал от распределения G, например математическое ожидание:
(18.15)
или вероятность нахождения данного функционала в некотором подпространстве Ω0(G) пространства Ω (G):
(18.16)
Задачей «звена обучения» является выбор таких значений Z и U из
Ω(Z) и Ω(U) (с учетом ограничений) при входных воздействиях X из Ω(U), чтобы выбранный критерий качества (18.15), (18.16) или оба достигали экстремальной (требуемой) величины. В действительности из-за статистически небольшого объема этапа натурных испытаний определить закон распределения Pi(G) функционала G не представляется возможным. Практически мы имеем дело с одной последовательностью результатов испытаний (реализаций). Отсюда возникла необходимость разработки метода оценки качества по единственной статистически небольшой последовательности результатов испытаний обучающейся системы, так как для применения существующих методов оценки качества, учитывающих эффект обучения систем в испытаниях, требуются статистические данные о результатах испытаний серии обучающихся систем.
В настоящей работе за оценку качества системы научных исследований принимается оценка вероятности достижения цели, ограничиваясь случаем, когда система в испытании находится только в двух несовместных состояниях: Е0 — в испытании произошел неуспех системы, Е1 — испытание было успешным. Это является частным случаем критерия (18.16). Однако можно показать, что нет принципиальных трудностей оценки качества обучающихся систем по критерию (18.15), который используется в основном для восстанавливаемых систем.
2. Математическая модель. Введем случайную величину:
(18.17)
Последовательность
(18.18)
является одной реализацией случайного процесса обучения данной системы.
От простейшей статистики (18.18) перейдем к случайной величине
(18.19)
которая представляет собой текущее число успешных испытаний в i испытаниях. Графически в зависимости от общего числа испытаний она является ступенчатой функцией с единичными скачками в точках, соответствующих порядковым номерам успешных испытаний. Такой график представляет собой траекторию результатов испытаний.
Если в N испытаниях система не обучается, эффективной оценкой для вероятности успешной работы является величина
(18.20)
В этом случае вероятность успешной работы остается постоянной, и, следовательно, не считая статистических колебаний, оценка (18.20) также постоянна, с увеличением выборки она приближается по вероятности к истинному значению P(E1).
Исходя из (18.19) и (18.20) ожидаемое число успешных испытаний к і-му испытанию равно:
(18.21)
(18.22)
Наилучшей аппроксимацией является прямая (18.22), производная от которой по і является оценкой вероятности успешной работы.
При испытаниях с обучением распределение числа успешных испытаний ki от общего числа i носит нелинейный характер, так как от испытания к испытанию величина вероятности успешной работы Pi(E1) увеличивается с начальной P0(E1) к предельной PN(E1), зависящей от момента окончания испытаний и эффективности обучения. Поэтому производная от аппроксимирующей кривой траектории должна быть возрастающей.
После окончания процесса испытаний аппроксимирующая кривая должна стремиться к прямой линии с наклоном, равным достигнутой к концу испытаний величине вероятности успешной работы. Тогда можно записать следующие условия, накладываемые на вид аппроксимирующей функции результатов испытаний обучающейся системы:
(18.23)
где

— предельное значение вероятности успешной работы.
Можно указать простой класс непрерывных функций, обладающий вышеуказанными свойствами:
ki = bi-cA(i), (18.24)
где b, с и A(i) характеризуют конкретную траекторию, причем должны быть выполнены следующие предельные соотношения:
(18.25)
При обработке результатов испытаний конкретных обучающихся систем, оказалось, что обучение приводит к траекториям, достаточно хорошо описываемым кривыми экспоненциального типа. Поэтому в качестве A(i), удовлетворяющей (18.25), взята простейшая функция
A(i)=1-e-i/a. (18.26)
В качестве же аппроксимирующей функции траектории (18.19) взята зависимость
ki* = bi — с(1-e-i/a). (18.27)
Очевидно, что
(18.28)
Оценка вероятности успешной работы на i-м испытании равна
(18.29)
к концу этапа испытаний достигает величины
(18.30)
Легко показать, что выражение для Р*і(Е1) (18.29) удовлетворяет решению дифференциального уравнения
(18.31)
при начальном значении

Таким образом, модель роста качества (18.29) предполагает, что на i-м испытании изменение Рі* пропорционально максимально возможному в данный момент (Р∞*- Рі*). Следовательно, чем выше достигнутый уровень Рі*, тем больше усилий и больше испытаний требуется для дальнейшего увеличения этого уровня. Такое предположение не противоречит особенностям испытаний систем, когда в начальный период обнаруживаются и устраняются грубые дефекты, вероятность которых велика. Поэтому Рі* увеличивается интенсивно. По мере их устранения скорость роста Рі* замедляется, так как рост происходит за счет выявления скрытых дефектов, вероятность появления которых уменьшается от испытания к испытанию. Коэффициент 1/а в (18.31) характеризует темп роста вероятности успешной работы в испытаниях.
3. Определение параметров модели. Определение оценок неизвестных параметров а*, b* и с* в (18.27) производится методом максимального правдоподобия, который сводится к методу наименьших квадратов, если предположить, что результаты испытаний являются независимыми, равнозначными, равноточными и отклонения ki от аппроксимирующей функции распределены по нормальному закону. Таким образом, решение задачи сводится к определению таких значений a, b и с, чтобы квадратичная форма
(18.32)
После преобразования уравнений правдоподобия

с учетом обозначения равенства
(18.33)
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 |


