Рассмотрим задачу оценки результатов испытаний обучающейся системы научных исследований в общем случае. На i-й (i=1, 2, ..., N) серии испытаний совокупности из п систем получаем п реализаций случайного процесса испытаний данной си­стемы, отличающихся случайным значением координат X, Z, U, Y. Отдельное испытание v-й (v=l, ..., п) системы можно представить как игру, а именно: объект (игрок 1) в i-м испытании выбирает стратегию Zv,i, а управляющее устройство (игрок 2) — Uv,i. После выбора стратегий про­исходит игра (испытание системы) при входных воздей­ствиях Xv,i. Считаем, что задание Zv,i и Uv,i при Xv,i опре­деляет процесс Yv,i, полностью описывающий поведение системы «объект — управляющее устройство»:

Процесс Yv,i определяет значение некоторого функциона­ла Gv,i, величина которого различается с точки зрения качества системы. Тогда Ω(G) является пространством возможных значений функционалов G. Если на каждом этапе испытаний число испытуемых систем велико, то на множестве реализаций случайного процесса Yv,i полно­стью определяется плотность распределения pi(G) слу­чайной величины G.

За критерий качества системы научных исследований будем принимать некоторый функционал от распределения G, например математическое ожидание:

(18.15)

или вероятность нахождения данного функционала в не­котором подпространстве Ω0(G) пространства Ω (G):

(18.16)

Задачей «звена обучения» является выбор таких значе­ний Z и U из

Ω(Z) и Ω(U) (с учетом ограничений) при входных воздействиях X из Ω(U), чтобы выбранный кри­терий качества (18.15), (18.16) или оба достигали экстре­мальной (требуемой) величины. В действительности из-за статистически небольшого объема этапа натурных испы­таний определить закон распределения Pi(G) функцио­нала G не представляется возможным. Практически мы имеем дело с одной последовательностью результатов ис­пытаний (реализаций). Отсюда возникла необходимость разработки метода оценки качества по единственной ста­тистически небольшой последовательности результатов испытаний обучающейся системы, так как для примене­ния существующих методов оценки качества, учитываю­щих эффект обучения систем в испытаниях, требуются статистические данные о результатах испытаний серии обучающихся систем.

НЕ нашли? Не то? Что вы ищете?

В настоящей работе за оценку качества системы научных исследований при­нимается оценка вероятности достижения цели, ограни­чиваясь случаем, когда система в испытании находится только в двух несовместных состояниях: Е0 — в испыта­нии произошел неуспех системы, Е1 — испытание было ус­пешным. Это является частным случаем критерия (18.16). Однако можно показать, что нет принципиальных труд­ностей оценки качества обучающихся систем по критерию (18.15), который используется в основном для восстанав­ливаемых систем.

2. Математическая модель. Введем случайную вели­чину:

(18.17)

Последовательность

(18.18)

является одной реализацией случайного процесса обуче­ния данной системы.

От простейшей статистики (18.18) перейдем к случай­ной величине

(18.19)

которая представляет собой текущее число успешных ис­пытаний в i испытаниях. Графически в зависимости от общего числа испытаний она является ступенчатой функ­цией с единичными скачками в точках, соответствующих порядковым номерам успешных испытаний. Такой гра­фик представляет собой траекторию результатов испы­таний.

Если в N испытаниях система не обучается, эффектив­ной оценкой для вероятности успешной работы является величина

(18.20)

В этом случае вероятность успешной работы остается постоянной, и, следовательно, не считая статистических колебаний, оценка (18.20) также постоянна, с увеличением выборки она приближается по вероятности к истинному значению P(E1).

Исходя из (18.19) и (18.20) ожидаемое число успешных испытаний к і-му испытанию равно:

(18.21)

(18.22)

Наилучшей аппроксимацией является прямая (18.22), про­изводная от которой по і является оценкой вероятности успешной работы.

При испытаниях с обучением распределение числа ус­пешных испытаний ki от общего числа i носит нелиней­ный характер, так как от испытания к испытанию вели­чина вероятности успешной работы Pi(E1) увеличивается с начальной P0(E1) к предельной PN(E1), зависящей от момента окончания испытаний и эффективности обучения. Поэтому производная от аппроксимирующей кривой тра­ектории должна быть возрастающей.

После окончания процесса испытаний аппроксимиру­ющая кривая должна стремиться к прямой линии с на­клоном, равным достигнутой к концу испытаний величи­не вероятности успешной работы. Тогда можно записать следующие условия, накладываемые на вид аппроксими­рующей функции результатов испытаний обучающейся системы:

(18.23)

где

— предельное значение вероятности успешной работы.

Можно указать простой класс непрерывных функций, обладающий вышеуказанными свойствами:

ki = bi-cA(i), (18.24)

где b, с и A(i) характеризуют конкретную траекторию, причем должны быть выполнены следующие предельные соотношения:

(18.25)

При обработке результатов испытаний конкретных обучающихся систем, ока­залось, что обучение приводит к траекториям, достаточно хорошо описываемым кривыми экспоненциального типа. Поэтому в качестве A(i), удовлетворяющей (18.25), взя­та простейшая функция

A(i)=1-e-i/a. (18.26)

В качестве же аппроксимирующей функции траектории (18.19) взята зависимость

ki* = bi — с(1-e-i/a). (18.27)

Очевидно, что

(18.28)

Оценка вероятности успешной работы на i-м испытании равна

(18.29)

к концу этапа испытаний достигает величины

(18.30)

Легко показать, что выражение для Р*і(Е1) (18.29) удов­летворяет решению дифференциального уравнения

(18.31)

при начальном значении

Таким образом, модель роста качества (18.29) пред­полагает, что на i-м испытании изменение Рі* пропорцио­нально максимально возможному в данный момент (Р*- Рі*). Следовательно, чем выше достигнутый уро­вень Рі*, тем больше усилий и больше испытаний требу­ется для дальнейшего увеличения этого уровня. Такое предположение не противоречит особенностям испытаний систем, когда в начальный пери­од обнаруживаются и устраняются грубые дефекты, ве­роятность которых велика. Поэтому Рі* увеличивается интенсивно. По мере их устранения скорость роста Рі* замедляется, так как рост происходит за счет выявления скрытых дефектов, вероятность появления которых уменьшается от испытания к испытанию. Коэффициент 1/а в (18.31) характеризует темп роста вероятности ус­пешной работы в испытаниях.

3. Определение параметров модели. Определение оце­нок неизвестных параметров а*, b* и с* в (18.27) произ­водится методом максимального правдоподобия, который сводится к методу наименьших квадратов, если предпо­ложить, что результаты испытаний являются независимы­ми, равнозначными, равноточными и отклонения ki от ап­проксимирующей функции распределены по нормальному закону. Таким образом, решение задачи сводится к опре­делению таких значений a, b и с, чтобы квадратичная форма

(18.32)

После преобразования уравнений правдоподобия

с учетом обозначения равенства

(18.33)

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87