Таблица
Вероятностные величины, эквивалентные величине Р
Р | Частота встреча-емости |
LR | G (верхний ряд) и Q (нижний ряд), рассчитанные для N |
М, % |
К | |||||
1 млн. | 10 млн. | 200 млн. | 6 млрд. | |||||||
10-6 | 1:1 млн. | 1 000 000 | 0,3679 | … | … | … | 99 | 100 | ||
0,6321 | ® 1 | ® 1 | ® 1 | |||||||
10-7 | 1:10 млн. | 10 000 000 | 0,9048 | 0,3679 | … | … | 99,9 | 1 000 | ||
0,0952 | 0,6321 | ® 1 | ® 1 | |||||||
10-8 | 1:100 млн. | 100 000 000 | 0,9900 | 0,9048 | 0,1353 | … | 99,99 | 10 000 | ||
0,0100 | 0,0952 | 0,8647 | ® 1 | |||||||
10-9 | 1:1 млрд. | 1 000 000 000 | 0,9990 | 0,9900 | 0,8187 | 0,1818 | 99,999 | 100 000 | ||
0,0010 | 0,0100 | 0,1813 | 0,8182 | |||||||
10-10 | 1:10 млрд. | 10 000 000 000 | 0,9999 | 0,9990 | 0,9802 | 0,8432 | 99,9999 | 1 000 000 | ||
0,0001 | 0,0010 | 0,0198 | 0,1568 | |||||||
10-11 | 1:100 млрд. | 100 000 000 000 | 0,9999 | 0,9999 | 0,9980 | 0,9831 | 99,99999 | 10 000 000 | ||
0,0001 | 0,0001 | 0,0020 | 0,0169 | |||||||
10-12 | 1:1000 млрд. | 1 000 000 000 000 | 0,9999 | 0,9999 | 0,9998 | 0,9983 | 99,999999 | 100 000 000 | ||
0,0001 | 0,0001 | 0,0002 | 0,0017 | |||||||
10-13 | 1:10000 млрд. | 10 000 000 000 000 | 0,9999 | 0,9999 | 0,9999 | 0,9998 | 99,9999999 | 1 000 00 0 000 | ||
0,0001 | 0,0001 | 0,0001 | 0,0002 | |||||||
10-14 | 1:100000 млрд. | 100 000 000 000 000 | 0,9999 | 0,9999 | 0,9999 | 0,9999 | 99,99999999 | 10 000 000 000 | ||
0,0001 | 0,0001 | 0,0001 | 0,0001 | |||||||
Обозначения:
Р - вероятность случайного совпадения; LR - отношение правдоподобия; G - вероятность индивидуализации (уникальности выявленного генетического профиля); Q - вероятность того, что во множестве подозреваемых встретится хотя бы один индивидуум с таким же генетическим профилем, как анализируемый; М - вероятность того, что не менее, чем в 10 000 идентификационных исследованиях не будет допущено ошибки; К - минимальное количество случаев, в которых с вероятностью 99,99% обеспечивается достоверность идентификации.
Проанализируем эквивалентные вероятности, описывающие разные стороны одной и той же статистической модели. В качестве исходной для анализа возьмем величину, рассчитанную с использованием формулы, фигурирующей в криминалистической литературе в качестве универсального порога отождествления: Р £ 1 / N, где N - величина генеральной совокупности. Хотя универсальный характер данной формулы, а следовательно и вся данная статистическая концепция отождествления в последнее время поставлены под сомнение, этот критерий считается достаточно надежным в практическом отношении; в отечественной криминалистике обычно ориентировались на N, равное 200 млн. [13].
Рассмотрим статистическую модель, описываемую этой формулой, приняв, что N = 200 000 000. Данному значению N соответствует величина Р £ 0,5×10-8, т.е. частота встречаемости всего 1 на 200 миллионов, что характеризует крайнюю редкость встречаемости признака. Увеличение силы доказательства после проведения ДНК-анализа в 200 000 000 раз свидетельствует о весомости данной величины Р. Рассматриваемой величине Р = 0.5×10-8 соответствует при принятом высоком уровне надежности (99,99%) достоверность не менее чем 50 000 идентификаций. Это позволяет оценить данную величину как обеспечивающую высокую практическую надежность метода, сообщающую ему большой “запас прочности”.
Рассмотрим теперь ту сторону данной статистической модели, которая связана с выделением из совокупности единичного объекта, т.е. уникальностью. При расчете вероятности G уникальности выявленного профиля ДНК в рассматриваемой генеральной совокупности (N = 200 млн.) она равна всего 37%. Соответственно, вероятность Q равна 63%.
Как видно, при одних и тех же величинах Р уровень практической надежности значительно превышает вероятность уникальности объекта. Это наглядно демонстрирует и таблица. Даже при наиболее консервативном подходе к выбору порога отождествления - при величине генеральной совокупности, равной численности населения земли (с соответствующей вероятностью Р = 1,7×10-9), позволяющем получить огромный "запас прочности" (значительно больший, чем это представляется необходимым с практической точки зрения), вероятность уникальности применительно к этой совокупности все же не достигает значимого уровня. Для этого необходимы более низкие величины.
Характеристика возможных вариантов стандарта. При выборе стандарта ДНК-идентификации принципиально важным моментом является четкое определение идентификационной задачи, являющейся «точкой отсчета». Цель, которая ставится теорией криминалистической идентификации, - выделение единичного объекта из совокупности однородных объектов, предусматривает в качестве такой «точки отсчета» уникальность профиля ДНК. Если, однако, подходить к идентификационной задаче с позиции практики, то реально она заключается в правильном установлении источника происхождения объекта в конкретном исследовании и обеспечивается высоким порогом надежности метода при его практическом применении. Как было показано, эти подходы требуют разных пороговых величин. Таким образом, проблему выбора стандарта идентификации можно рассматривать, прежде всего, как дилемму в выборе ориентации на уникальность профиля или на практическую надежность. Возможно также принятие концепции, в соответствии с которой стандарт идентификации будет включать в себя оба этих критерия, используемых, например, применительно к разным экспертным ситуациям.
С этой точки зрения верхнюю границу данного критерия, видимо, можно рассматривать начиная с уровня порядка 10-14. При этом значении уже достигается 99,99%-я вероятность уникальности профиля ДНК при наиболее консервативном условии – рассмотрении в качестве генеральной совокупности всего населения земли. Данному значению Р соответствует чрезвычайно высокая степень практической надежности (с вероятностью 99,99% «безошибочная идентификация» обеспечивается не менее, чем в 10 млрд. случаев). Более подробно этот уровень будет рассмотрен далее. Нижнюю границу критерия, видимо, можно рассматривать на уровне 10-8 (см. выше).
Указанную нижнюю границу стандарта может обеспечить применение системы STR-анализа II поколения (Second Generation Multiplex – SGM), имеющей информативность в среднем порядка 10-8, верхнюю – совместное применение систем STR-анализа II и III поколения (Third Generation Multiplex – SGM), обеспечивающее информативность в среднем порядка 10-15 [14]. Таким образом, современные технологии позволяют уже сейчас достичь указанных уровней. Для подобных величин, видимо, применим описанный в теории вероятностей принцип невозможности маловероятных событий: если случайное событие имеет очень малую вероятность, то практически можно считать, что в единичном испытании это событие не наступит. Если вероятность Р очень мала, то гипотезу о случайном совпадении с профилем ДНК интересующего объекта профиля ДНК подозреваемого можно рассматривать как практически не реализуемую возможность.
Приведенные цифры позволяют понять особенности соотношения величин и использовать их при выработке стандарта. Тем не менее, указанные выше границы не предлагаются как окончательные, поскольку, во-первых, не определены требования к параметрам использованных величин; во-вторых, приведенные математические эквиваленты не исчерпывают всего спектра возможных вероятностей, рассмотрение которых может дать дополнительную информацию и сделать анализ более полным.
Выбор стандарта не ограничивается дилеммой между уникальностью и практической надежностью. При принятии любого из этих условий необходимо конкретизировать дальнейшую задачу. Ведь могут быть рассмотрены разные генеральные совокупности, разные степени надежности и т.д. Наиболее консервативный подход из всех возможных соответствует пониманию идентификационной задачи как задачи выделения единичного объекта из полного множества объектов такого типа - профилей ДНК всех людей, живущих на Земле. Определяющей величиной при этом будет вероятность уникальности профиля ДНК применительно к генеральной совокупности, составляющей все население Земли.
Этот подход требует существенного завышения порога отождествления с точки зрения практической необходимости, а поскольку достижение такого порога не всегда возможно, это актуализирует риск ошибки I рода (недооценка данных). Данный критерий тем более консервативен, что при его расчете использована абсолютно нереалистичная экстраполяция множества потенциальных подозреваемых на все население земли. Она приводит к подмене понятия числа потенциальных носителей признака на понятие множества потенциальных подозреваемых, что, в свою очередь, также завышает порог. Поэтому указанный консервативный критерий очерчивает границу достаточности, он не должен расцениваться как критерий необходимости, который может определяться критерием уникальности профиля в более реалистичных генеральных совокупностях (например, в популяции страны) или порогом практической надежности вывода о тождестве.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 |


