Определение эволюционного расстояния между нуклеотидными последовательностями

Истинные расстояния в моей модели: число точечных замен на 100 нуклеотидов

metj

a

uzel1

uzel2

uzel3

uzel4

b

c

d

e

f

 

metj

0

90

50

55

60

65

90

90

90

90

90

 

a

0

140

145

150

155

180

180

180

180

180

 

uzel1

0

5

10

15

40

40

40

40

40

 

uzel2

0

15

10

35

35

35

45

45

 

uzel3

0

25

50

50

50

30

30

 

uzel4

0

25

25

45

55

55

 

b

0

50

70

80

80

 

c

0

70

80

80

 

d

0

80

80

 

e

0

60

 

f

0

 

Матрица попарных расстояний, вычисленных по методу Джукса – Кантора

uzel1

uzel2

f

uzel4

e

b

uzel3

c

d

metj

a

 

uzel1

0

3,22

34,67

8,33

31,24

29,35

10,48

30,29

27,97

36,19

94,15

 

uzel2

0

39,85

11,94

34,67

24,83

6,94

25,71

25,27

41,48

101,1

 

f

0

23,52

45,42

65,14

43,71

64,39

62,19

69

134,2

 

uzel4

0

22,24

36,7

19,32

39,85

38,79

43,14

104,8

 

e

0

58,66

42,03

59,36

59,36

68,21

125,3

 

b

0

17,31

37,22

50,19

61,47

138

 

uzel3

0

19,32

31,72

48,37

110,1

 

c

0

50,19

73,9

136,1

 

d

0

62,19

118,8

 

metj

0

60,05

 

a

0

 

Матрица попарного сходства: среднее число совпадающих нуклеотидов на 100 позиций

uzel1

uzel2

f

uzel4

e

b

uzel3

c

d

metj

a

 

uzel1

0

3,15

27,76

7,89

25,55

24,29

9,78

24,92

23,34

28,71

53,63

 

uzel2

0

30,91

11,04

27,76

21,14

6,62

21,77

21,45

31,86

55,52

 

f

0

20,19

34,07

43,53

33,12

43,22

42,27

45,11

62,46

 

uzel4

0

19,24

29,02

17,03

30,91

30,28

32,81

56,47

 

e

0

40,69

32,18

41,01

41,01

44,79

60,88

 

b

0

15,46

29,34

36,59

41,96

63,09

 

uzel3

0

17,03

25,87

35,65

57,73

 

c

0

36,59

47

62,78

 

d

0

42,27

59,62

 

metj

0

41,32

 

a

0

 


Сравнение расстояний, полученных на основе частоты замен и метода Джукса - Кантора с истинным

На графике видно, что расстояния, полученные по частоте замен и по методу Джукса-Кантора меньше истинных, что особенно хорошо проявляется для далеких последовательностей. Однако метод Джукса-Кантора лучше отражает реальную картину, чем метод по частоте замен. Это может объясняться следующим:

Истинный ход эволюции отличается от того, что мы можем реконструировать отличается возможностями обратных и повторных (замен на различные нуклеотиды больше 1 раза в одной позиции) замен. На основе частоты замен невозможно учесть оба этих события. Предположим, у нас есть две последовательности, между которыми произошло 20 замен. Значение идентичности не отражает того, что 1) могло произойти сперва 30 замен, а потом 10 обратных или 2) произошло 15 замен, потом еще 15 - но 5 для одних и тех же позиций

Метод Джукса-Кантора учитывает возможность обратных замен, но не отражает возможность замен на одних и тех же позициях.

Поэтому данный метод лучше реконструирует картину эволюции. Но для далеких последовательностей и данный метод не является оптимальным, т. к. (см. график выше) резко возрастает разница между расстояниями, рассчитанными по данному методу и истинными.


График зависимости 2-х оценок расстояния от величины «истинного» расстояния

На данном графике четко видно, что метод Джукса-Кантора более точно определяет истинные расстояния, чем метод, основанный на частоте замен.