Предсказание генов.
ФББ МГУ, 2 курс, весна 2006, Долудин Юрий
Часть 1. Поиск прокариотических генов
Задание: идентифицировать гены в фрагменте последовательности ДНК Escherichia coli при помощи программ ORF Finder и GeneMark и сравнить полученные результаты с аннотацией.
1.1 Оформите в виде таблицы CDS, указанные в аннотации к предложенной Вам последовательности ДНК .
результаты приведены в таблице
CDS из аннотации ecoli19 | |||
начало | конец | длина | рамка |
<1 | 59 | >59 | |
101 | 763 | 662 | -1 |
760 | >863 | >103 |
1.2 С помощью программы ORF Finder идентифицируйте открытые рамки считывания в последовательности ДНК.
Результаты приведены в таблице
CDS из аннотации ecoli19 | |||
начало | конец | длина | рамка |
101 | 763 | 663 | -2 |
435 | 818 | 384 | +3 |
108 | 395 | 288 | +3 |
632 | 862 | 231 | +2 |
1 | 138 | 138 | -3 |
760 | 861 | 102 | -3 |
В результате работы с ORF Finder было найдено несколько ORF. Ниже представлен результат обработки программой Format лучшего результата. Помимо этого было представлено большое количество других результатов.
Score = 424 bits (1089), Expect = 3e-117
Identities = 220/%), Positives = 220/%), Gaps = 0/220 (0%)
Query 1 MMFWRIFRLELRVAFRHSAEIANPLWFFLIVITLFPLSIGPEPQLLARIAPGIIWVAALL 60
MMFWRIFRLELRVAFRHSAEIANPLWFFLIVITLFPLSIGPEPQLLARIAPGIIWVAALL
Sbjct 1 MMFWRIFRLELRVAFRHSAEIANPLWFFLIVITLFPLSIGPEPQLLARIAPGIIWVAALL 60
Query 61 SSLLALERLFRDDLQDGSLEQLMLLPLPLPAVVLAKVMAHWMVTGLPLLILSPLVAMLLG 120
SSLLALERLFRDDLQDGSLEQLMLLPLPLPAVVLAKVMAHWMVTGLPLLILSPLVAMLLG
Sbjct 61 SSLLALERLFRDDLQDGSLEQLMLLPLPLPAVVLAKVMAHWMVTGLPLLILSPLVAMLLG 120
Query 121 MDVYGWQVMALTLLLGTPTLGFLGAPGVALTVGLKRGGVLLSILVLPLTIPLLIFATAAM 180
MDVYGWQVMALTLLLGTPTLGFLGAPGVALTVGLKRGGVLLSILVLPLTIPLLIFATAAM
Sbjct 121 MDVYGWQVMALTLLLGTPTLGFLGAPGVALTVGLKRGGVLLSILVLPLTIPLLIFATAAM 180
Query 181 DAASMHLPVDGYLAILGALLAGTATLSPFATAAALRISIQ 220
DAASMHLPVDGYLAILGALLAGTATLSPFATAAALRISIQ
Sbjct 181 DAASMHLPVDGYLAILGALLAGTATLSPFATAAALRISIQ 220
1.3 С помощью программы GeneMark распознать гены в последовательности ДНК.
CDS из аннотации ecoli19 | |||
начало | конец | длина | рамка |
101 | 763 | 662 | -2 |
760 | >861 | 101 | -1 |
GeneMark. hmm PROKARYOTIC (Version 2.4a)
Model organism: default_genetic_code_11
Sat Feb 25 08:22:48 2006
Predicted genes
Gene Strand LeftEnd RightEnd Gene Class
# Length
1
>
Часть 2. Поиск эукариотических генов.
Задание: дан фрагмент ДНК из генома человека, содержащий альтернативно сплайсируемый ген. Ваша задача — найти две различные изоформы этого гена (неодинаковые выранивания двух белков с ДНК) и некодирующие экзоны используя программы GENSCAN, BlastX и Human Genome Browser (HGB).
2.1 С помощью программы GENSCAN выделить экзоны в последовательности ДНК и определить их тип.
Экзоны, предсказанные GenScan для human19 | ||
начало | конец | тип |
384 | 442 | Начальный |
511 | 645 | внутренний |
893 | 989 | Внутренний |
1256 | 1353 | Внутренний |
1452 | 1556 | Внутренний |
1713 | 1781 | Внутренний |
1962 | 2109 | Внутренний |
2526 | 2585 | Внутренний |
2665 | 2754 | Внутренний |
2944 | 3062 | Внутренний |
3124 | 3191 | Внутренний |
3271 | 3526 | Внутренний |
3640 | 3724 | Внутренний |
4450 | 4541 | Внутренний |
4864 | 4999 | Внутренний |
5324 | 5506 | Внутренний |
5589 | 5741 | внутренний |
>gi|6572234|emb|CAB63049.1||OTTHUMP [Homo sapiens] | |
координаты по белку | координаты по ДНК |
1 | 384 |
20 | 443 |
21 | 512 |
64 | 643 |
65 | 891 |
97 | 989 |
66 | 1243 |
187 | 1779 |
188 | 1960 |
252 | 2313 |
253 | 2526 |
272 | 2585 |
273 | 2665 |
302 | 2754 |
303 | 2944 |
341 | 3060 |
342 | 3122 |
364 | 3190 |
365 | 3270 |
450 | 3527 |
451 | 3632 |
477 | 3727 |
478 | 4447 |
509 | 4542 |
510 | 4682 |
528 | 4738 |
529 | 5041 |
552 | 5112 |
553 | 5318 |
662 | 5647 |
2.2 Выделить экзоны в последовательности ДНК с помощью программы BlastX и сравнить предсказания программ GENSCAN и BlastX.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 |


