Предсказание генов.

ФББ МГУ, 2 курс, весна 2006, Долудин Юрий

Часть 1. Поиск прокариотических генов

Задание: идентифицировать гены в фрагменте последовательности ДНК Escherichia coli при помощи программ ORF Finder и GeneMark и сравнить полученные результаты с аннотацией.

1.1 Оформите в виде таблицы CDS, указанные в аннотации к предложенной Вам последовательности ДНК .

результаты приведены в таблице

CDS из аннотации ecoli19

начало

конец

длина

рамка

<1

59

>59

101

763

662

-1

760

>863

>103

1.2  С помощью программы ORF Finder идентифицируйте открытые рамки считывания в последовательности ДНК.

Результаты приведены в таблице

CDS из аннотации ecoli19

начало

конец

длина

рамка

101

763

663

-2

435

818

384

+3

108

395

288

+3

632

862

231

+2

1

138

138

-3

760

861

102

-3

В результате работы с ORF Finder было найдено несколько ORF. Ниже представлен результат обработки программой Format лучшего результата. Помимо этого было представлено большое количество других результатов.

Score = 424 bits (1089), Expect = 3e-117

Identities = 220/%), Positives = 220/%), Gaps = 0/220 (0%)

Query 1 MMFWRIFRLELRVAFRHSAEIANPLWFFLIVITLFPLSIGPEPQLLARIAPGIIWVAALL 60

MMFWRIFRLELRVAFRHSAEIANPLWFFLIVITLFPLSIGPEPQLLARIAPGIIWVAALL

Sbjct 1 MMFWRIFRLELRVAFRHSAEIANPLWFFLIVITLFPLSIGPEPQLLARIAPGIIWVAALL 60

Query 61 SSLLALERLFRDDLQDGSLEQLMLLPLPLPAVVLAKVMAHWMVTGLPLLILSPLVAMLLG 120

НЕ нашли? Не то? Что вы ищете?

SSLLALERLFRDDLQDGSLEQLMLLPLPLPAVVLAKVMAHWMVTGLPLLILSPLVAMLLG

Sbjct 61 SSLLALERLFRDDLQDGSLEQLMLLPLPLPAVVLAKVMAHWMVTGLPLLILSPLVAMLLG 120

Query 121 MDVYGWQVMALTLLLGTPTLGFLGAPGVALTVGLKRGGVLLSILVLPLTIPLLIFATAAM 180

MDVYGWQVMALTLLLGTPTLGFLGAPGVALTVGLKRGGVLLSILVLPLTIPLLIFATAAM

Sbjct 121 MDVYGWQVMALTLLLGTPTLGFLGAPGVALTVGLKRGGVLLSILVLPLTIPLLIFATAAM 180

Query 181 DAASMHLPVDGYLAILGALLAGTATLSPFATAAALRISIQ 220

DAASMHLPVDGYLAILGALLAGTATLSPFATAAALRISIQ

Sbjct 181 DAASMHLPVDGYLAILGALLAGTATLSPFATAAALRISIQ 220

1.3 С помощью программы GeneMark распознать гены в последовательности ДНК.

CDS из аннотации ecoli19

начало

конец

длина

рамка

101

763

662

-2

760

>861

101

-1

GeneMark. hmm PROKARYOTIC (Version 2.4a)

Model organism: default_genetic_code_11

Sat Feb 25 08:22:48 2006

Predicted genes

Gene Strand LeftEnd RightEnd Gene Class

# Length

1

>

Часть 2. Поиск эукариотических генов.

Задание: дан фрагмент ДНК из генома человека, содержащий альтернативно сплайсируемый ген. Ваша задача — найти две различные изоформы этого гена (неодинаковые выранивания двух белков с ДНК) и некодирующие экзоны используя программы GENSCAN, BlastX и Human Genome Browser (HGB).

2.1 С помощью программы GENSCAN выделить экзоны в последовательности ДНК и определить их тип.

Экзоны, предсказанные GenScan для human19

начало

конец

тип

384

442

Начальный

511

645

внутренний

893

989

Внутренний

1256

1353

Внутренний

1452

1556

Внутренний

1713

1781

Внутренний

1962

2109

Внутренний

2526

2585

Внутренний

2665

2754

Внутренний

2944

3062

Внутренний

3124

3191

Внутренний

3271

3526

Внутренний

3640

3724

Внутренний

4450

4541

Внутренний

4864

4999

Внутренний

5324

5506

Внутренний

5589

5741

внутренний

>gi|6572234|emb|CAB63049.1||OTTHUMP [Homo sapiens]

координаты по белку

координаты по ДНК

1

384

20

443

21

512

64

643

65

891

97

989

66

1243

187

1779

188

1960

252

2313

253

2526

272

2585

273

2665

302

2754

303

2944

341

3060

342

3122

364

3190

365

3270

450

3527

451

3632

477

3727

478

4447

509

4542

510

4682

528

4738

529

5041

552

5112

553

5318

662

5647

2.2 Выделить экзоны в последовательности ДНК с помощью программы BlastX и сравнить предсказания программ GENSCAN и BlastX.

Из за большого объема этот материал размещен на нескольких страницах:
1 2