Регистрация


Рубрики


Ссылка на сайт:

Занятие 1. Поиск данных транскриптомики: база данных NCBI GEO

Задача

Познакомиться с возможностями баз данных NCBI GEO Data Sets и NCBI GEO Profiles.

Ход поиска

NCBI --> Resources --> Genes & Expression --> Gene Expression Omnibus (GEO) Database

Цитирование

--> GEO Publications

? Научная этика требует, чтобы используя базу данных, программу или другой компьютерный ресурс в своей научной работе, исследователь на него ссылался. Чаще всего принято помещать в список литературы библиографию научной статьи, в которой описан данный ресурс. Скопируйте библиографические данные статьи, при помощи которой нужно ссылаться на Gene Expression Omnibus (GEO) Database (выберите самую недавнюю).

<-- Вернуться назад.

Search embryogenesis

? Сколько результатов поиска получено из базы данных GEO DataSets Database?

? Сколько результатов поиска получено из базы данных GEO Profiles?

Нажать на число результатов из базы данных GEO DataSets Database -->

Виды

Top organisms --> More

? Скопируйте перечень латинских названий организмов, для которых в базе имеются данные по транскрипции генома в ходе эмбриогенеза. Подпишите известные Вам виды.

? Для какого организма база содержит больше всего записей?

? Есть ли среди объектов исследований растения?

Характеристика записи в базе, соответствующей одному исследованию

Нажать на число результатов для Homo sapiens --> Prechondrocyte differentiation

? Каков шифр набора данных GDS.... (Data Set Record)?

? На какой неделе развития изучали атрикулярные хондроциты (Summary)?

? Какой метод анализа транскриптома использовали (Platform)?

? В какой статье опубликованы результаты этого исследования (Citation)?

? Сколько образцов проанализировано в исследовании (Sample Count)?

--> Sample subsets (ссылка вверху)

? В скольких повторностях (rep) изучали артикулярные хондроциты, в скольких - хондроциты конденсаций?

--> GSE51812 (Reference series)

Samples --> More

? Скопировать название клеток, которые служили контролем (подсказка: их нет в Sample subsets)?

NB! В данном исследовании изучали дифференциальную экспрессию (экспрессия в опыте минус экспрессия в контроле).

<-- Вернуться назад к GDS....

Cluster Analysis --> Нажать на рисунок (тепловую карту)

? Каким цветом обозначено увеличение интенсивности транскрипции (Colors: High)?

? Каким цветом обозначено снижение интенсивности транскрипции (Colors: Low)?

Дважды кликнуть по самой верхней части тепловой карты, чтобы увеличить (зона увеличения отмечена прямоугольником) -->

? Выпишите шифры образцов (GSM.......), к каждому из них запишите стадию развития (development stage) и тип клеток (cell type) (подсказки всплывают при наведении мыши на прямоугольник в строке с соответствующим заголовком).

Запустите поиск на странице (Ctrl f) по символу гена EGFR --> Найдите его в столбце под Gene list (searchable)

? В образцах какого типа клеток уровень транскрипции гена EGFR заметно снижается (в среднем по повторностям)?

--> Вернуться к полному рисунку: Reset (справа вверху после Full image: 54675 x 9 spots)

? На сколько самых больших кластеров разделились гены, транскрипция которых изучалась (дендрограмма справа)?

? Чем отличается характер транскрипции генов в этих кластерах?

Дважды кликнуть по второму кластеру генов, чтобы увеличить (зона увеличения отмечена прямоугольником) -->

? Приведите пример любого гена, транскрипция которого в артикулярных хондроцитах увеличивалась.

Вернуться в запись базы данных, нажав на шифр GDS.... слева вверху.

Download

? Перечислить названия файлов данных, доступных для скачивания, их форматы, указать какие файлы содержат (подсказки всплывают при наведении мыши):

аннотацию генов (gene annotation);

- данные по экспрессии генов (expression value measurements);

- данные в оригинальной форме, предоставленные исследователями (original, submitter supplied).

NB! С этими файлами работать неудобно. Для извлечения списков генов и уровней их экспрессии из базы данных GEO разработаны специальные компьютерные программы (SOFT Parser, GEO2Enrichr Google Chrome Plugin).

Возможности анализа данных

Data Analysis Tools

Find genes -- EGFR --> Search

? Сколько результатов поиска получено (Search results, items: ...)?

? Из какой базы данных они извлечены (слева вверху GEO.........)?

? Полное название гена с символом EGFR (Annotation)?

? Чем отличаются записи результатов поиска для профиля экспрессии гена EGFR (название строки, в которой есть отличия)?

Вернуться к окну GEO DataSet Browther.

Compare 2 sets of samples

Step 1: Select test and significance level --> Significance level 0.050

--> Step 2: Select which samples to put in Group A and Group B --> Group A: выбрать образцы, соответствующие 6 weeks, chondrocyte condensation, Group B: выбрать образцы, соответствующие 17 weeks, articular chondrocyte --> OK

--> Step 3: Query Group A vs. B

? К какой базе данных идет обращение (слева вверху GEO........)?

Cluster heatmaps

? Сколько способов построения иерархической (hierarchical) кластерограммы позволяет ресурс по мере расстояния (distance: перечислить), по способу связи (linkage: перечислить), итого сочетаний?

--> Partitional (K means/K medians) --> Clustering options

? Сколько мер расстояния можно использовать при построении кластерограммы этим методом (перечислить)?

Distance: Euclidean; K method: mean; Clusters: 2 --> Display

Clusters: 3 --> Display

Clusters: 4 --> Display

Clusters: 5 --> Display

? Какое количество кластеров является оптимальным (цвет тепловых карт кластеров более однородный)?

--> By location on chromosome

? Приведите пример любого гена из X-хромосомы, который отличался низким уровнем дифференциальной экспрессии в артикулярных хондроцитах относительно контроля.

Experiment design and value distribution --> Click for details

? Чему равна медиана для образца GSM1253158 (подсказка всплывает при наведении мыши)?

NB! В данном исследовании изучали дифференциальную экспрессию (экспрессия в опыте минус экспрессия в контроле).

--> GSE51812 --> Analyse with GEO2R

--> Define groups, Enter a group name: Condensation --> Ввод --> в таблице ниже выделить 6 образцов, соответствующих этому типу клеток (удерживая Ctrl), нажать Condensation во вкладке Define groups

--> Define groups, Enter a group name: Articular --> Ввод --> в таблице ниже выделить 3 образца, соответствующих этому типу клеток (удерживая Ctrl), нажать Articular во вкладке Define groups

--> Define groups (закрыть меню)

NB! В GEO2R контрольные варианты можно не выбирать. Это позволяет сравнить базовую (а не дифференциальную) экспрессию в двух типах клеток.

--> Top 250

? Выписать символы и названия (аннотации) 5 генов, для которых имеется аннотация и экспрессия в двух типах клеток отличается максимально (значение P. Value минимально - наибольшая отрицательная степень, первые в таблице).

Откройте первую запись в таблице (черный треугольник в столбце ID).

? В какой группе образцов, Condensation или Articular, базовая экспрессия этого гена выше?

<-- Вернуться назад к GDS....

--> Expression profiles

? Сколько генов изучалось в данном исследовании (Search results, Items)?

--> Gene onthology, Customize: apoptosis --> execution phase of apoptosis

? Сколько генов в данном исследовании связаны с осуществлением апоптоза (Search results, Items)?

--> CASP2

Снять фильтр execution phase of apoptosis

--> Profile neighbors

? Сколько генов в данном исследовании обладали сходным с CASP2 характером экспрессии (Profile neighbors)?

--> Chromosome neighbors

? Сколько генов в данном исследовании локализованы в той же хромосоме, что и CASP2 (Chromosome neighbors)?

--> Gene, Genomic context (см. рисунок)

? В какой хромосоме локализован ген CASP2?

? Сделать выводы:

? На какой экспериментальной информации специализируется база GEO Data Sets?

? Ограничена ли база данными по одному или двум-трем биологическим видам?

? Как организован поиск?

? Какую сопроводительную информацию содержит запись базы GEO Data Sets?

? Какую информацию содержит запись базы GEO Profiles?

? Какие возможности анализа данных имеются в базе GEO Data Sets?

? Какие возможности графической иллюстрации данных имеются в базе GEO Data Sets?

? Какие возможности скачивания данных имеются в базе GEO Data Sets?



Пожаловаться

Материал из рубрики: Мои статьи
5
рейтинг рассчитывается на оценке от 1 до 5

Мои другие материалы