Preview

Вестник СибГУТИ

Расширенный поиск

Использование графических ускорителей для выявления функциональных сигналов в регуляторных районах дифференциально экспрессирующихся генов AGRP нейронов гипоталамуса мыши в ответ на голодание

Полный текст:

Аннотация

Выявление de novo контекстных сигналов в регуляторных районах генов эукариот существенно затрудняется как огромными объемами анализируемых выборок последовательностей, так и гигантским разнообразием контекстных сигналов. Нами предложен новый алгоритм оценки представленности вырожденных олигонуклеотидных мотивов, записанных в 15-буквенном IUPAC коде, в выборке нуклеотидных последовательностей и показана его высокая производительность по сравнению с ранее предложенным подходом. Данный метод основан, во-первых, на использовании деревьев префиксов, во-вторых, на соответствии префиксов мотивов диапазонам хешей в хешированных нуклеотидных последовательностях анализируемой выборки и, в-третьих, на технологии CUDA, позволяющей использовать для массового параллельного счета графические ускорители, широкодоступные для исследователей.

Предложенный подход был использован для проведения контекстного анализа промоторных областей генов мыши с достоверно изменившейся после лишения пищи экспрессией в AGRP (Agouti Related Peptide) нейронах гипоталамуса. Когда животное лишено пищи, так называемые AGRP нейроны гипоталамуса вырабатывают молекулы, которые повышают аппетит и облегчают набор веса. Понимание клеточных механизмов, лежащих в основе функционирования нейронов AGRP в ответ на потерю веса, необходимо для разработки методов борьбы с ожирением, которое является наследственным заболеванием, имеющим лишь несколько безопасных и долгосрочных эффективных методов лечения и стратегий вмешательства. Проведенный нами анализ выявил значимые олигонуклеотидные мотивы, ассоциированные с голоданием.

Об авторах

А. В. Бочарников
Институт систем информатики им. А. П. Ершова СО РАН
Россия

Бочарников Андрей Васильевич, аспирант

630090, Новосибирск, пр. Академика Лаврентьева, 6



Е. В. Игнатьева
Институт цитологии и генетики СО РАН; Новосибирский государственный университет
Россия

Игнатьева Елена Васильевна, к.б.н, старший научный сотрудник, Институт цитологии и генетики СО РАН; доцент, Новосибирский государственный университет

630090, Новосибирск, пр. Академика Лаврентьева, 10



О. В. Вишневский
Институт цитологии и генетики СО РАН; Новосибирский государственный университет
Россия

Вишневский Олег Владимирович, к.б.н, научный сотрудник, Институт цитологии и генетики СО РАН; ст. преподаватель, Новосибирский государственный университет

630090, Новосибирск, пр. Академика Лаврентьева, 10



Список литературы

1. Pesole G, Liuni S, Dsouza M. PatSearch: A pattern matcher sontware that finds functional elements in nucleotide and protein sequences and assesses their statistical significance // Bioinformatics. 2000. V. 16, № 5. P. 439–450.

2. Marsan L, Sagot M. F. Algorithms for extracting structured motifs using a suffix tree with an application to promoter and regulatory site consensus identification // J Comput Biol. 2000. V. 7 (3–4). P. 345–362.

3. Hertz G, Stormo G. Identifying DNA and protein patterns with statistically significant alignments of multiple sequences // Bioinformatics. 1999. V. 15 (7–8). P. 563–577.

4. Grundy W. N., Bailey T. L., Elkan C. P. ParaMEME: A parallel implementation and a web interface for a DNA and protein motif discovery tool // CABIOS. 1996. V. 12. P. 303–310.

5. Lawrence C. E., Altschul S. F., Boguski M. S., Liu J. S. et al. Detecting subtle sequence signals: A Gibbs sampling strategy for multiple alignment // Science. 1993. V. 262, № 5131. P. 208–214.

6. Nickolls J., Buck I., Garland M., Skadron K. Scalable Parallel Programming with CUDA // Queue. 2008. V. 6, № 2. P.40–53.

7. Vishnevsky O. V., Bocharnikov A. V., Kolchanov N. A. ARGO_CUDA: Exhaustive GPU based approach for motif discovery in large DNA datasets // Journal of Bioinformatics and Computation Biology. 2017. V. 16, № 1.

8. Huang D. W., Sherman B. T., Lempicki R. A. Systematic and integrative analysis of large gene lists using DAVID Bioinformatics Resources // Nature Protoc. 2009. V. 4, № 1. P. 44-57.

9. Huang D. W., Sherman B. T., Lempicki R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists // Nucleic Acids Res. 2009. V. 37, № 1. P. 1–13.

10. Henry F. et al. Cell type-specific transcriptomics of hypothalamic energy-sensing neuron responses to weight-loss // Elife. 2015. Sep 2–4.

11. Zerbino D. R., Flicek P. et al. Ensembl 2018 // PubMed. 2018. PMID: 29155950.

12. Durinck S., Spellman P., Birney E., Huber W. Mapping identifiers for the integration of genomic datasets with the R/Bioconductor package biomaRt // Nature Protocols. 2009. V. 4. P. 1184–1191.

13. Gupta S., Stamatoyannopoulos J. A., Bailey T. L., and Noble W. S. Quantifying similarity between motifs // Genome Biology. 2007. V. 8, № 2. R24.


Рецензия

Для цитирования:


Бочарников А.В., Игнатьева Е.В., Вишневский О.В. Использование графических ускорителей для выявления функциональных сигналов в регуляторных районах дифференциально экспрессирующихся генов AGRP нейронов гипоталамуса мыши в ответ на голодание. Вестник СибГУТИ. 2019;(3):36-44.

For citation:


Bocharnikov A., Ignatieva E., Vishenvskiy O. GPU-based algorithm for context analysis of the core promoter region of mouse genes differently expressed in hypothalamic energy-sensing neurons in response to weight-loss. The Herald of the Siberian State University of Telecommunications and Informatics. 2019;(3):36-44. (In Russ.)

Просмотров: 9


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1998-6920 (Print)