Просмотр статьи


Номер журнала: 2019.3

Заголовок статьи: Использование графических ускорителей для выявления функциональных сигналов в регуляторных районах дифференциально экспрессирующихся генов AGRP нейронов гипоталамуса мыши в ответ на голодание

Резюме

Выявление de novo контекстных сигналов в регуляторных районах генов эукариот существенно затрудняется как огромными объемами анализируемых выборок последовательностей, так и гигантским разнообразием контекстных сигналов. Нами предложен новый алгоритм оценки представленности вырожденных олигонуклеотидных мотивов, записанных в 15-буквенном IUPAC коде, в выборке нуклеотидных последовательностей и показана его высокая производительность по сравнению с ранее предложенным подходом. Данный метод основан, во-первых, на использовании деревьев префиксов, во-вторых, на соответствии префиксов мотивов диапазонам хешей в хешированных нуклеотидных последовательностях анализируемой выборки и, в-третьих, на технологии CUDA, позволяющей использовать для массового параллельного счета графические ускорители, широкодоступные для исследователей.
Предложенный подход был использован для проведения контекстного анализа про-моторных областей генов мыши с достоверно изменившейся после лишения пищи экспрессией в AGRP (Agouti Related Peptide) нейронах гипоталамуса. Когда животное лишено пищи, так называемые AGRP нейроны гипоталамуса вырабатывают молекулы, которые повышают аппетит и облегчают набор веса. Понимание клеточных ме-ханизмов, лежащих в основе функционирования нейронов AGRP в ответ на потерю веса, необходимо для разработки методов борьбы с ожирением, которое является наследственным заболеванием, имеющим лишь несколько безопасных и долгосрочных эффективных методов лечения и стратегий вмешательства. Проведенный нами анализ выявил значимые олигонуклеотидные мотивы, ассоциированные с голоданием.

Авторы

А. В. Бочарников, Е. В. Игнатьева, О. В. Вишневский

Библиография

1. Pesole G, Liuni S, Dsouza M. PatSearch: A pattern matcher sontware that finds functional ele-ments in nucleotide and protein sequences and assesses their statistical significance // Bioinfor-matics. 2000. V. 16, № 5. P. 439–450.
2. Marsan L, Sagot M. F. Algorithms for extracting structured motifs using a suffix tree with an application to promoter and regulatory site consensus identification // J Comput Biol. 2000.
V. 7 (3–4). P. 345–362.
3. Hertz G, Stormo G. Identifying DNA and protein patterns with statistically significant align-ments of multiple sequences // Bioinformatics. 1999. V. 15 (7–8). P. 563–577.
4. Grundy W. N., Bailey T. L., Elkan C. P. ParaMEME: A parallel implementation and a web in-terface for a DNA and protein motif discovery tool // CABIOS. 1996. V. 12. P. 303–310.
5. Lawrence C. E., Altschul S. F., Boguski M. S., Liu J. S. et al. Detecting subtle sequence signals: A Gibbs sampling strategy for multiple alignment // Science. 1993. V. 262, № 5131. P. 208–214.
6. Nickolls J., Buck I., Garland M., Skadron K. Scalable Parallel Programming with CUDA // Queue. 2008. V. 6, № 2. P.40–53.
7. Vishnevsky O. V., Bocharnikov A. V., Kolchanov N. A. ARGO_CUDA: Exhaustive GPU based approach for motif discovery in large DNA datasets // Journal of Bioinformatics and Computa-tion Biology. 2017. V. 16, № 1.
8. Huang D. W., Sherman B. T., Lempicki R. A. Systematic and integrative analysis of large gene lists using DAVID Bioinformatics Resources // Nature Protoc. 2009. V. 4, № 1. P. 44-57.
9. Huang D. W., Sherman B. T., Lempicki R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists // Nucleic Acids Res. 2009. V. 37, № 1.
P. 1–13.
10. Henry F. et al. Cell type-specific transcriptomics of hypothalamic energy-sensing neuron re-sponses to weight-loss // Elife. 2015. Sep 2–4.
11. Zerbino D. R., Flicek P. et al. Ensembl 2018 // PubMed. 2018. PMID: 29155950.
12. Durinck S., Spellman P., Birney E., Huber W. Mapping identifiers for the integration of genomic datasets with the R/Bioconductor package biomaRt // Nature Protocols. 2009. V. 4.
P. 1184–1191.
13. Gupta S., Stamatoyannopoulos J. A., Bailey T. L., and Noble W. S. Quantifying similarity be-tween motifs // Genome Biology. 2007. V. 8, № 2. R24.

Ключевые слова

олигонуклеотидный мотив, GPGPU, ожирение

Скачать полный текст