Просмотр статьи


Номер журнала: 2019.2

Заголовок статьи: Анализ и оптимизация конвейерных алгоритмов широковещательной передачи стандарта MPI

Резюме

Выполнен теоретический и экспериментальный анализ времени выполнения древовидных алгоритмов операции MPI_Bcast. В модели Хокни определены оптимальные степени деревьев и размеры сегментов в конвейеризированных версиях алгоритмов. Исследование алгоритмов выполнено с учетом деталей их реализации в библиотеки Open MPI. Проведено экспериментальное исследование масштабируемости алгоритмов на вычислительном кластере с сетью связи Gigabit Ethernet.

Авторы

М. Г. Курносов

Библиография

1. MPI-3.1 Standard [Электронный ресурс]. URL: https://www.mpi-forum.org/docs/mpi-3.1/mpi31-report.pdf (дата обращения: 16.03.2019).
2. HPC Advisory Council Best Practices [Электронный ресурс]. URL: http://hpcadvisorycouncil.com/best/practices.php (дата обращения: 16.03.2019).
3. Dongarra J., Beckman P., Moore T. International Exascale Software Project Roadmap // The International Journal of High Performance Computing Applications. 2011. V. 25. P. 3–60.
4. Thakur R., Rabenseifner R., Gropp W. Optimization of collective communication operations in MPICH // Int. Journal of High Performance Computing Applications. 2005. V. 19 (1). P. 49–66.
5. Bruck J. et al. Efficient Algorithms for All-to-All Communications in Multiport Message Passing Systems // IEEE Trans. Parallel Distrib. Syst. 1997. V. 8 (11). P. 1143–1156.
6. Курносов М. Г. Алгоритмы трансляционно-циклических информационных обменов в иерархических распределенных вычислительных системах // Вестник компьютерных и информационных технологий. 2011. № 5. С. 27–34.
7. Balaji P., Buntinas D., Goodell D. et al. MPI on Millions of Cores // Parallel Processing Letters. 2011. V. 21 (1). P. 45–60.
8. Hoefler T., Moor D. Energy, Memory, and Runtime Tradeoffs for Implementing Collective Communication Operations // Journal of Supercomputing Frontiers and Innovations. 2014.
V. 1 (2). P. 58–75.
9. Sanders P., Speck J., Traff J. L. Two-Tree Algorithms for Full Bandwidth Broadcast, Reduction and Scan // Parallel Computing. 2009. Vol. 35 (12). P. 581–594.

Ключевые слова

широковещательная передача, трансляционный обмен, broadcast, MPI, параллельное программирование, вычислительные системы.

Скачать полный текст