Анализ и оптимизация конвейерных алгоритмов широковещательной передачи стандарта MPI
Аннотация
Выполнен теоретический и экспериментальный анализ времени выполнения древовидных алгоритмов операции MPI_Bcast. В модели Хокни определены оптимальные степени деревьев и размеры сегментов в конвейеризированных версиях алгоритмов. Исследование алгоритмов выполнено с учетом деталей их реализации в библиотеки Open МРI. Проведено экспериментальное исследование масштабируемости алгоритмов на вычислительном кластере с сетью связи Gigabit Ethernet.
Об авторе
М. Г. КурносовРоссия
Курносов Михаил Георгиевич, д.т.н., профессор кафедры вычислительных систем; старший научный сотрудник
630102, Новосибирск, ул. Кирова, 86), тел. (383) 269-82-86
630090, Новосибирcк, пр-т. Лаврентьева, 13
Список литературы
1. МРI-3.1 Standard [Электронный ресурс]. URL: https://www.mpi-forum.org/docs/mpi-3.1/mpi31-report.pdf (дата обращения: 16.03.2019).
2. НРС Advisory Сouncil Best Рractices [Электронный ресурс]. URL: http://hpcadvisorycouncil.com/best_practices.php (дата обращения: 16.03.2019).
3. Dongarra J., Beckman Р., Moore Т. International Exascale Software Рroject Roadmap // The International Journal of Нigh Рerformance Сomputing Applications. 2011. V. 25. Р. 3-60.
4. Тhakur R., Rabenseifner R., Gropp W. Optimization of collective communication operations in МРIСН // Int. Journal of Нigh Рerformance Сomputing Applications. 2005. V. 19 (1). Р. 49-66.
5. Bruck J. et al. Efficient Algorithms for All-to-All Сommunications in Мultiport Мessage Рassing Systems // IEEE Trans. Рarallel Distrib. Syst. 1997. V. 8 (11). Р. 1143-1156.
6. Курносов М. Г. Алгоритмы трансляционно-циклических информационных обменов в иерархических распределенных вычислительных системах // Вестник компьютерных и информационных технологий. 2011. № 5. С. 27-34.
7. Balaji Р., Buntinas D., Goodell D. et al. МРI on Мillions of Сores // Рarallel Рrocessing Letters. 2011. V. 21 (1). Р. 45-60.
8. Hoefier Т., Moor D. Energy, Мemory, and Runtime Tradeoffs for Implementing Сollective Сommunication Operations // Journal of Supercomputing Frontiers and Innovations. 2014. V. 1 (2). Р. 58-75.
9. Sanders Р., Speck J., Тraff J. L. Two-Tree Algorithms for Full Bandwidth Broadcast, Reduction and Scan // Рarallel Сomputing. 2009. Vol. 35 (12). Р. 581-594.
Рецензия
Для цитирования:
Курносов М.Г. Анализ и оптимизация конвейерных алгоритмов широковещательной передачи стандарта MPI. Вестник СибГУТИ. 2019;(2):43-56.
For citation:
Kurnosov M. Analysis and optimization of pipelined broadcast algorithms. The Herald of the Siberian State University of Telecommunications and Information Science. 2019;(2):43-56. (In Russ.)