Preview

Вестник СибГУТИ

Расширенный поиск

Анализ и оптимизация конвейерных алгоритмов широковещательной передачи стандарта MPI

Аннотация

Выполнен теоретический и экспериментальный анализ времени выполнения древовидных алгоритмов операции MPI_Bcast. В модели Хокни определены оптимальные степени деревьев и размеры сегментов в конвейеризированных версиях алгоритмов. Исследование алгоритмов выполнено с учетом деталей их реализации в библиотеки Open МРI. Проведено экспериментальное исследование масштабируемости алгоритмов на вычислительном кластере с сетью связи Gigabit Ethernet.

Об авторе

М. Г. Курносов
СибГУТИ; Институт физики полупроводников им. А. В. Ржанова СО РАН
Россия

Курносов Михаил Георгиевич, д.т.н., профессор кафедры вычислительных систем; старший научный сотрудник

630102, Новосибирск, ул. Кирова, 86), тел. (383) 269-82-86

630090, Новосибирcк, пр-т. Лаврентьева, 13



Список литературы

1. МРI-3.1 Standard [Электронный ресурс]. URL: https://www.mpi-forum.org/docs/mpi-3.1/mpi31-report.pdf (дата обращения: 16.03.2019).

2. НРС Advisory Сouncil Best Рractices [Электронный ресурс]. URL: http://hpcadvisorycouncil.com/best_practices.php (дата обращения: 16.03.2019).

3. Dongarra J., Beckman Р., Moore Т. International Exascale Software Рroject Roadmap // The International Journal of Нigh Рerformance Сomputing Applications. 2011. V. 25. Р. 3-60.

4. Тhakur R., Rabenseifner R., Gropp W. Optimization of collective communication operations in МРIСН // Int. Journal of Нigh Рerformance Сomputing Applications. 2005. V. 19 (1). Р. 49-66.

5. Bruck J. et al. Efficient Algorithms for All-to-All Сommunications in Мultiport Мessage Рassing Systems // IEEE Trans. Рarallel Distrib. Syst. 1997. V. 8 (11). Р. 1143-1156.

6. Курносов М. Г. Алгоритмы трансляционно-циклических информационных обменов в иерархических распределенных вычислительных системах // Вестник компьютерных и информационных технологий. 2011. № 5. С. 27-34.

7. Balaji Р., Buntinas D., Goodell D. et al. МРI on Мillions of Сores // Рarallel Рrocessing Letters. 2011. V. 21 (1). Р. 45-60.

8. Hoefier Т., Moor D. Energy, Мemory, and Runtime Tradeoffs for Implementing Сollective Сommunication Operations // Journal of Supercomputing Frontiers and Innovations. 2014. V. 1 (2). Р. 58-75.

9. Sanders Р., Speck J., Тraff J. L. Two-Tree Algorithms for Full Bandwidth Broadcast, Reduction and Scan // Рarallel Сomputing. 2009. Vol. 35 (12). Р. 581-594.


Рецензия

Для цитирования:


Курносов М.Г. Анализ и оптимизация конвейерных алгоритмов широковещательной передачи стандарта MPI. Вестник СибГУТИ. 2019;(2):43-56.

For citation:


Kurnosov M. Analysis and optimization of pipelined broadcast algorithms. The Herald of the Siberian State University of Telecommunications and Information Science. 2019;(2):43-56. (In Russ.)

Просмотров: 358


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1998-6920 (Print)