Оптимизация барьерной синхронизации на асимметричных NUMA-подсистемах процессорных ядер

М. Г. Курносов; Е. И. Токмашева

doi:10.55648/1998-6920-2021-15-1-36-49

Оптимизация барьерной синхронизации на асимметричных NUMA-подсистемах процессорных ядер

М. Г. Курносов, Е. И. Токмашева

https://doi.org/10.55648/1998-6920-2021-15-1-36-49

Полный текст:

PDF (Rus)

сгенерировать QR код

Аннотация

Предложен алгоритм MinNumaDist динамического выбора MPI-процесса, в памяти NUMA-узла которого размещаются совместно используемые флаги и счетчики алгоритмов барьерной синхронизации (MPI_Barrier). В качестве минимизируемого показателя используется суммарное расстояние до NUMA-узлов всех процессов (минимум степени близости). Экспериментально показано, что MinNumaDist позволяет сократить на 10-35 % время выполнения алгоритмов операции MPI_Barrier на асимметричных подсистемах процессорных ядер при различном числе процессов на NUMA-узлах или при использовании разного числа NUMA-узлов на нескольких процессорах.

Ключевые слова

барьерная синхронизация

Об авторах

М. Г. Курносов

Сибирский государственный университет телекоммуникаций и информатики; Институт физики полупроводников им. А. В. Ржанова Сибирского отделения Российской академии наук
Россия

Е. И. Токмашева

Сибирский государственный университет телекоммуникаций и информатики
Россия

Список литературы

1. Graham R., Gorentla M., Ladd J., Shami P., Rabinovitz I., Filipov V., Shainer G. Cheetah: A Framework for Scalable Hierarchical Collective Operations // Proc. IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (CCGRID11), 2011. P. 73-83.

2. Zhu H., Goodell D., Gropp W., Thakur R. Hierarchical Collectives in MPICH2 // Proc. European PVM/MPI, 2009. LNCS, V. 5759. P. 325-336.

3. Graham R L., Shipman G. MPI Support for Multi-core Architectures: Optimized Shared Memory Collectives // Proc. 15th European PVM/MPI Users' Group Meeting, 2008. P. 130-140.

4. Jain S., Kaleem R., Balmana M., Langer A., Durnov D., Sannikov A. and Garzaran M. Framework for Scalable Intra-Node Collective Operations using Shared Memory // Proc. International Conference for High Performance Computing, Networking, Storage, and Analysis (SC-2018), 2018. P. 374-385.

5. Yew P. C., Tzeng N. F., Lawrie D. H. Distributing Hot Spot Addressing in Large Scale Multiprocessors // IEEE Transactions on Computers. 1987. V. C-36, Is. 4. P. 388-395.

6. Mellor-Crummey J. M., Scott M. L. Algorithms for Scalable Synchronization on Shared-memory Multiprocessors // ACM Transactions on Computer Systems. 1991. V. 9 (1). P. 21-65.

7. Tzeng N.-F., Kongmunvattana A. Distributed Shared Memory Systems with Improved Barrier Synchronization and Data Transfer // Proc. 11th International Conference on Supercomputing, 1997. P.148-155.

8. Hengsen D., Finkel R., Manber U. Two Algorithms for Barrier Synchronization // Int. Journal of Parallel Programming. 1988. V. 17, Is. 1. P. 1-17.

9. Brooks E. The butterfly barrier // Journal of Parallel Programming. 1986. V. 15, Is. 4. P. 295-307.

Рецензия

Для цитирования:

Курносов М.Г., Токмашева Е.И. Оптимизация барьерной синхронизации на асимметричных NUMA-подсистемах процессорных ядер. Вестник СибГУТИ. 2021;(1):36-49. https://doi.org/10.55648/1998-6920-2021-15-1-36-49

For citation:

Kurnosov M..., Tokmasheva E... Barrier Optimization on Asymmetrical NUMA Subsystems. The Herald of the Siberian State University of Telecommunications and Information Science. 2021;(1):36-49. (In Russ.) https://doi.org/10.55648/1998-6920-2021-15-1-36-49

JATS XML

Контент доступен под лицензией Creative Commons Attribution 4.0 License.

ISSN 1998-6920 (Print)

Логин
Пароль
	Запомнить меня
Регистрация нового пользователя Забыли Ваш пароль?

Войти

Вестник СибГУТИ

Оптимизация барьерной синхронизации на асимметричных NUMA-подсистемах процессорных ядер

Полный текст:

Аннотация

Ключевые слова

Об авторах

Список литературы

Рецензия

Для цитирования:

For citation:

Использование куки-файлов