Просмотр статьи


Номер журнала: 2010.2

Заголовок статьи: Архитектура и программное обеспечение пространственно-распределённых вычислительных систем )

Резюме

Рассматриваются архитектурные принципы и программное обеспечение пространственно-распределённых вычислительных систем. Описывается конфигурация пространственно-распределённой мультикластерной вычислительной системы, созданная и развиваемая Центром параллельных вычислительных технологий ГОУ ВПО “СибГУТИ” совместно с Институтом физики полупроводников им. А.В. Ржанова СО РАН. Приводится описание программного обеспечения системы, включающее средства, разработанные коллективом ведущей научной школы НШ-5176.2010.9.

Авторы

В. Г. Хорошевский, М. Г. Курносов, С. Н. Мамойленко, А. Ю. Поляков

Библиография

1. Хорошевский В.Г. Архитектура вычислительных систем. – М.: МГТУ им. Н.Э. Баумана, 2008. – 520 с.
2. Short History of Metacomputer: Past to Present, сайт NCSA, http://archive.ncsa.illinois.edu/Cyberia/MetaComp/MetaHistory.html (дата обращения 12.04.2010).
3. Computational Grids., I. Foster, C. Kesselman. Chapter 2 of "The Grid: Blueprint for a New Computing Infrastructure", Morgan-Kaufman, 1999. URL: http://www.globus.org/alliance/publications/papers.php (дата обращения: 12.04.2010)
4. Хорошевский В.Г., Мамойленко С.Н., Курносов М.Г. Архитектурные концепции, анализ и организация функционирования вычислительных систем с программируемой структу-рой// Труды Международной научно-технической конференции “Информационные тех-нологии и математическое моделирование систем”. – М.: “Радиотехника”, 2009, с.74-79. ISBN: 978-5-88070-230-5
5. Cray XT Programming Environment User's Guide. URL: http://docs.cray.com/books/S-2396-21/S-2396-21.pdf (дата обращения 12.04.2010).
6. IBM System Blue Gene Solution: Blue Gene/P Application Development. URL: http://www.redbooks.ibm.com/redbooks/pdfs/sg247287.pdf (дата обраще-ния 12.04.2010).
7. ZeptoOS: The small Linux for big computers. URL: http://www.mcs.anl.gov/research/projects/zeptoos/ (дата обращения 12.04.2010)
8. Kitten Lightweight Kernel. ULR: https://software.sandia.gov/trac/kitten (дата обращения 12.04.2010)
9. MPICH2: High-performance and Widely Portable MPI. URL: http://www.mcs.anl.gov/research/projects/mpich2 (дата обращения 12.04.2010)
10. Open MPI: Open Source High Performance Computing. URL: http://www.open-mpi.org (дата обращения 12.04.2010)
11. X10 Programming Language. ULR: http://x10-lang.org (дата обращения 12.04.2010)
12. Chapel Programming Language Homepage: Overview. URL: http://chapel.cray.com (дата обращения 12.04.2010)
13. Titanium Project Home Page. URL: http://titanium.cs.berkeley.edu (дата обраще-ния 12.04.2010)
14. Berkeley Unified Parallel C (UPC) Project. URL: http://upc.lbl.gov (дата обращения 12.04.2010)
15. Co-Array Fortran. URL: http://www.co-array.org (дата обращения 12.04.2010)
16. The Fortress Language Specification. URL: http://research.sun.com /projects/plrg/fortress.pdf (дата обращения 12.04.2010)
17. TotalView Technologies − Linux Debugger and Memory Leak Detection Tool for Multi-Threaded C/C++ and Fortran. URL: http://www.totalviewtech.com (дата обращения 12.04.2010)
18. Allinea DDT. URL http://www.allinea.com (дата обращения 12.04.2010)
19. Valgrind Home. URL: http://valgrind.org (дата обращения 12.04.2010)
20. Intel® Debugger 9.1. URL: http://www.intel.com/cd/00/00/21/92/219299_intel_debugger.pdf (дата обра-щения 12.04.2010)
21. Intel® Parallel Composer – расширение для отладки параллельных программ. URL: http://software.intel.com/ru-ru/articles/intel-parallel-composer (дата обращения 12.04.2010)
22. GDB: The GNU Project Debugger. URL: http://www.gnu.org/software/gdb (дата об-ращения 12.04.2010)
23. VAMPIR. URL: http://www.vampir.eu (дата обращения 12.04.2010)
24. VampirTrace. URL: http://www.vampir.eu/flyer/Flyer_VampirTrace_SC09.pdf (дата обращения 12.04.2010)
25. Intel® Trace Analyzer и Intel® Trace Collector версии 7.2 для Linux или Windows URL: http://www.intel.com/cd/software/products/emea/rus/379896.htm (дата обращения 12.04.2010)
26. TAU − Tuning and Analysis Utilities. URL: http://www.cs.uoregon.edu/research/tau/home.php (дата обращения 12.04.2010)
27. KOJAK. URL: www.fz-juelich.de/zam/kojak (дата обращения 12.04.2010)
28. mpiP: Lightweight, Scalable MPI Profiling. URL: http://mpip.sourceforge.net (дата обращения 12.04.2010)
29. Cluster resources :: Products − TORQUE Resource Manager. URL: http://www.clusterresources.com/ (дата обращения 12.04.2010)
30. PBS Works − Enabling On-Demand Computing. URL: http://www.openpbs.org (дата обращения 12.04.2010)
31. Grid Computing | Oracle Grid Engine | Software | Sun Microsystems. URL: http:// www.sun.com/software/sge (дата обращения 12.04.2010)
32. IBM Redbooks | Workload Management with LoadLeveler. URL: http://www.redbooks.ibm.com/abstracts/sg246038.html (дата обращения 12.04.2010)
33. Ganglia Monitoring System. URL: http://ganglia.sourceforge.net (дата обращения 12.04.2010)
34. Nagios − The Industry Standard in IT Infrastructure Monitoring. URL: http://www.nagios.org (дата обращения 12.04.2010)
35. MonALISA. URL: http://monalisa.caltech.edu (дата обращения 12.04.2010)
36. CEMon. URL: http://vdt.cs.wisc.edu/components/cemon.html (дата обращения 12.04.2010)
37. Paul H. Hargrove and Jason C. Duell Berkeley Lab Checkpoint/Restart (BLCR) for Linux Clus-ters In Proceedings of SciDAC 2006: June 2006.
38. J. Ansel, K. Arya, G. Cooperman, DMTCP: Transparent Checkpointing for Cluster Computa-tions and the Desktop // Proc. of IEEE International Parallel and Distributed Processing Sympo-sium (IPDPS'09) . IEEE Press, 2009.
39. The Globus Alliance. URL: http://www.globus.org (дата обращения 12.04.2010)
40. EGEE Technical: Middleware. URL: http://technical.eu-egee.org/index.php?id=149 (дата обращения 12.04.2010)
41. UNICORE − Distributed computing and data resources. URL: http://www.unicore.eu (дата обращения 12.04.2010)
42. Grid Brokers and Metaschedulers Market Overview. URL: http://www.gridwisetech.com/metaschedulers (дата обращения 12.04.2010)
43. Вычислительные ресурсы Центра параллельных вычислительных технологий ГОУ ВПО “СибГУТИ” // Сайт ЦПВТ ГОУ ВПО “СибГУТИ”, URL: http://cpct.sibsutis.ru/wiki/index.php/Main/Resources (дата обраще-ния: 12.04.2010).
44. Институт системного программирования РАН – программа “Университетский кластер”, URL: http://www.ispras.ru/ru/unicluster/ (дата обращения: 12.04.2010).
45. Курносов М.Г. Алгоритмы вложения параллельных программ в иерархические распреде-лённые вычислительные системы // Вестник СибГУТИ.  2009.  № 2 (6).  С. 20 45.
46. Khoroshevsky V., Kurnosov M. Mapping Parallel Programs into Hierarchical Distributed Com-puter Systems // Proceedings of 4th International Conference “Software and Data Technologies (ICSOFT 2009)”.  Sofia: INSTICC, 2009.  Vol. 2.  P. 123 128.
47. Поляков А.Ю. О восстановлении программ из контрольной точки // Параллельные вычислительные технологии (ПаВТ’2010): Труды международной научной конференции (Уфа, 29 марта – 2 апреля 2010 г.) [Электронный ресурс] – Челябинск: Издательский центр ЮУрГУ, 2010. – C. 299-310.– ISBN 978-5-696-03987-9. URL: http://omega.sp.susu.ac.ru/books/conference/PaVT2010/full/155.pdf
48. Поляков А.Ю. Об алгоритме восстановления структуры процессов из контрольной точки // Материалы Международной научно-технической конференции “Многопроцессорные вычислительные и управляющие системы (МВУС-2009)”.– Таганрог: ТТИ ЮФУ.– 2009.– Т. 2.– C. 71−73.– ISBN 978-5-8327-0341-1.
49. G. Cooperman, K. Arya, P. Keller, A.Y. Polyakov DMTCP and Condor: a New Checkpointing Mechanism // Condor Week 2010. – Режим доступа: http://www.cs.wisc.edu/condor/CondorWeek2010/condor-presentations/cooperman-dmtcp.pdf
50. Ana Maria Visan, Artem Polyakov, Praveen S. Solanki, Kapil Arya, Tyler Denniston, Gene Coo-perman Temporal Debugging using URDB .− Режим доступа: http://arxiv.org/abs/0910.5046v1

Ключевые слова

пространственно-распределённые вычислительные системы, программное обеспечение.

Скачать полный текст