Ստուգման կետերի ստեղծումը և վերականգնումը MPI ծրագրերում
Выполнение программ на вычислительных кластерах обычно занимает довольно большое время. В процессе выполнения может возникнуть потребность изменения физического местоположения отдельных процессов параллельной программы или временная остановка всей программы. В этой статье описана разработанная система CROM (Checkpointing and Recovery of MPI), которая предоставляет возможность создания контрольных точек для остановки и последующего возобновления выполнения MPI программы.Функциональность создания контрольных точек и восстановления реализована в виде дополнительных компонент MPICH2 и не требует изменений в коде MPI программы.
oai:arar.sci.am:258555
ՀՀ ԳԱԱ Հիմնարար գիտական գրադարան
Dec 8, 2023
Jul 24, 2020
6
https://arar.sci.am/publication/281640
Edition name | Date |
---|---|
Создание контрольных точек и восстановление MPI программ | Dec 8, 2023 |
Р. А. Оганян А. Г. Пилипосян
Н. Г. Казарян С. А. Сукиасян
С. Д. Саркисян
И. Д. Заславский
Н. П. Тер-Захарян
С. С. Агаян С. Б. Алавердян В. Л. Даллакян С. М. Испирян А. К. Матевосян З. А. Мелкумян
С. С. Агаян С. Б. Алавердян