Ստուգման կետերի ստեղծումը և վերականգնումը MPI ծրագրերում
Выполнение программ на вычислительных кластерах обычно занимает довольно большое время. В процессе выполнения может возникнуть потребность изменения физического местоположения отдельных процессов параллельной программы или временная остановка всей программы. В этой статье описана разработанная система CROM (Checkpointing and Recovery of MPI), которая предоставляет возможность создания контрольных точек для остановки и последующего возобновления выполнения MPI программы.Функциональность создания контрольных точек и восстановления реализована в виде дополнительных компонент MPICH2 и не требует изменений в коде MPI программы.
oai:arar.sci.am:258555
ՀՀ ԳԱԱ Հիմնարար գիտական գրադարան
Aug 18, 2025
Jul 24, 2020
12
https://arar.sci.am/publication/281640
Edition name | Date |
---|---|
Создание контрольных точек и восстановление MPI программ | Aug 18, 2025 |
Н. Г. Казарян С. А. Сукиасян
С. Д. Саркисян
Р. А. Оганян А. Г. Пилипосян
И. Д. Заславский
А. Ю. Шукурян