Обновление кластера Huawei
Уважаемые пользователи РЦ «Вычислительный центр» СПбГУ!
на управляющем узле кластера Huawei были завершены работы по обновлению системного программного обеспечения. В частности, был обновлен менеджер ресурсов Torque до версии 6.1.3 и включена поддержка cgroups.
Проведенные изменения позволят системе лучше контролировать ресурсы, используемые отдельными задачами.
В частности это позволит избежать конфликтов между задачами за доступ к оперативной памяти и графическим картам, что в общем случае повысит стабильность выполнения расчетов.
Внимание! После проведенных обновлений, если Вам для расчета требуется использовать графические карты, при запуске задачи на кластере необходимо обязательно запросить их у менеджера ресурсов явно (см. инструкцию)
С Уважением, команда РЦ ВЦ.