Почему GPU обманывают о своей нагрузке и как с этим бороться

21 апреля 2022

Дмитрий Монахов

data science

Опыт эксплуатации кластеров — полезный опыт и для тех, кто обучает огромные ML-модели, и для специалистов с парой GPU. Почему в распределённом обучении нельзя доверять утилизации GPU? Почему переход в эру распределённого обучения — фундаментальный сдвиг парадигмы мышления, к которому должен быть готов каждый ML-разработчик? Ответы — в статье.