Кластеризация результатов тестирования коммуникационной среды многопроцессорных систем: единицы анализа, исследование методов, визуализация результатов
Ключевые слова:
Интеллектуальный анализ данных; кластерный анализ; большой объем данных; синтетические MPI-тесты; коммуникационная среда многопроцессорных системАннотация
Число процессорных элементов в cуперкомпьютерах постоянно растет, что приводит к росту сложности организации коммуникационной среды. С целью минимизации потерь производительности от задержек в коммуникационной среде и облегчения понимания особенностей поведения коммуникационной среды применяются различные подходы к сбору статистической информации о передаче сообщений и последующему анализу собранной информации. Рассматривается подход, основанный на измерении задержек при передаче сообщений с помощью специальных тестов. В ходе исполнения тесты создают огромный объем данных, который невозможно проанализировать вручную. Рассматриваются задачи сжатия, визуализации, автоматического анализа таких данных, которые предлагается решать с помощью методов кластеризации. Результаты анализа предлагается использовать при создании и оптимизации параллельных программ, для обнаружения аномалий коммуникационной среды и выявления проблемных узлов вычислительного кластера. В работе рассмотрено применение методов дивизизной, агломеративной кластеризации и локальной последовательной кластеризации к данным, полученным с суперкомпьютеров: «ЛомоносовМГУ», «Скиф-МГУ», «Bluegene-MГУ».Загрузки
Опубликован
2018-03-08
Выпуск
Раздел
******************************