Кластеризация результатов тестирования коммуникационной среды многопроцессорных систем: единицы анализа, исследование методов, визуализация результатов

Авторы

  • Алексей Николаевич Сальников
  • Арчил Ивериевич Майсурадзе
  • Дмитрий Юрьевич Андреев
  • Григорий Александрович Костин

Ключевые слова:

Интеллектуальный анализ данных; кластерный анализ; большой объем данных; синтетические MPI-тесты; коммуникационная среда многопроцессорных систем

Аннотация

Число процессорных элементов в cуперкомпьютерах постоянно растет, что приводит к росту сложности организации коммуникационной среды. С целью минимизации потерь производительности от задержек в коммуникационной среде и облегчения понимания особенностей поведения коммуникационной среды применяются различные подходы к сбору статистической информации о передаче сообщений и последующему анализу собранной информации. Рассматривается подход, основанный на измерении задержек при передаче сообщений с помощью специальных тестов. В ходе исполнения тесты создают огромный объем данных, который невозможно проанализировать вручную. Рассматриваются задачи сжатия, визуализации, автоматического анализа таких данных, которые предлагается решать с помощью методов кластеризации. Результаты анализа предлагается использовать при создании и оптимизации параллельных программ, для обнаружения аномалий коммуникационной среды и выявления проблемных узлов вычислительного кластера. В работе рассмотрено применение методов дивизизной, агломеративной кластеризации и локальной последовательной кластеризации к данным, полученным с суперкомпьютеров: «ЛомоносовМГУ», «Скиф-МГУ», «Bluegene-MГУ».

Загрузки

Опубликован

2018-03-08

Выпуск

Раздел

******************************