Новости: Суперкомпьютер KLAT2 в университете Кентукки достигает рекордного соотношения цена/производительность

Суперкомпьютер KLAT2 в университете Кентукки достигает рекордного соотношения цена/производительность

Ученые Университета Кентукки (США) сконструировали и продемонстрировали принципиально новый суперкомпьютер кластерной архитектуры, который достигает рекордного соотношения цена/производительность - примерно $650 за 1 Гфлоп/сек на тесте LINPACK. Для сравнения: около 10 лет назад суперкомпьютер производительностью в 1 Гфлоп/сек стоил несколько миллионов долларов, сейчас стоимость традиционных суперкомпьютеров в расчете на 1 Гфлоп/сек составляет примерно $10 тыс. Beowulf-кластеры на базе стандартных компонент снижают эту стоимость до $3000.

Суперкомпьютер с кодовым названием KLAT2 (Kentucky Linux Athlon Testbed 2), собранный в инженерном колледже (College of Engineering) университета Кентукки, значительно улучшает концепцию Beowulf-кластера. Система KLAT2 при общей стоимости в $41200 на тесте LINPACK производительности в 64 GFLOPS при решении системы из 40960 линейных уравнений (следует учитывать, что использовалась 32-битная арифметика с плавающей точкой). Если бы использовалась 64-битная арифметика, система KLAT2 могла бы занять 150-ю строчку в нынешней редакции рейтинга Top500.

Суперкомпьютер KLAT2 состоит из 64 бездисковых узлов с процессорами AMD Athlon с тактовой частотой 700 MHz и оперативной памятью 128 MB на каждом (еще два узла используются как запасные). При достижении высокой производительности на LINPACK существенным было использование технологии 3DNow! процессоров AMD. Пиковая производительность на 32-битной арифметике составляет 179.2 GFLOPS (2.8 GFLOPS на процессор, 4 операции с плавающей точкой за такт).

Система KLAT2 использует инновационную сетевую топологию "Flat Neighbourghood Network" (FNN). В каждом узле установлены четыре (!) сетевых адаптера Fast Ethernet от Smartlink. Узлы соединяются с помощью девяти 32-портовых коммутаторов.

Топология FNN характеризуется тем свойством, что любые два узла соединяются через общий коммутатор (но необязательно всем узлам быть подключенными к одному коммутатору!). Оптимальная конфигурация сети расчитывалась с помощью генетических алгоритмов на вспомогательном кластере. Данная топология является более дешевой альтернативой использованию гигабитных коммутаторов.


Пример топологии FNN для соединения 6 узлов c помощью трех 4-портовых коммутаторов.

Узлы работают под управлением ОС RedHat Linux 6.0 с ядром 2.2.14. Установлены компиляторы EGCS/G77 (с доработками для использования технологии 3DNow!), а также реализация MPI - LAM версии 6.3.3b1 (с доработками для поддержки топологии Flat Neighborhood), библиотеки SCALAPACK 1.6, BLACS 1.1, ATLAS 3.0b (с ручными вставками кода 3DNow!).

Более подробная информация:

Смотрите также:


© Лаборатория Параллельных Информационных Технологий, НИВЦ МГУ Rambler's Top100