Новости: Sandia расширяет кластер Cplant почти до 1400 процессоров Alpha

Sandia расширяет кластер Cplant почти до 1400 процессоров Alpha

В 1999 году национальная лаборатория Sandia значительно расширила свои массивно-параллельные вычислительные ресурсы. Еще в июне 1997 суперкомпьютер ASCI Red c 9742 процессорами Pentium Pro, установленный в Sandia, попал на первое место в списке Top500 с 2 TFLOP/sec производительности по LINPACK.

В рамках проекта под кодовым названием Cplant ("the computational plant"), специалисты Sandia создают крупномасштабную массивно-параллельную вычислительную систему на основе кластерной технологии, пользуясь общедоступными компонентами и сетевыми технологиями. Корпорация Compaq Computer поставила в лабораторию под этот проект почти 1400 рабочих станций с процессорами Alpha различной мощности, 16 серверов DS20 и 4 сервера AlphaServer 1200. Общий объем дисковой памяти составляет около 3 TB.

Суммарная пиковая производительность всех процессоров составляет 1.1 TFLOP/sec, что позволяет надеяться на получение производительность по LINPACK порядка 600 GFLOP/sec, т.е. данный кластер вполне может войти в первую десятку списка Top500. При запуске LIPACK на 350 узлах кластера была получена производительность в 152 GFLOP/sec, что соответствует 53 месту в Top500.

Краткая история проекта

  • 1997 г. Приобретены 128 рабочих станций Personal Workstation 433 от DIGITAL (суммарная пиковая производительность - 55.4 GFLOP/sec)
  • 1998 г. Sandia приобретает еще 450 рабочих станций DIGITAL Personal Workstation 500 с процессорами Alpha 21164. Дополнительно приобретены 4 сервера AlphaServer 1200 для работы в качестве узлов ввода-вывода.
  • Май 1999 г. Sandia приобретает 800 рабочих станций Compaq XP1000 Professional Workstation с производительностью 1 GFLOP/sec каждая, 16 серверов AlphaServer DS20 и систему хранения данных StorageWorks. Эта поставка должна полностью завершится в сентябре 1999 г.

В качестве операционной системы для всех узлов кластера выбрана ОС Linux (только сервера AlphaServer 1200 работают под Tru64 UNIX в силу отсутствия необходимых сетевых драйверов). Руководители проекта предполагают сделать общедоступным разработанное в его рамках программное обеспечение.

Базовым строительным блоком кластера Cplant является так называемый SU (Scalable unit, "масштабируемый модуль"). SU состоит из 2 стоек с вычислительными узлами (8 рабочих станций XP1000 в стойке) и одного "диагностического" узла. В каждой стойке также выделен один "сервисный узел", который имеет дополнительный Ethernet-адаптер, подключенный к внешней сети; с этих узлов пользователи запускают в пакетном режиме и ставят в очередь свои задачи.

В качестве основной сетевой технологии, используемой вычислительными приложениями, выбрана коммутируемая сеть Myrinet (1.28 Gbit/sec). Используется один 16-портовый коммутатор Myrinet на каждый SU. Дополнительная сеть на базе Fast Ethernet используется для задач администрирования и диагностики проблем кластера. Вычислительные узлы кластера не имеют жестких дисков и загружаются через Ethernet.

Более подробная информация:

Смотрите также:


© Лаборатория Параллельных Информационных Технологий, НИВЦ МГУ Rambler's Top100