Суперкомпьютер Cray X1

Александр Антонов (asa@parallel.ru),
Лаборатория Параллельных информационных технологий НИВЦ МГУ
16 октября 2003


Суперкомпьютер Cray X1 сочетает в себе характеристики векторно-конвейерных и массивно-параллельных компьютеров, являясь наследником как линии компьютеров Cray T3E, так и Cray SV1. Он предоставляет исключительные возможности векторной обработки, высокие скорости обменов с памятью и межпроцессорные обмены с низкой латентностью. В 21-ю редакцию списка мощнейших компьютеров мира Top500 (июнь 2003 года) вошло 10 суперкомпьютеров Cray X1. Фирма Cray Inc. ставит целью достижение к 2010 году реальной производительности компьютера в 1 Pflops.

Cray X1 в максимальной конфигурации объединяет 4096 векторных процессоров с пиковой производительностью 52.4 Tflops и объемом оперативной памяти 65536 Гбайт. Стоимость минимальной конфигурации компьютера при начале выпуска (ноябрь 2002 года) составила $2.5 млн. Возможные конфигурации Cray X1 приведены в следующей таблице:

Число стоек Число процессоров Объем памяти Пиковая производительность
1* 16 64-256 Гбайт 204.8 Gflops
1 64 256-1024 Гбайт 819.0 Gflops
4 256 1024-4096 Гбайт 3.3 Tflops
8 512 2048-8192 Гбайт 6.6 Tflops
16 1024 4096-16384 Гбайт 13.1 Tflops
32 2048 8192-32768 Гбайт 26.2 Tflops
64 4096 16384-65536 Гбайт 52.4 Tflops
*Конфигурация с воздушным охлаждением.

Каждый векторный процессор Cray X1 работает на тактовой частоте 800 МГц и способен выдавать до 16 результатов операций с плавающей точкой за такт, что дает в пике 12.8 Gflops на процессор. Таким образом, это один из наиболее мощных существующих на середину 2003 года процессоров:

Реальная производительность на тесте Linpack при использовании от 4 до 60 процессоров составила (в пересчете на один процессор) 11.55 Gflops, что составляет эффективность использования процессора около 90%.

Оперативная память компьютера Cray X1 является физически распределенной, но логически общей для всех процессоров системы. Таким образом, поддерживается модель DSM (Distributed Shared Memory). Реализован также эффективный протокол поддержки когерентности кэш-памяти. Максимальная скорость обмена с оперативной памятью составляет 34.1 Гбайт/сек. на процессор, скорость обмена с кэш-памятью 76.8 Гбайт/сек. на процессор, что намного превосходит показатели других современных компьютеров:

Топология связи узлов компьютера Cray X1 представляет собой модифицированный двумерный тор, общая пропускная способность 400 Гбайт/сек. для 64-процессорной конфигурации.

Cray X1 работает под управлением операционной системы UNICOS/mp, являющейся продолжением линии предыдущих ОС UNICOS и UNICOS/mk. UNICOS/mp может работать на системе, объединяющей до 4096 процессоров и администрируется с одного узла. Пользователи могут работать на компьютере как в интерактивном режиме, так и через специальную систему очередей.

Пользователям предоставляется возможность написания программ как в модели распределенной, так и общей памяти. Реализованы компиляторы с языков Фортран и Си++, включающие возможности автоматической векторизации и распараллеливания, специальные оптимизированные библиотеки, интерактивный отладчик и средства для анализа производительности. Приложения могут создаваться с использованием MPI, OpenMP, Co-array Fortran и Unified Parallel C (UPC).

Дополнительная информация:


© Лаборатория Параллельных информационных технологий НИВЦ МГУ
Rambler's Top100