Суперкомпьютер Cray X1
Александр Антонов (asa@parallel.ru),
Лаборатория Параллельных информационных технологий НИВЦ МГУ
16 октября 2003
Суперкомпьютер Cray X1 сочетает в себе характеристики векторно-конвейерных и массивно-параллельных компьютеров, являясь наследником как линии компьютеров Cray T3E, так и Cray SV1. Он предоставляет исключительные возможности векторной обработки, высокие скорости обменов с памятью и межпроцессорные обмены с низкой латентностью. В 21-ю редакцию списка мощнейших компьютеров мира Top500 (июнь 2003 года) вошло 10 суперкомпьютеров Cray X1. Фирма Cray Inc. ставит целью достижение к 2010 году реальной производительности компьютера в 1 Pflops.
Cray X1 в максимальной конфигурации объединяет 4096 векторных процессоров с пиковой производительностью 52.4 Tflops и объемом оперативной памяти 65536 Гбайт. Стоимость минимальной конфигурации компьютера при начале выпуска (ноябрь 2002 года) составила $2.5 млн. Возможные конфигурации Cray X1 приведены в следующей таблице:
Число стоек | Число процессоров | Объем памяти | Пиковая производительность |
1* | 16 | 64-256 Гбайт | 204.8 Gflops |
1 | 64 | 256-1024 Гбайт | 819.0 Gflops |
4 | 256 | 1024-4096 Гбайт | 3.3 Tflops |
8 | 512 | 2048-8192 Гбайт | 6.6 Tflops |
16 | 1024 | 4096-16384 Гбайт | 13.1 Tflops |
32 | 2048 | 8192-32768 Гбайт | 26.2 Tflops |
64 | 4096 | 16384-65536 Гбайт | 52.4 Tflops |
Каждый векторный процессор Cray X1 работает на тактовой частоте 800 МГц и способен выдавать до 16 результатов операций с плавающей точкой за такт, что дает в пике 12.8 Gflops на процессор. Таким образом, это один из наиболее мощных существующих на середину 2003 года процессоров:
Реальная производительность на тесте Linpack при использовании от 4 до 60 процессоров составила (в пересчете на один процессор) 11.55 Gflops, что составляет эффективность использования процессора около 90%.
Оперативная память компьютера Cray X1 является физически распределенной, но логически общей для всех процессоров системы. Таким образом, поддерживается модель DSM (Distributed Shared Memory). Реализован также эффективный протокол поддержки когерентности кэш-памяти. Максимальная скорость обмена с оперативной памятью составляет 34.1 Гбайт/сек. на процессор, скорость обмена с кэш-памятью 76.8 Гбайт/сек. на процессор, что намного превосходит показатели других современных компьютеров:
Топология связи узлов компьютера Cray X1 представляет собой модифицированный двумерный тор, общая пропускная способность 400 Гбайт/сек. для 64-процессорной конфигурации.
Cray X1 работает под управлением операционной системы UNICOS/mp, являющейся продолжением линии предыдущих ОС UNICOS и UNICOS/mk. UNICOS/mp может работать на системе, объединяющей до 4096 процессоров и администрируется с одного узла. Пользователи могут работать на компьютере как в интерактивном режиме, так и через специальную систему очередей.
Пользователям предоставляется возможность написания программ как в модели распределенной, так и общей памяти. Реализованы компиляторы с языков Фортран и Си++, включающие возможности автоматической векторизации и распараллеливания, специальные оптимизированные библиотеки, интерактивный отладчик и средства для анализа производительности. Приложения могут создаваться с использованием MPI, OpenMP, Co-array Fortran и Unified Parallel C (UPC).
Дополнительная информация:
© Лаборатория Параллельных информационных технологий НИВЦ МГУ