Суперкомпьютер Cray XD1
Суперкомпьютер Cray XD1 является прекрасной иллюстрацией использования в многопроцессорных системах FPGA-ускорителей, размещённых в помощь основным процессорам.
Общая структура
В конфигурации, описанном на сайте компании, суперкомпьютер Cray XD1
имеет следующие характеристики:
- 12 64-разрядных процессоров AMD Opteron 200 (одно- или двухъядерных) на блок
- Кэш 1-го уровня - по 64 К на данные и код, кэш 2-го уровня - 1 МБ на одно ядро
- Узлы по 2 или 4 ядра (2 одноядерных или 2 двухъядерных процессора)
- 12-48 ГБ памяти типа DDR400 или 96 ГБ памяти типа DDR333 (до 8 ГБ на одно гнездо)
- Скорость доступа к памяти - до 12.8 ГБ/с на узел
- 2 или 4 канала связи типа Cray RapidArray на узел общей скоростью 48-96 ГБ/с внутри блока
- 12 или 24 внешних канала связи типа Cray RapidArray на блок общей скоростью 24-48 ГБ/с
- Латентность связи MPI между узлами - 1.7мкс
- На каждом узле расположен также ускоритель приложений типа FPGA - плата Xilinx Virtex-4 XC4VLX160-10 с памятью 16МБ и скоростью связи 3.2 ГБ/с (всего по 6 на блок)
Общая схема блока представлена на рисунке:
Предполагается штатная "кабинетная" комплектация из 12 блоков. Таким образом, в ней содержится 144 процессора AMD Opteron 200, и компанией заявлена для неё пиковая производительность в 1.27 TFLOPS (по 106 GFLОPS на блок). Прочие характеристики такой комплектации:
- Латентность пересылки MPI - 2 мкс
- Максимальная память - 1.2 ТБ
- Вместимость жёстких дисков - 18 ТБ
- Суммарная скорость доступа к памяти - 922 ГБ/с
В печати, однако, почти сразу после выпуска суперкомпьютера выходили сообщения и о продажах таких систем, как, например, 336-процессорная для Rice Univercity.
Системная среда
Суперкомпьютер Cray XD1 изначально ориентирован на ОС Linux (версия от Cray, ядро 2.6.5) и поддерживает такие стандарты, как MPI v.1.2, OpenMP, и компиляторы языков Fortran 77, 90, 95, HPF, C, C++, Java. При этом компанией написан ряд библиотек для ускорения работы приложений с использованием FPGA-процессоров.
Тесты
В тесте HPC Challenge, проведенном для 128-процессорных скалярных систем, суперкомпьютер Cray XD1 выиграл в четырех тестах - это максимальное количество побед для микропроцессорных систем. Система Cray XD1 показала особенно хорошие результаты в тестах "случайное кольцо" и FFT. Эти результаты опубликованы 15 июня 2005 г. на сайте HPC Challenge по адресу: http://icl.cs.utk.edu/hpcc/.
© Лаборатория Параллельных
информационных технологий НИВЦ МГУ