Новости: NEC публикует показатели производительности памяти SX-5 на тесте STREAM

NEC публикует показатели производительности памяти SX-5 на тесте STREAM

Корпорация NEC опубликовала результаты тестов STREAM на параллельном векторном суперкомпьютере SX-5/16A.

STREAM измеряет реальную пропускную обменов с памятью, доступную на высокопроизводительных системах. Известно, что реальная скорость выполнения приложений зависит не только от пиковой производительности процессоров, но также от задержек получения данных из памяти.

Во многих современных HPC-архитектурах задержки памяти сглаживаются с помощью кэширования и предварительной выборки данных из памяти. Однако эта техника не всегда работает с приложениями, обрабатывающими очень большие объемы данных. В частности, разреженные системы линейных уравнений, как правило, не вписываются в размер кэш-памяти.

Параллельные векторные системы (PVP), к числу которых принадлежит и SX-5, традиционно заменяют кэширование очень высокой пропускной способностью обменов с памятью.

Скорость работы в MB/sec простых некэшируемых циклов в составе STREAM на системе SX-5/16A приводятся в следующей таблице:

 Векторные операции
Число процессоров COPY
A(i) = B(i)
SCALE
A(i) = q*B(i)
SUM
A(i) = B(i)+C(i)
TRIAD
A(i) = B(i)+q*C(i)
16607492 590390 607412 583069
8 332551 332551 371160 366690
4 168486 168509 189555 189517
2 84853 84853 95352 95328
1 42545 42546 47780 47779

16-процессорный векторный суперкомпьютер SX-5 занял первую позицию в таблице лучших показателей пропускной способности по тесту STREAM. Далее идут 32-процессорные суперкомпьютеры NEC SX-4 и Cray T932.

Более подробная информация:

Смотрите также:


© Лаборатория Параллельных Информационных Технологий, НИВЦ МГУ Rambler's Top100