Тесты производительности процессора

Название FTP Краткое описание
C LINPACK Тест LINPACK, переписанный на языке С.
CPU2 Набор из 34 фортрановских программ, интенсивно работающих с вещественной арифметикой. Производительность измеряется в единицах, эквивалентных производительности MicroVAX II.
Dhrystone Тест целочисленной арифметики, показателен в системном программировании. Не учитывает производительности кэш-памяти.
Flops Вычисляет производительность в MFLOPS на определенных последовательностях инструкций FADD, FSUB, FMUL и FDIV. Работает как на скалярных, так и на векторных машинах.
Heapsort Целочисленная программа, сортирующая 2MB-массив из целых чисел.
LFK
(Livermore Loops)
  Состоит из 24 циклов, представляющих собой характерные вычисления из различных областей прикладной физики. Вычисляет эффективность соответствующих фрагментов в MFLOPS с тремя наборами длин векторов.
LINPACK Тест состоит в решении системы линейных уравнений с помощью LU-факторизации. Основное время затрачивается на векторные операции типа FMA (умножение и сложение). Производительность определяется как количество "полезных" вычислительных операций над числами с плавающей точкой в расчете на 1 секунду, и выражается в Мфлоп/сек (миллионах операций в секунду). Число выполненных операций с плавающей точкой оценивается по формуле 2n3/3 + 2n2 (здесь n - размер задачи, т.е. матрица имеет размеры n x n). Таким образом, при увеличении размера матрицы в 2 раза, объем используемой памяти увеличивается примерно в 4 раза, а объем вычислений - примерно в 8 раз. Есть версии, работающие с матрицами 100х100 и 1000х1000, а также с варьируемым размером матрицы (LINPACK HPC). Автор теста - Jack Dongarra. Результаты теста используются при составлении рейтинга Top500.
  • HPL - реализация на языке Си, причем обмены между процессорами выполняются через процедуры интерфейса MPI, а вычисления на каждом процессоре - с помощью вызовов процедур BLAS. В качестве BLAS можно использовать библиотеку ATLAS.
  • SLbench (1.2MB) - параллельная версия LINPACK, использующая ScaLAPACK и BLACS (необходимо наличие реализации MPI).
  • Доступна Java-версия.
Matrix Multiply (MM) Тест содержит 9 различных программ умножения матриц (размером 500х500). Оценивается работа кэш-памяти и уровень оптимизации компилятора.
NAS Kernels Последовательная версия NAS CFD (computational fluid dynamics)
NPB (NAS Parallel Benchmarks) Состоит из 8 различных программ для определения производительности параллельных компьютеров. Программы взяты из реальных аэро-космических расчетных пакетов.
PERFECT Представляет собой комплект из 13 прикладных Fortran-программ, представляющих четыре типа вычислительных задач - аэро- и гидродинамики, моделирования химических и физических процессов, инженерного проектирования, а также обработки сигналов. Выполняется дважды - до и после оптимизации исходных текстов.
SLALOM Масштабируемый тест производительности для супер-компьютеров. Оценивает объем вычислений, который может произвести компьютер за одну минуту.
Stanford   Тестовый набор, состоящий из 8 целочисленных тестов (умножение матриц, сортировка 3 методами, перестановки, ханойская башня, растановка 8 ферзей, головоломка ) и 2 тестов на вещественные вычисления (быстрое преобразование Фурье, перемножение матриц)
STREAM Синтетический тест*, оценивающий скорость работы с памятью с простой арифметикой и без. Основан на измерении времени выполнения больших векторных операций: копирование по памяти, умножение на константу, сложение, умножение и сложение. Доступны версии на Фортране и Си. Результатами теста пользуются все ведущие разработчики высокопроизводительной техники.
Whetstone Синтетический тест*, ориентированный на численное программирование (с плавающей запятой). Не учитывает кэш. Компилятор легко можно оптимизировать под Whetstone.

Терминология

  • Синтетический тест - тест, не являющийся частью реальной вычислительной программы (программ).
  • MFLOPS = MFlop/sec. - миллионы операций с плавающей точкой в секунду

© Лаборатория Параллельных информационных технологий НИВЦ МГУ
Rambler's Top100