Процессоры Intel Xeon Skylake

Шмитов Н. О.,
ВМК МГУ,
Москва, 2018


1. Введение

Серия Intel Xeon на основе микроархитектуры Intel Skylake – это семейство 64-разрядных микропроцессоров для серверов и рабочих станций от Intel. Эти многоядерные процессоры с четырьмя (E3) - 28 (SP) ядрами являются преемниками процессоров Intel Xeon Broadwell на базе микроархитектуры Intel Broadwell[1].

Xeons поколения Skylake появились в июне 2016 года только в версии для одной рабочей станции (называемой E3-v5). Эти модели отличаются от основных процессоров поколения Skylake в основном поддержкой основной памяти ECC[2].

Серверные процессоры NUMA масштабируемого процессора появились в июле 2017 года и отличаются внутренней структурой ядер (включая поддержку AVX-512), количеством каналов памяти, сокетов и других точек от E3-v5. Разновидностью этой серии серверов для рынка настольных ПК с четырьмя основными каналами памяти является серия Intel Core i9-7xxx, которая не относится к микроархитектуре Intel Kaby Lake[3] и также называется Skylake -X.

Существует и не серверный вариант, но он не будет рассматривать здесь, так как нам важны особенности серверных процессоров, архитектура которых направлена на как можно более эффективное управление сетевыми ресурсами, и обменом данных с серверным оборудованием (сетевые карты, диски, RAID-контроллерами и пр.).

2. Параметры модели

Каждая модель характеризуется следующими параметрами:

·      Первая цифра четырехзначного кода продукта указывает, сколько процессоров этого типа можно использовать параллельно на материнской плате (количество сокетов, а не количество ядер).

·      Тактовая частота (напрямую зависит от производительности одной задачи и определяет производительность для многих программ)

·      Размер кэша (увеличивает пропускную способность)

·      Количество ядер (увеличивает количество параллельно выполняемых задач)

·      Тепловая расчетная мощность (TDP): рассеиваемая мощность ограничивает область применения, чем выше, тем больше должны быть рассчитаны система охлаждения и блок питания с тактовой частотой, количеством ядер и размером кэша.

·      встроенный графический процессор (GPU): интересен только для рабочих станций с низкой производительностью 3D-графики

3. Сравнение процессоров Haswell, Broadwell и Skylake

На данный момент актуальными и конкурирующими между собой считаются микроархитектуры трех поколений от Intel. Это ядро 4-го поколения Haswell, 5-го поколения Broadwell и новейшая микроархитектура 6-го поколения Skylake. Как известно, в основе создания данных микроархитектур лежит экстенсивная стратегия под названием «Тик-так». «Тик» означает создание нового поколения процессоров на основе уменьшенного технологического процесса. «Так» же подразумевает выпуск новых микропроцессоров, но без изменения технологии создания. В статье будет проведен их сравнительный анализ и на его основе будет сделан вывод о наиболее производительном ядре.

Haswell

– микроархитектура, разработанная в 2012 году по 22 нм технологии. Поддерживает сокеты: LGA 1150, BGA 1364, LGA 2011-3. Работает с планкой ОЗУ DDR4. Шина: DMI2.

Плюсы процессора с данной микроархитектурой:

1)    Энергоэффективный

2)    Поддерживает DDR4

3)    Низкая стоимость. К примеру, цена на Intel Core I3 4160 с ядром Haswell составляет 7800 рублей.

Минусы:

1)    Изготовлен по устаревшей 22 нм технологии, в результате чего проигрывает по многим параметрам его улучшенной версии Broadwell.

Broadwell

– улучшенная версия Haswell, разработана для процессоров Intel серии Xeon, а также для седьмого поколения Intel Core I7. Изготовлена по 14 нм технологии. Принадлежит к ветви «тик» маркетинговой миссии «тик-так». По сравнению с Haswell имеет на 3-5% большую эффективность, чем Haswell, при этом потребляет энергии на 30%, также гораздо меньшее тепловыделение в ПК, 4.5 вт против 15 Haswell. Все это объясняется, прежде всего, уменьшенным технологическим процессом, по которому было изготовлено ядро, возможностью разгона процессора с данной микроархитектурой, а также наличием 4 кэша Crystalwell, дающего более высокую скорость обмена с ОЗУ, чем всего 3 кэша.

Плюсы ядра:

  1. Эффективное энергопотребление
  2. Возможность разгона
  3. Поддержка DirectX 12
  4. Именно в данной микроархитектуре получил распространение кэш L4, до сего использовавшийся лишь в редком числе микропроцессоров Haswell
  5. Более высокое время автономной работы, чем Haswell

Минусы:

  1. Стоимость (цена варьируется в пределах 13-150000 в зависимости от модели процессора, ибо предназначается данная микроархитектура для камней серии Xeon и Core I7 от Intel в то время как микропроцессор Haswell работает и на бюджетных камнях)
  2. Соотношение цены/качества. В тестах микроархитектура показало невысокие результаты, опередив Haswell приблизительно на 3 процента, в том числе и в 3D Mark (Core I7-6850K на Broadwell-E : 19065 очков, Core I7-5820 на Haswell-E– 16598 очков). Если рассматривать это относительно сравнения Ivy Bridge и Haswell, то результат не впечатляющий.

Skylake

– микроархитектура 6-го поколения, предназначенная, как и Haswell, в основном, для бюджетных энергоэффективных процессоров типа ULV. Разработана она согласно стратегии «тик-так» и затрагивает ветвь «так». То есть, ядро было изготовлено без изменения технологического процесса, но с кардинальным изменением микроархитектуры относительно Broadwell.

Микропроцессор работает на новом высокопроизводительном сокете LGA 1151, поддерживает DDR4, а также, в отличие от LGA 1150 работает с USB 3.0, имеет новую, гораздо более производительную шину DMI3 и большую энергоэффективность по сравнению со своим предшественником.

Плюсы:

  1. Поддержка нового разъема LGA 1151, более производительного, чем LGA 1150 – сокет Broadwell
  2. Поддержка USB 3.0
  3. Возможность разогнать GPU на новом сокете
  4. Поддержка DDR4 и оптимизация работы с данной планкой ОЗУ
  5. Лучшая энергоэффективность относительно Broadwell
  6. Одно из главных достоинств - поддержка новой шины DMI 3, дающей в 2 раза большую скорость, чем DMI 2, на котором работают Broadwell и Haswell. Данное преимущество особенно заметно на примере такой программы, как Sony Vegas, где производительность Skylake выше почти в 1.5 раза
  7. Стоимость (для бюджетных моделей Intel Core I3 в среднем цена составляет 3000-7000 рублей)

Минусы:

Относительно Broadwell и Haswell только плюсы, в сравнении же с Kaby Lake 7-го поколения – новейшей микроархитектурой, которой оснащено пока небольшое количество процессоров, дает производительность на несколько процентов ниже.

Подведение итогов:

1 место: Skylake

2 место: Haswell (данная микроархитектура, как показали тесты, хоть и является более старшей и менее энергоэффективной, но по производительности отстает от Broadwell на 2-3 процента, при этом имеет более низкую стоимость)

3 место: Broadwell

4. Xeon Scalable

Компания Intel в 2017 году представила процессоры Xeon Scalable. Производитель позиционирует их как решения для вычислительных центров и инфраструктуры сетей. Как утверждается, по сравнению предшествующим поколением новые процессоры обеспечивают прирост производительности систем в 1,65 раза, а в приложениях искусственного интеллекта — в 2,2 раза.

К достоинствам новой платформы производитель относит расширение набора команд Intel AVX-512, внутрисистемное соединение ячеистой топологии Intel Mesh Architecture[4], поддержку технологий Intel QuickAssist[5], Intel Optane SSD[6] и Intel Omni-Path Fabric[7]. По оценке Intel, это дает возможность увеличить количество одновременно доступных виртуальных машин в 4,2 раза по сравнению с системами четырехлетней давности.

Процессоры Intel Xeon Scalable разделены на пять линеек. Верхняя — Intel Xeon Platinum 8100, в которую сведены наиболее производительные модели с числом ядер до 28, в том числе, поддерживающие работу в многопроцессорных системах с числом сокетов более восьми.

Далее следуют линейки Intel Xeon Gold 6100 и Intel Xeon Gold 5100. Входящие в них процессоры имеют до 22 и 14 ядер соответственно, и рассчитаны на работу конфигурациях с двумя и четырьмя процессорными гнездами. Процессоры Intel Xeon Gold 6100 поддерживают память DDR4-2666, Intel Xeon Gold 5100 — DDR4-2400.

Линейка Intel Xeon Silver 4100 относится к среднему сегменту, Intel Xeon Bronze 3100 — к начальному (позиционируется как замена Intel Xeon E3). Максимальное число ядер равно 12 и 8, а максимально поддерживаемая память — DDR4-2400 и DDR4-2133 соответственно.

Все процессоры, кроме Intel Xeon Bronze 3100, поддерживают технологии Intel Turbo Boost 2.0 и Intel Hyper-Threading. Все обладают 48 линиями PCIe 3.0.

Одновременно представлена марка Intel Select Solutions, под которой будут продвигаться решения, призванные упростить и развертывание ВЦ и сетевой инфраструктуры.

Первыми они будут доступны конфигурации для Canonical Ubuntu, Microsoft SQL 16 и VMware vSAN 6.6.

Ниже представлена сравнительная таблица характеристик топовых моделей разных классов.
 

 

Intel Xeon Bronze 3106

Intel Xeon Silver 4116

Intel Xeon Gold 6152

Intel Xeon Platinum 8180

Техпроцесс

14 нм (Skylake)

Стоимость

$316

$1012

$3661

$10009

Количество ядер

8

12

22

28

Количество потоков

8

24

44

56

Базовая частота, ГГц

1.7

2.1

2.1

2.5

L3 кэш, Мб

11

16.5

30.25

38.5

TDP[8], Вт

85

85

140

205

Тип памяти 

DDR4-2133

DDR4-2400

DDR4-2666

DDR4-2666

Количество каналов памяти

6

6

6

6

Число линий PCIe

48

48

48

48

Наборы инструкций

Intel SSE4.2, Intel AVX, Intel AVX2, Intel AVX-512

Функциональные новшества Xeon Scalable[9]:

  • Intel Volume Management Device (Intel VMD). Быстрые сервисы требуют быстрых хранилищ. Технология Intel VMD позволяет организовать набор различных NVMe устройств как единое логическое хранилище и презентовать его потребителям. Таким образом, для организации сетевого доступа к данным на PCIe накопителях более не требуются дополнительные устройства. Интеграция – необходимое условие масштабируемости.
  • Intel Virtual RAID on CPU (Intel VROC). Комбинированное аппаратно-программное решение, позволяющее создавать RAID различных уровней из PCIe накопителей.
  • Встроенный контроллер 4x10G Ethernet. По оценке Intel, сетевой интерфейс с суммарной производительностью 40 Гбит/с будет достаточным для подключения одной ноды. Опять-таки, согласно стратегии, он должен быть встроенным.
  • Remote Direct Memory Access (RDMA). Для эффективной кластеризации необходим прямой обмен содержимым памяти между приложениями на разных нодах. Новые сетевые контроллеры Intel Ethernet Connection X722 поддерживают RDMA с расширением iWARP (Internet Wide-Area RDMA Protocol), позволяющим передавать данные без дополнительного копирования и без задействования ядер операционных систем.

5.  Список Литературы

  1. https://de.wikipedia.org/wiki/Intel_Xeon_(Skylake)
  2. https://ark.intel.com/products/series/125191/Intel-Xeon-Scalable-Processors
  3. https://software.intel.com/en-us/articles/intel-xeon-processor-scalable-family-technical-overview
  4. https://geektimes.ru/company/intel/blog/292747/
  5. https://software.intel.com/en-us/articles/intel-xeon-processor-scalable-family-technical-overview
  6. https://www.ixbt.com/news/2017/07/11/intel-xeon-scalable.html
  7. http://itdistrict.ru/broadwell-ili-skylake-kakoy-protsessor-vyibrat/

[1] https://de.wikipedia.org/wiki/Intel_Xeon_(Skylake)

[2] ECC-память (англ. error-correcting code memory, память с коррекцией ошибок) — тип компьютерной памяти, которая автоматически распознаёт и исправляет спонтанно возникшие изменения (ошибки) битов памяти. 

[3] Kaby Lake — кодовое название микроархитектуры процессоров Intel Core 7-го поколения

[4] Ячеистая архитектура межсетевого взаимодействия Intel (Intel Mesh Architecture) представляет собой многоядерную архитектуру системного межсоединения, которая реализует синхронный, масштабируемый и широкополосный двумерный массив полуколец. Их ячеистая архитектура заменила архитектуру кольцевых соединений на рынках серверов и высокопроизводительных вычислений.

[5] Технология Intel® QAT оптимизирует производительность платформ и приложений. Технология позволяет использовать симметричное шифрование и аутентификацию, асимметричное шифрование, цифровые подписи, RSA, DH, ECC и сжатие данных без потерь.

[6] Энергонезависимая память Intel® Optane™ DC представляет собой новый класс памяти и технологии хранения, разработанный с учетом требований центров обработки данных. Эта память предлагает уникальную комбинацию высокой пропускной способности, доступности и энергонезависимости. Перемещение и поддержание больших объемов памяти ближе к процессору позволяет оптимизировать рабочие нагрузки и сервисы для сокращения уровня задержек и повышения производительности.

[7] Intel Omni-Path (иногда сокр. Intel OPA) — высокопроизводительная коммуникационная архитектура от компании Intel, предназначенная для высокопроизводительных вычислительных кластеров. 

[8] Конструктивные требования по теплоотводутребования по теплоотводу (англ. thermal design powerTDP) — величина, показывающая, на отвод какой тепловой мощности должна быть рассчитана система охлаждения процессора