Процессоры Intel Xeon Skylake
Шмитов Н. О.,
ВМК МГУ,
Москва, 2018
1. Введение
Серия Intel Xeon на основе микроархитектуры Intel Skylake – это семейство 64-разрядных микропроцессоров для серверов и рабочих станций от Intel. Эти многоядерные процессоры с четырьмя (E3) - 28 (SP) ядрами являются преемниками процессоров Intel Xeon Broadwell на базе микроархитектуры Intel Broadwell[1].
Xeons поколения Skylake появились в июне 2016 года только в версии для одной рабочей станции (называемой E3-v5). Эти модели отличаются от основных процессоров поколения Skylake в основном поддержкой основной памяти ECC[2].
Серверные процессоры NUMA масштабируемого процессора появились в июле 2017 года и отличаются внутренней структурой ядер (включая поддержку AVX-512), количеством каналов памяти, сокетов и других точек от E3-v5. Разновидностью этой серии серверов для рынка настольных ПК с четырьмя основными каналами памяти является серия Intel Core i9-7xxx, которая не относится к микроархитектуре Intel Kaby Lake[3] и также называется Skylake -X.
Существует и не серверный вариант, но он не будет рассматривать здесь, так как нам важны особенности серверных процессоров, архитектура которых направлена на как можно более эффективное управление сетевыми ресурсами, и обменом данных с серверным оборудованием (сетевые карты, диски, RAID-контроллерами и пр.).
2. Параметры модели
Каждая модель характеризуется следующими параметрами:
· Первая цифра четырехзначного кода продукта указывает, сколько процессоров этого типа можно использовать параллельно на материнской плате (количество сокетов, а не количество ядер).
· Тактовая частота (напрямую зависит от производительности одной задачи и определяет производительность для многих программ)
· Размер кэша (увеличивает пропускную способность)
· Количество ядер (увеличивает количество параллельно выполняемых задач)
· Тепловая расчетная мощность (TDP): рассеиваемая мощность ограничивает область применения, чем выше, тем больше должны быть рассчитаны система охлаждения и блок питания с тактовой частотой, количеством ядер и размером кэша.
· встроенный графический процессор (GPU): интересен только для рабочих станций с низкой производительностью 3D-графики
3. Сравнение процессоров Haswell, Broadwell и Skylake
На данный момент актуальными и конкурирующими между собой считаются микроархитектуры трех поколений от Intel. Это ядро 4-го поколения Haswell, 5-го поколения Broadwell и новейшая микроархитектура 6-го поколения Skylake. Как известно, в основе создания данных микроархитектур лежит экстенсивная стратегия под названием «Тик-так». «Тик» означает создание нового поколения процессоров на основе уменьшенного технологического процесса. «Так» же подразумевает выпуск новых микропроцессоров, но без изменения технологии создания. В статье будет проведен их сравнительный анализ и на его основе будет сделан вывод о наиболее производительном ядре.
Haswell
– микроархитектура, разработанная в 2012 году по 22 нм технологии. Поддерживает сокеты: LGA 1150, BGA 1364, LGA 2011-3. Работает с планкой ОЗУ DDR4. Шина: DMI2.
Плюсы процессора с данной микроархитектурой:
1) Энергоэффективный
2) Поддерживает DDR4
3) Низкая стоимость. К примеру, цена на Intel Core I3 4160 с ядром Haswell составляет 7800 рублей.
Минусы:
1) Изготовлен по устаревшей 22 нм технологии, в результате чего проигрывает по многим параметрам его улучшенной версии Broadwell.
Broadwell
– улучшенная версия Haswell, разработана для процессоров Intel серии Xeon, а также для седьмого поколения Intel Core I7. Изготовлена по 14 нм технологии. Принадлежит к ветви «тик» маркетинговой миссии «тик-так». По сравнению с Haswell имеет на 3-5% большую эффективность, чем Haswell, при этом потребляет энергии на 30%, также гораздо меньшее тепловыделение в ПК, 4.5 вт против 15 Haswell. Все это объясняется, прежде всего, уменьшенным технологическим процессом, по которому было изготовлено ядро, возможностью разгона процессора с данной микроархитектурой, а также наличием 4 кэша Crystalwell, дающего более высокую скорость обмена с ОЗУ, чем всего 3 кэша.
Плюсы ядра:
- Эффективное энергопотребление
- Возможность разгона
- Поддержка DirectX 12
- Именно в данной микроархитектуре получил распространение кэш L4, до сего использовавшийся лишь в редком числе микропроцессоров Haswell
- Более высокое время автономной работы, чем Haswell
Минусы:
- Стоимость (цена варьируется в пределах 13-150000 в зависимости от модели процессора, ибо предназначается данная микроархитектура для камней серии Xeon и Core I7 от Intel в то время как микропроцессор Haswell работает и на бюджетных камнях)
- Соотношение цены/качества. В тестах микроархитектура показало невысокие результаты, опередив Haswell приблизительно на 3 процента, в том числе и в 3D Mark (Core I7-6850K на Broadwell-E : 19065 очков, Core I7-5820 на Haswell-E– 16598 очков). Если рассматривать это относительно сравнения Ivy Bridge и Haswell, то результат не впечатляющий.
Skylake
– микроархитектура 6-го поколения, предназначенная, как и Haswell, в основном, для бюджетных энергоэффективных процессоров типа ULV. Разработана она согласно стратегии «тик-так» и затрагивает ветвь «так». То есть, ядро было изготовлено без изменения технологического процесса, но с кардинальным изменением микроархитектуры относительно Broadwell.
Микропроцессор работает на новом высокопроизводительном сокете LGA 1151, поддерживает DDR4, а также, в отличие от LGA 1150 работает с USB 3.0, имеет новую, гораздо более производительную шину DMI3 и большую энергоэффективность по сравнению со своим предшественником.
Плюсы:
- Поддержка нового разъема LGA 1151, более производительного, чем LGA 1150 – сокет Broadwell
- Поддержка USB 3.0
- Возможность разогнать GPU на новом сокете
- Поддержка DDR4 и оптимизация работы с данной планкой ОЗУ
- Лучшая энергоэффективность относительно Broadwell
- Одно из главных достоинств - поддержка новой шины DMI 3, дающей в 2 раза большую скорость, чем DMI 2, на котором работают Broadwell и Haswell. Данное преимущество особенно заметно на примере такой программы, как Sony Vegas, где производительность Skylake выше почти в 1.5 раза
- Стоимость (для бюджетных моделей Intel Core I3 в среднем цена составляет 3000-7000 рублей)
Минусы:
Относительно Broadwell и Haswell только плюсы, в сравнении же с Kaby Lake 7-го поколения – новейшей микроархитектурой, которой оснащено пока небольшое количество процессоров, дает производительность на несколько процентов ниже.
Подведение итогов:
1 место: Skylake
2 место: Haswell (данная микроархитектура, как показали тесты, хоть и является более старшей и менее энергоэффективной, но по производительности отстает от Broadwell на 2-3 процента, при этом имеет более низкую стоимость)
3 место: Broadwell
4. Xeon Scalable
Компания Intel в 2017 году представила процессоры Xeon Scalable. Производитель позиционирует их как решения для вычислительных центров и инфраструктуры сетей. Как утверждается, по сравнению предшествующим поколением новые процессоры обеспечивают прирост производительности систем в 1,65 раза, а в приложениях искусственного интеллекта — в 2,2 раза.
К достоинствам новой платформы производитель относит расширение набора команд Intel AVX-512, внутрисистемное соединение ячеистой топологии Intel Mesh Architecture[4], поддержку технологий Intel QuickAssist[5], Intel Optane SSD[6] и Intel Omni-Path Fabric[7]. По оценке Intel, это дает возможность увеличить количество одновременно доступных виртуальных машин в 4,2 раза по сравнению с системами четырехлетней давности.
Процессоры Intel Xeon Scalable разделены на пять линеек. Верхняя — Intel Xeon Platinum 8100, в которую сведены наиболее производительные модели с числом ядер до 28, в том числе, поддерживающие работу в многопроцессорных системах с числом сокетов более восьми.
Далее следуют линейки Intel Xeon Gold 6100 и Intel Xeon Gold 5100. Входящие в них процессоры имеют до 22 и 14 ядер соответственно, и рассчитаны на работу конфигурациях с двумя и четырьмя процессорными гнездами. Процессоры Intel Xeon Gold 6100 поддерживают память DDR4-2666, Intel Xeon Gold 5100 — DDR4-2400.
Линейка Intel Xeon Silver 4100 относится к среднему сегменту, Intel Xeon Bronze 3100 — к начальному (позиционируется как замена Intel Xeon E3). Максимальное число ядер равно 12 и 8, а максимально поддерживаемая память — DDR4-2400 и DDR4-2133 соответственно.
Все процессоры, кроме Intel Xeon Bronze 3100, поддерживают технологии Intel Turbo Boost 2.0 и Intel Hyper-Threading. Все обладают 48 линиями PCIe 3.0.
Одновременно представлена марка Intel Select Solutions, под которой будут продвигаться решения, призванные упростить и развертывание ВЦ и сетевой инфраструктуры.
Первыми они будут доступны конфигурации для Canonical Ubuntu, Microsoft SQL 16 и VMware vSAN 6.6.
Ниже представлена сравнительная таблица характеристик топовых моделей разных классов.
Intel Xeon Bronze 3106 |
Intel Xeon Silver 4116 |
Intel Xeon Gold 6152 |
Intel Xeon Platinum 8180 |
|
Техпроцесс |
14 нм (Skylake) |
|||
Стоимость |
$316 |
$1012 |
$3661 |
$10009 |
Количество ядер |
8 |
12 |
22 |
28 |
Количество потоков |
8 |
24 |
44 |
56 |
Базовая частота, ГГц |
1.7 |
2.1 |
2.1 |
2.5 |
L3 кэш, Мб |
11 |
16.5 |
30.25 |
38.5 |
TDP[8], Вт |
85 |
85 |
140 |
205 |
Тип памяти |
DDR4-2133 |
DDR4-2400 |
DDR4-2666 |
DDR4-2666 |
Количество каналов памяти |
6 |
6 |
6 |
6 |
Число линий PCIe |
48 |
48 |
48 |
48 |
Наборы инструкций |
Intel SSE4.2, Intel AVX, Intel AVX2, Intel AVX-512 |
Функциональные новшества Xeon Scalable[9]:
- Intel Volume Management Device (Intel VMD). Быстрые сервисы требуют быстрых хранилищ. Технология Intel VMD позволяет организовать набор различных NVMe устройств как единое логическое хранилище и презентовать его потребителям. Таким образом, для организации сетевого доступа к данным на PCIe накопителях более не требуются дополнительные устройства. Интеграция – необходимое условие масштабируемости.
- Intel Virtual RAID on CPU (Intel VROC). Комбинированное аппаратно-программное решение, позволяющее создавать RAID различных уровней из PCIe накопителей.
- Встроенный контроллер 4x10G Ethernet. По оценке Intel, сетевой интерфейс с суммарной производительностью 40 Гбит/с будет достаточным для подключения одной ноды. Опять-таки, согласно стратегии, он должен быть встроенным.
- Remote Direct Memory Access (RDMA). Для эффективной кластеризации необходим прямой обмен содержимым памяти между приложениями на разных нодах. Новые сетевые контроллеры Intel Ethernet Connection X722 поддерживают RDMA с расширением iWARP (Internet Wide-Area RDMA Protocol), позволяющим передавать данные без дополнительного копирования и без задействования ядер операционных систем.
5. Список Литературы
- https://de.wikipedia.org/wiki/Intel_Xeon_(Skylake)
- https://ark.intel.com/products/series/125191/Intel-Xeon-Scalable-Processors
- https://software.intel.com/en-us/articles/intel-xeon-processor-scalable-family-technical-overview
- https://geektimes.ru/company/intel/blog/292747/
- https://software.intel.com/en-us/articles/intel-xeon-processor-scalable-family-technical-overview
- https://www.ixbt.com/news/2017/07/11/intel-xeon-scalable.html
- http://itdistrict.ru/broadwell-ili-skylake-kakoy-protsessor-vyibrat/
[1] https://de.wikipedia.org/wiki/Intel_Xeon_(Skylake)
[2] ECC-память (англ. error-correcting code memory, память с коррекцией ошибок) — тип компьютерной памяти, которая автоматически распознаёт и исправляет спонтанно возникшие изменения (ошибки) битов памяти.
[3] Kaby Lake — кодовое название микроархитектуры процессоров Intel Core 7-го поколения
[4] Ячеистая архитектура межсетевого взаимодействия Intel (Intel Mesh Architecture) представляет собой многоядерную архитектуру системного межсоединения, которая реализует синхронный, масштабируемый и широкополосный двумерный массив полуколец. Их ячеистая архитектура заменила архитектуру кольцевых соединений на рынках серверов и высокопроизводительных вычислений.
[5] Технология Intel® QAT оптимизирует производительность платформ и приложений. Технология позволяет использовать симметричное шифрование и аутентификацию, асимметричное шифрование, цифровые подписи, RSA, DH, ECC и сжатие данных без потерь.
[6] Энергонезависимая память Intel® Optane™ DC представляет собой новый класс памяти и технологии хранения, разработанный с учетом требований центров обработки данных. Эта память предлагает уникальную комбинацию высокой пропускной способности, доступности и энергонезависимости. Перемещение и поддержание больших объемов памяти ближе к процессору позволяет оптимизировать рабочие нагрузки и сервисы для сокращения уровня задержек и повышения производительности.
[7] Intel Omni-Path (иногда сокр. Intel OPA) — высокопроизводительная коммуникационная архитектура от компании Intel, предназначенная для высокопроизводительных вычислительных кластеров.
[8] Конструктивные требования по теплоотводу, требования по теплоотводу (англ. thermal design power, TDP) — величина, показывающая, на отвод какой тепловой мощности должна быть рассчитана система охлаждения процессора