CPU

Тест серверного процессора Intel Xeon E3-1275v5


В четвертом квартале 2015 года компания Интел представила новую линейку процессоров Intel Xeon E3-1200v5 с микроархитектурой Skylake и новые серверные чипсеты, то есть полностью обновила платформу, сменив при этом еще и сокет, и тип ОЗУ. Сегодня редакция ServersTech.ru протестирует новую платформу LGA1151 на примере материнской платы SuperMicro X11SAE-F и процессора Intel Xeon E3-1275v5.

Материалы по микроархитектуре Skylake разделены на две части: в первой рассматривается развитие микроархитектуры Core, а во второй – производительность Intel Xeon E3-1275v5 в различных приложениях.
На страницах нашего ресурса уже выходили материалы по новой платформе LGA1151:
- обзор материнской платы Supermicro X11SAE-F на чипсете Intel C236;
- Пропускная способность DMI2.0 и DMI3.0;
- Производительность RAID-контроллера чипсета C236.
Но все эти материалы не затрагивали производительность процессора. Дабы исправить это, редакция ServersTech.ru протестирует Intel Xeon E3-1275v5, как типичного представителя микроархитектуры Skylake. Противостоять которому будет Intel Xeon E3-1276v3, функционирующий на тех же самых тактовых частотах (базовая/TurboBoost) и имеющий те же объемы кэшей - это позволит сравнить эффективность микроархитектур (с поправкой на разный ИКП). Таким образом, мы имеем пятое и третье поколения Intel Xeon E3-1200, исключая четвертое по следующим причинам: процессоры Intel Xeon E3-1200v4 имеют более низкие тактовые частоты и меньший объем кэша LLC (который компенсируется набортной eDRAM-памятью). Что не позволяет сравнить микроархитектуры в равных условиях.
Обобщая вышеизложенное, в сегодняшнем материале мы протестируем процессоры Intel Xeon E3-1275v5 и Intel Xeon E3-1276v3 в реальном режиме работы, то есть с включенными технологиями TurboBoost и HyperThreading.

  Intel Xeon E3-1276v3 Intel Xeon E3-1275v5
Дата анонса 2 квартал 2014 4 квартал 2015
Сокет 1150 1151
Микроархитектура Haswell Skylake
Тех.процесс, нм 22 14
Количество ядер/потоков, шт. 4/8 4/8
Базовая/TurboBoost частота, ГГц 3.6/4.0 3.6/4.0
Объем LLC, МБ 8 8
Интегрированная графика Intel HD P4600 Intel HD P530
Количество EU, шт. 20 24
Базовая/максимальная частота iGPU, МГц 350/1250 400/1150
DirectX/OpenGL 11.2/4.3 12/4.4
Тип ОЗУ DDR3-1600 DDR4-2133
Пропускная способность памяти, ГБ/с 25.6 34.1
Максимальный объем ОЗУ, ГБ 32 64
Системная шина DMI2.0 5GT/s DMI3.0 8GT/s
TDP, Вт 84 80
Рекомендуемая стоимость, $ 339 339

Как можно заметить, частоты обоих процессоров одинаковые, поэтому быстродействие будет зависеть от архитектурных изменений, пропускной способности памяти, а также от агрессивности технологии TurboBoost. Если процессорная часть «по цифрам» выглядит одинаково (частота и объемы кэшей), то графическая часть претерпела куда больше изменений – выросло количество исполнительных блоков с 20 до 24 EU, появилась поддержка DirectX 12 и OpenGL 4.4, правда ценой снижения частоты графического процессора. Помимо всего прочего подросла и пропускная способность системной шины DMI с 5 до 8 GT/s, повысив тем самым скорость обмена информацией между процессором и PCH.
Несмотря на обширный список изменений, TDP новых процессоров снизилось с 84 до 80 Вт, что обусловлено переходом на новый тех.процесс 14нм, тогда как в Haswell используется 22нм.

1276v3 cpuz

Представитель микроархитектуры Haswell - Intel Xeon E3-1276v3.

1275v5 cpuz

Представитель микроархитектуры Skylake - Intel Xeon E3-1275v5.

Как уже отмечалось в материале по микроархитектуре Skylake, кэш второго уровня стал 4-путным – посмотрим, как это скажется на его производительности. Смотря на CPU-Z, можно заметить, что у Haswell отсутствует поддержка TSX – последняя версия BIOS отключает данный набор в связи с ошибкой в нем, в то время как Skylake поддерживает данный набор инструкций.

1276v3 gpuz

Интегрированная графика Intel HD Graphics P4600 в процессорах Intel Xeon E3-1200 третьего поколения.

1275v5 gpuz

Интегрированная графика Intel HD Graphics P530 в процессорах Intel Xeon E3-1200 пятого поколения.

Утилита GPU-Z некорректно отображает тактовую частоту графического адаптера – надеемся, что в новой версии ПО исправят данный «промах». Что касается характеристик, то новое графическое ядро поддерживает все современные API, а также имеет более мощную аппаратную составляющую.

1275v5 cpu

Последнее, что следует отметить перед тестированием: сырость BIOS материнской платы Supermicro X11SAE-F и драйверов для видеокарты Intel HD Graphics P530, что может повлиять на конечный результат платформы LGA1151 (при появлении новой версии BIOS и драйверов актуально провести дополнительное тестирование).

1275v5 cpu 2

Тестовый стенд 1: Intel Xeon E3-1276v3, Supermicro X10SAE, Kingston DDR3-1600 ECC 8GB

Тестовый стенд 2: Intel Xeon E3-1275v5, Supermicro X11SAE-F, Samsung DDR4-2133 ECC 8GB

Детализация

Платформа LGA1150
- Процессор: Xeon E3-1276v3 (HT on; TB on);
- Материнская плата: Supermicro X10SAE;
- Оперативная память: 4x Kingston DDR3-1600 ECC 8GB (KVR16LE11/8);
- ОС: Windows Server 2012R2.
Платформа LGA1151
- Процессор: Xeon E3-1275v5 (HT on; TB on);
- Материнская плата: Supermicro X11SAE-F;
- Оперативная память: 4x Samsung DDR4-2133 ECC 8GB (M391A1G43DB0-CPB);
- ОС: Windows Server 2012R2.

Методика тестирования

- 3DMark06 1.21;
- 7zip 15.14;
- AIDA64 5.60;
- Cinebench R15;
- Fritz 4.2;
- Geekbench 3.4.1;
- LuxMark v3.1;
- MaxxMEMI 1.99;
- PassMark v8;
- RealBench v2.43;
- SiSoftware Sandra 2016;
- SVPmark v3.0.3b;
- TrueCrypt 7.1a;
- WinRAR 5.30;
- wPrime 2.10;
- x264 v5.0.1;
- x265 v0.1.4;
- Kraken;
- Octane;
- Octane 2.0;
- Peacekeeper;
- SunSpider;
- WebXPRT.


AIDA64

1275v5 aida 1

Несмотря на более высокие тайминги у DDR4, итоговая латентность оказалось ниже, чем у DDR3, благодаря более высокой тактовой частоте. Что касается теоретической пропускной способности памяти, то переход с DDR3-1600 на DDR4-2133 поднял ее с 25,6 до 34,1 ГБ/с, а реальную - с 22-23 до 30-32 ГБ/с. Необходимо отметить, что если раньше эффективность контроллера памяти была на уровне 86-91%, то теперь она поднялась до 87-94%.

1275v5 aida 2

Учитывая высокий разброс результатов от прохода к проходу (+/-5%), производительность можно считать одинаковой – исключение Photoworxx, где Intel Xeon E3-1275v5 значительно превосходит Intel Xeon E3-1276v3.

1275v5 aida 3

В целом в операциях с плавающей точкой производительность процессоров условно одинаковая (с поправкой на разброс результатов от прохода к проходу).

1275v5 aida 4

Пропускная способность кэша первого уровня несколько снизилась, но здесь следует учитывать, что конечный результат зависит от тактовой частоты при проведении теста, то есть зависит от TurboBoost (тестирование данных процессоров с отключенной технологией TurboBoost будет выведено в отдельный материал).

1275v5 aida 5

Переработанный кэш второго уровня с измененной ассоциативностью явно стал быстрее – такую разницу не перекрыть разными частотами проведения теста. Скорость копирования выросла на 53%, а скорость записи на 63%. Очень достойный результат! (как минимум, Интел не сидит на месте, а активно развивает архитектуру Core - другое дело, что увеличение скорости того или иного компонента на 50 и более процентов редко приводит к аналогичному ускорению всего процессора).

1275v5 aida 6

Несмотря на то, что латентность кэша третьего уровня у Skylake выше, чем у Haswell, его пропускная способность существенно подросла: скорость копирования на 46%, а чтения на 34%.

1275v5 aida 7

Бенчмарк AIDA64 содержит также тесты для графической карты, где Intel Xeon E3-1275v5 выглядит намного привлекательнее, чем Intel Xeon E3-1276v3, так например, в целочисленных операциях (24 и 32 бита) P530 в два с лишним раза быстрее P4600.


SiSoftware Sandra

1275v5 sandra 1

Наибольший прирост производительности при переходе с Haswell на Skylake наблюдается в научных вычислениях – 33%, а наименьший – в арифметике. Средний же прирост составил около 21% - вполне неплохой результат, учитывая одинаковые тактовые частоты!

1275v5 sandra 2

Использование фреймворка .NET сводит все архитектурные изменения на нет: 8% прироста для арифметических операций и 14%-ый спад в мультимедия.

1275v5 sandra 3

Наибольший прирост производительности наблюдается в задачах криптографии – 80%. Несмотря на значительно возросшую латентность памяти для GPU, ее пропускная способность существенно подросла – с 12,19 до 17,31 ГБ/с. Стоит заметить, что высокая латентность памяти никак не отразилась на результатах (вероятно, данный бенчмарк некорректно ее определяет).

1275v5 sandra 4

Что касается графической производительности, то здесь можно заметить увеличение производительности на 57%. Достойный результат!

1275v5 sandra 5

Компания Интел явно переработала все кэши, так как пропускная способность у Intel Xeon E3-1275v5 заметно выше, чем у Intel Xeon E3-1276v3, при этом их тактовые частоты условно равны (технология TurboBoost вносит некоторую погрешность).

1275v5 sandra 6

Тест транзакционной памяти интересен тем, что до обновления BIOS платформа LGA1150 показывала схожую производительность с новым поколением Intel Xeon E3-1200, но после… когда новый BIOS отключил поддержку набора инструкций TSX в Haswell (в связи с ошибкой в данном наборе), скорость заметно упала.


MaxxMEMI

1275v5 maxxmemi 1

Как и следовало ожидать пропускная способность памяти у новой платформы существенно выше благодаря использованию более быстрой памяти. Важно отметить, что если в AIDA64 наблюдается рост эффективности ИКП (отношение реальной ПСП к теоретической), то в MaxxMEMI – наоборот.

1275v5 maxxmemi 2

Несмотря на более высокие тайминги у DDR4, итоговая латентность оказалась ниже – сказывается более высокая тактовая частота или оптимизации контроллера памяти?

Cinebench R15

1275v5 cb 1

В данном бенчмарке как в однопоточном, так и в многопоточном режимах, Skylake показал на 8% большую производительность, чем Haswell.

1275v5 cb 2

Графическая карта нового поколения показала на 35% большую производительность. Что в очередной раз подтверждает, что компания Интел делает больший упор на графику, а не на процессор.

Fritz

1275v5 fritz 1

Данный бенчмарк уравнял обе архитектуры.


LuxMark

1275v5 luxmark 1

Задачи, способные задействовать и CPU, и GPU, значительно ускоряются при переходе с Haswell на Skylake – на 25%. А вот чисто процессорные – лишь на 12%.

RealBench

1275v5 realbench 1

Средний прирост производительности составил около 17%. При этом наибольший эффект от перехода с Haswell на Skylake наблюдается в сценарии Image Editing – 47%. Важно отметить, что в OpenCL Skylake показал себя хуже Haswell, что весьма сомнительно, так как в других тестах это не подтверждается.

SVPmark

1275v5 svpmark 1

В данном бенчмарке наибольший прирост производительности наблюдается в подтесте Real-life – 27%, а наименьший – Synthetic GPU – 7%.


Geekbench

1275v5 geekbench 1

В однопоточном режиме наибольший прирост наблюдается в тесте памяти - 30%, что неудивительно - ведь новая платформа перешла на более быструю DDR4-2133. А наименьший – в целочисленной арифметике - всего лишь 2%.

1275v5 geekbench 2

Многопоточный режим увеличивает разрыв между тестируемыми процессорами – сказывается повышение эффективности HT благодаря значительно увеличенной очереди декодированных инструкций?

PassMark

1275v5 passmark 1

Наибольший прирост наблюдается в тесте 3D-графики, при этом в 2D – напротив спад. Это обусловлено сырыми драйверами, так как данный подтест был пройден не с первого раза - некоторые попытки заканчивались критическим сбоем драйвера.

3DMark06

1275v5 3dmark 1

В данном бенчмарке прирост производительности превысил 50%, причем портит всю картину подтест CPU, где прирост производительности всего 30%, тогда как графика подросла на 60-65%. В целом же эволюция графических ядер Интел выглядит более убедительной, чем процессорных.


wPrime

1275v5 wprime 1

Прирост невелик, но он всё же есть.

1275v5 wprime 2

Encoder

1275v5 sandra 7

Если в х264 пятое поколение опережает третье на 7-10%, то в х265 – на 65%! Отличная новость для тех, кто работает с видео.

TrueCrypt

1275v5 truecrypt 1

Наибольший прирост наблюдается в подтесте Serpent – 16%, а наименьший в AES – 8%. Но по абсолютной скорости, конечно, AES-шифрование самое быстрое – сказывается аппаратная поддержка данного алгоритма.


7zip

1275v5 7z 1

В однопоточном режиме ситуация неоднозначная: с одной стороны пятое поколение превосходит третье в упаковке на 16%; с другой – отстает на 13% в распаковке. Вероятно, сказываются более высокие тайминги?

1275v5 7z 2

При этом в многопоточном тесте всё встаёт на свои места – и в распаковке, и в сжатии новое поколение быстрее конкурента на 6-9% (вероятно, возросшая эффективность HT нивелирует увеличение таймингов).

WinRAR

1275v5 winrar 1

В однопоточном режиме Intel Xeon E3-1275v5 опережает Intel Xeon E3-1276v3 на 26%, а в многопоточном – на 18%. Вполне неплохой прирост!


Browser benchmark

Все бенчмарки проводились в Firefox 45.

1275v5 browser 1

Наибольший прирост наблюдается в тестах Octane – 58% и Octane 2.0 – 37%. А наименьший в SunSpider – 4%. Несмотря на то, что javascript максимально оторван от аппаратного обеспечения, бенчмарки оказались весьма чувствительными к архитектурным изменениям! Да и прирост получился весьма серьезным.


Температурный режим

1275v5 temp 1

Снижение TDP явно не прошло даром: Skylake значительно холоднее Haswell – разница в 12 градусов при использовании кулера Noctua NH-C14. Всё-таки переход на более тонкие технологические нормы явно сказался положительно.

Энергопотребление

1275v5 power 1

Что касается энергопотребления, то картина следующая: в простое система на базе Skylake потребляет даже несколько больше, чем на базе Haswell (причина в разном оснащении микроконтроллерами материнских плат). Но под максимальной нагрузкой энергопотребление платформы LGA1151 заметно ниже, чем у LGA1150. Также из данных результатов можно заметить, что блок питания под малой нагрузкой имеет достаточно низкий КПД – это косвенно видно по соотношению ВА и Вт.


Заключение

Поскольку это первая статья из цикла по процессорам с микроархитектурой Skylake, то ограничимся лишь промежуточным выводом – выводом по платформе LGA1151, а не по микроархитектуре.
Новая платформа показала в очередной раз приоритеты Интел: процессорная производительность незначительно увеличилась, в то время как производительность графической карты нового поколения существенно стала выше. Но помимо архитектурных изменений в процессоре, произошли и другие: DDR3-1600 сменилась DDR4-2133, а максимальный поддерживаемый объем ОЗУ вырос с 32 до 64ГБ; пропускная способность системной шины также подросла - с 5 до 8 GT/s; повысилась энергоэффективность платформы; и снизилась температура процессора.
Суммируя всё вышеперечисленное… платформа LGA1151 получилась весьма стоящей – конечно, революции не произошло, но движение вперед есть по всем фронтам.
Что касается целесообразности перехода с Haswell на Skylake, то данный переход в рамках корпоративной сферы маловероятен, так как с анонса третьего поколения Intel Xeon E3-1200 прошло всего полтора года, тогда как средний срок эксплуатации серверов составляет 5-7 лет. То есть приобретение Intel Xeon E3-1200 пятого поколения возможно либо в рамках расширения парка серверов и рабочих станций, либо когда производительности текущих серверов недостаточно, но при этом надо понимать, что существенный скачок производительности наблюдается только в OpenCL-задачах.
Продолжение следует...

0 logo low

Copyright © by ServersTech.ru, 2015-2018. Копирование запрещено.
Коммерческие предложения, сотрудничество и реклама: cooperation@serverstech.ru
Предложения, вопросы и пожелания читателей: readership@serverstech.ru
Copyright © 2015-2018 ServersTech.ru. Все права сохранены
Copyright © 2015-2018 ServersTech.ru. All rights reserved