
Материнские платы
Чипсеты C226 и C236: DMI 2.0 vs DMI 3.0
- Подробности
- Категория: Материнские платы
- Опубликовано: 10.05.2016 07:56
- Автор: ServersTech.ru
Содержание материала

Компоновка «процессор — северный мост — южный мост» ушла в прошлое, но, несмотря на это, шина между процессором и чипсетом (PCH - Platform Controller Hub), осталась и называется DMI (Direct Media Interface), пропускная способность которой на сегодняшний день утилизируется дисковой подсистемой, интегрированными сетевыми адаптерами, USB-устройствами и прочей периферией. Сегодня редакция ServersTech.ru измерит максимальную пропускную способность дисковой подсистемы для платформ LGA1150 c DMI 2.0 и LGA1151 c DMI 3.0.
Ранее от пропускной способности шины между процессором и чипсетом зависела скорость обращения к памяти, видеокарте и прочей периферии, то есть производительность всей системы зависела от нее. После «переезда» контроллеров памяти и PCI Express в ЦП основные потребители ПС стали напрямую взаимодействовать с ним, минуя посредников. А на DMI осталась вся остальная периферия.
Когда Интел представила в 2004 году DMI с суммарной ПС в обоих направлениях 2ГБ/с, требовательных к ПС потребителей на шине не было – производительные SSD еще не появились, а скорость чтения/записи жестких дисков (7200rpm) тех времен не превышала 150 МБ/с.
Позднее появились производительные SSD и их широкое распространение стимулировало Интел анонсировать в 2011 году DMI 2.0 с пропускной способностью 2 ГБ/с в каждом направлении, что равноценно ПС 3-4 производительных SSD с интерфейсом SATA 3.0.
Сегодня всё большее распространение получают твердотельные накопители с интерфейсом M.2, скорость чтения/записи которых зачастую превышает 2 ГБ/с - пропускной способности DMI 2.0 для них недостаточно. Поэтому в 2015 году компания Intel представила вместе с новой платформой LGA1151 и обновленную версию интерфейса DMI 3.0, пропускная способность которого составляет около 4 ГБ/с в каждом направлении. В целом такая теоретическая ПС позволяет подключить большое количество накопителей, но даже сейчас ее недостаточно для реализации всего потенциала чипсета С236, который располагает 20 линиями PCI Express 3.0, 8 портами SATA 3.0, 10 портами USB 3.0, сетевыми адаптерами и т.д..
В данном материале редакция ServersTech.ru протестирует платформы LGA1150 c DMI 2.0 и LGA1151 c DMI3.0, чтобы замерить максимальную пропускную способность дисковой подсистемы. Теоретически пропускной способности DMI 2.0 должно хватить на 3-4 твердотельных накопителя с интерфейсом SATA 3.0, а DMI 3.0 – на 6-7. Если практика подтвердит теорию, то, пожалуй, появится еще одна причина для перехода с Haswell на Skylake.
Для тестирования были выбраны твердотельные накопители Kingston KC300 120ГБ, на базе которых создавались RAID0-массивы из двух, четырех и шести дисков на обоих чипсетах, при этом размер полосы (Strip) для всех конфигураций был – 128КБ (Рекомендованный размер полосы для C226 - 128 КБ, а для С236 – 16КБ для 2-дискового массива и 32КБ для 4- и 6- дисковых массивов. Но для уравнивания условий размер полосы был одинаковым для всех - 128 КБ).
Тестовый стенд 1: Intel Xeon E3-1276v3, Supermicro X10SAE, Kingston DDR3-1600 ECC 8GB, Kingston KC300
Тестовый стенд 2: Intel Xeon E3-1275v5, Supermicro X11SAE-F, Samsung DDR4-2133 ECC 8GB, Kingston KC300
Детализация
Платформа LGA1150 (DMI 2.0)
- Процессор: Xeon E3-1276v3 (HT on; TB on);
- Материнская плата: Supermicro X10SAE (чипсет C226);
- Оперативная память: 4x Kingston DDR3-1600 ECC 8GB (KVR16LE11/8);
- ОС: Windows Server 2012R2.
Платформа LGA1151 (DMI 3.0)
- Процессор: Xeon E3-1275v5 (HT on; TB on);
- Материнская плата: Supermicro X11SAE-F (чипсет C236);
- Оперативная память: 4x Samsung DDR4-2133 ECC 8GB (M391A1G43DB0-CPB);
- Накопители: 6х Kingston KC300 120ГБ;
- ОС: Windows Server 2012R2.
Методика тестирования
- CrystalDiskMark v5.1 x64;
- ATTO Disk Benchmark v3.05;
- Anvil's Storage Benchmark v1.1.0.
CrystalDiskMark (50MB)
В тесте последовательных операций ситуация неоднозначная – в операциях чтения массивы на С236 быстрее, чем на предшественнике С226, в то время как в операциях записи новинка от Интел опередила предшественника лишь при использовании 6 дисков – вероятно, причина в «сыром» BIOS.
Новый чипсет С236 показывает большую производительность в операциях с 4К-блоками – причем как в операциях чтения, так и записи.
Использование очереди заметно поднимает скоростные показатели для обоих чипсетов, с той лишь разницей, что на С226 дисковая подсистема «упирается» в ПС DMI 2.0 – разница между 4- и 6- дисковыми RAID0 минимальна. Чего не скажешь про С236 – 6-дисковый массив заметно быстрее 4-х дискового, но ситуация с более низкой скоростью записи на 2- и 4- дисковых массивах повторяется.
Использование очереди несколько меняет ситуацию – С236 показывает большую скорость записи, а С226 – чтения.
CrystalDiskMark (100MB)
Увеличение объема задания по сути ничего не меняет – С236 показывает большую скорость чтения, а С226 на 2- и 4- дисковых массивах показывает большую скорость записи.
В данном подтесте ничего не изменилось – С236 лучше «переваривает» 4К-блоки, чем предшественник (но при отсутствии очереди).
В данном подтесте ситуация не изменилась – С226 не может перешагнуть планку 1,7 ГБ/с, в то время как 6-дисковый массив на С236 преодолел рубеж в 2 ГБ/с, правда при этом 2- и 4- дисковые массивы на нем несколько медленнее в операциях записи, чем на предшественнике.
CrystalDiskMark (500MB)
Пожалуй, без комментариев – увеличение объема задания принципиально не меняет картины – твердотельные диски «не видят» разницы в объеме задания, чего не скажешь про жесткие диски, где чем меньше объем, тем выше скорость.
Увеличение объема задания принципиально ничего не изменило – новый чипсет Интел для Xeon E3-1200v5 лучше «переваривает» 4К-блоки, чем предшественник.
Результаты данного подтеста вполне могут быть решающим аргументом в пользу смены Haswell на Skylake: 4-дисковый массив на С236 значительно опережает 6-дисковый массив на С226 в операциях последовательного чтения.
ATTO Disk Benchmark
Результаты тестирования в ATTO кардинально отличаются от полученных в CrystalDiskMark: 6- и 4- дисковые массивы имеют почти равную производительность на каждом из чипсетов. Такое поведение может говорить о том, что и С226, и С236 «упираются» не в ПС шины, а в производительность самого RAID-контроллера (при этом «польза» от подобных результатов всё равно есть – RAID-контроллер на С236 явно производительнее, чем таковой на С226). Также следует отметить, что на малых блоках двухдисковый массив на C236 значительно превосходит таковой на С226.
С записью ситуация меняется – на малых блоках производительность у всех участников сопоставимая. А уже после 32КБ 6-и 4- дисковые массивы на С236 уходят далеко вперед, оставляя позади таковые на С226. Что снова говорит о том, что RAID0-массивы «упираются» либо в ПС DMI, либо в производительность RAID-контроллера. Что касается двухдисковых массивов, то на обоих чипсетах результаты сопоставимые.
Anvil's Storage Benchmark
В Anvil’s Storage Benchmark только 4-дисковый массив на чипсете С236 показал меньшую производительность на операциях записи, чем С226, в остальных случаях RAID0-массивы на С236 всегда опережают С226, при этом по мере роста количества накопителей отрыв увеличивается.
Делая промежуточные выводы, можно сказать следующее: массивы RAID0 на C226 перестают масштабироваться после 4 дисков, а на С236 6-дисковый массив лишь незначительно быстрее 4-дискового, при этом если смотреть на производительность одиночного накопителя Kingston KC300 120ГБ, то видно, что достигнутые результаты на С226 характерны для трех SSD, а на С236 – для пяти. Поэтому необходимо провести дополнительное тестирование следующих RAID0-массивов: 3-дисковый массив на C226 и 5 дисковый на C236. Также следует отметить, что BIOS RAID-контроллера рекомендует для 6-дисковых массивов на С236 размер полосы в 32 КБ, тогда как для уравнивания «всех» все тесты делались с полосой 128 КБ, поэтому необходимо добавить еще одного участника – 6-дисковый массив на С236 с размером Strip’а 32 КБ.
CrystalDiskMark (50MB)
При последовательном чтении 6-дисковый массив всё же быстрее 5-дискового как в операциях чтения, так и записи, чего не скажешь про 3- и 4- дисковые, где только в операциях записи «удается» получить выигрыш от добавления еще одного накопителя.
Полученные результаты показывают, что: размер полосы незначительно влияет на производительность 6-дисковых массивов на С236; 5-дисковый массив идет вровень с 6-дисковым; 3- и 4- дисковые массивы имеют одинаковую производительность.
Результаты данного подтеста показывают: размер полосы практически не влияет на производительность 6-дисковых массивов; 5-дисковый массив значительно медленнее 6-дискового; 4-дисковый массив показывает значительный прирост от добавления еще одного накопителя только в операциях записи.
В операциях чтения массив с размером Strip’а 32КБ показывает больший результат, чем с 128КБ, но в операциях записи ситуация противоположная. Что касается 5- и 3- дисковых массивов, то они лишь немного отстают от 6- и 4- дисковых соответственно.
CrystalDiskMark (100MB)
В операциях последовательного чтения/записи без использования очереди не получается реализовать весь потенциал многодисковых массивов.
Увеличение объема задания, как и ранее, не меняет «картину». Комментарии излишни.
Добавление еще одного накопителя к 3- и 5- дисковым массивам всё же дает результат как для С226, так и С236 – особенно в операциях записи.
CrystalDiskMark (500MB)
В данном подтесте стоит отметить, что в операциях чтения массивы с нечетным количеством накопителей оказываются быстрее, чем с четным и большим количеством, например, 5-дисковый массив преодолевает рубеж 1,8 ГБ/с, в то время как 6-дисковый выдает всего лишь 1,56 ГБ/с.
Как уже отмечалось выше, работа с 4К-блоками без использования очереди не позволяет реализовать потенциал даже 3-дискового массива.
В данном подтесте с увеличением количества накопителей растет и производительность, но непропорционально – добавление дополнительного накопителя лишь незначительно сказывается на конечных результатах, особенно на результатах 5- и 6- дисковых массивов.
В данном подтесте ситуация неоднозначная: 5- и 6- дисковые массивы имеют схожую производительность (за исключением скорости чтения 6-дискового массива с полосой 32КБ), в то время как 4-дисковый массив значительно опережает 3-дисковый.
ATTO Disk Benchmark
В ATTO 6- и 5- дисковые массивы показали примерно одинаковую производительность, при этом графики получились ломанными. Массив из четырех дисков показывает большую производительность, чем 3-дисковый, но график последнего более стабилен.
В данном подтесте единственное, что следует отметить, так это сильный провал производительности на крупных блоках у 5-дискового массива.
Anvil's Storage Benchmark
В Anvil’s Storage Benchmark 6-дисковый массив с полосой 128КБ показывает наибольшую производительность, опережая массив с рекомендованной полосой 32КБ. В то же время разница между 5- и 6- дисковыми массивами невелика.
Заключение
В качестве заключения можно сказать, что новая платформа не только увеличила количество портов SATA 3.0 с 6 до 8, но и повысила производительность дисковой подсистемы. Поэтому переход с Haswell на Skylake будет целесообразным, если требуется быстрая дисковая подсистема. Но в целом пропускной способности DMI 3.0 для реализация всего потенциала чипсета С236 недостаточно - использование производительных твердотельных накопителей с интерфейсом М.2 только усугубит ситуацию. Важно отметить, что представленные накопители Интел с памятью 3D Xpoint будут сдерживаться недостаточной ПС DMI 3.0 (особенно при установке нескольких подобных накопителей), поэтому в будущем чипсете для нового поколения Intel Xeon E3-1200 необходимо значительно увеличить пропускную способность DMI.