Собираем рабочую станцию.
Рабочие станции во многом похожи на серверы, включая процесс валидации и тестирования для подготовки компьютера. Если вы используете рабочую станцию по назначению, то для неё недопустим «вылет» в середине выполнения задания. Она должна совмещать производительность уровня энтузиастов с надёжностью критически важного сервера.
По этой причине выбранные нами комплектующие отличаются от традиционных тестовых сборок Tom’s Hardware.
Содержание
Материнская плата Intel S5520SCR
Мы начали сборку с материнской платы Intel S5520SCR, которая стоит около $430 и предназначена для рабочих станций из-за своих слотов с 16 линиями PCI Express 2.0. На плате есть и множество других слотов расширения, но мы использовать их не планировали.
Плата оснащена двумя интерфейсами LGA 1366, каждый из которых позволяет установить любой из процессоров в линейке Xeon 5600. Всего на плате присутствуют 12 слотов памяти, по шесть на процессор, что даёт три канала на CPU с двумя слотами каждый. Материнская плата использует северный мост 5520 (он предоставляет 36 линий PCIe) и южный мост ICH10R. Платформа очень похожа на Intel X58 за исключением двух интерфейсов QPI к процессорам Xeon (в отличие от одного к Core i7).
Память 4 x Kingston KVR1333D3E9SK3/3G
Мы взяли четыре 3-Гбайт комплекта от Kingston, что дало 12 Гбайт в сумме. Небуферизованные модули с поддержкой ECC можно назвать приятным изменением по сравнению с горячими FB-DIMM, которые использовались в серверах с процессорами Xeon 5400.
Да и скорость передачи 1333 MT/s является вполне приличной. Помните, что high-end процессоры Xeon 5600 поддерживают память до DDR3-1333 с двумя слотами на канал, а процессоры линейки Xeon 5500 поддерживают DDR3-1333 только с одним слотом на канал. Поэтому переход на процессоры Xeon W5580 в нашем случае привёл к замедлению конфигурации памяти до DDR3-1066. Впрочем, как вы увидите в тестах, влияние этого шага на производительность памяти оказалось не таким ощутимым, если верить SiSoftware Sandra 2010.
Если вы планируете собирать собственную рабочую станцию, то следует помнить подобные детали конфигурации. Поскольку на плате доступны 12 слотов, то для расширения возможности богатые. Но для оптимальной производительности следует заполнять все три канала для обоих CPU, то есть модули должны устанавливаться, как минимум, в шесть слотов.
Nvidia Quadro FX 3800
Видеокарта не самая быстрая в профессиональной линейке Nvidia, однако в нашей лаборатории на момент тестов ничего более производительного не было. Да и эта модель достаточно быстрая, чтобы предотвратить появление «узких мест», связанных с GPU, в наших тестах сравнения процессоров.
Однако всё же одно следует помнить, особенно при оценке тестов Adobe CS5, что Quadro FX 3800 – одна из немногих карт в списке Adobe, которые обеспечивают ускорение CUDA через GPU. Конечно, движок Mercury Playback Engine не должен особо повлиять на наши тесты, но всё же следует отметить, что видеокарта присутствует в кратком списке поддержки.
2 x Intel X25-M 160 GB SSD
Для рабочей станции имеет смысл использовать high-end RAID-контроллер, чтобы все расчёты, связанные с подсистемой хранения, не ложились на плечи CPU, но наша простая конфигурация RAID 0 вряд ли вызовет проблемы. Поэтому мы решили отказаться от контроллера Intel RS2BL080, использовав вместо него подключения SATA 3 Гбит/с южного моста ICH10 с поддержкой Rapid Storage Technology.
При некоторых нагрузках, подобных монтажу видео, требуется существенная пропускная способность записи. Но пара 160-Гбайт твёрдотельных накопителей X25-M в RAID 0, которые мы использовали, для наших задач кажется даже чрезмерной.
Тестовая конфигурация
Аппаратное обеспечение | |
Процессоры | 2 x Intel Xeon X5680 (Westmere-EP) 3,33 ГГц, LGA 1366, 6,4 GT/s QPI, 12 Мбайт общего кэша L3, Hyper-Threading активна, функции энергосбережения включены 2 x Intel Xeon W5580 (Nehalem-EP) 3,2 ГГц, LGA 1366, 6,4 GT/s QPI, 8 Мбайт общего кэша L3, Hyper-Threading активна, функции энергосбережения включены 1 x Intel Core i7-980 Extreme (Gulftown) 3,33 ГГц, LGA 1366, 6.4 GT/s QPI, 12 Мбайт общего кэша L3, Hyper-Threading активна, функции энергосбережения включены |
Материнская плата | Intel S5520SCR (LGA 1366) Intel 5520/ICH10R, BIOS 50;53;28;112 |
Память | Kingston 12 Гбайт (12 x 1 Гбайт) DDR3-1333 ECC небуферизованная, KVR1333D3E9SK3/3G x 4 |
Накопители | 2 x Intel SSDSA2M160G2GC 160 Гбайт SATA 3 Гбит/с |
Видеокарта | Nvidia Quadro FX 3800 |
Блок питания | Chicony CPB09-003A 1000 W |
Системное ПО и драйверы | |
Операционная система | Windows 7 Ultimate 64-bit |
DirectX | DirectX 11 |
Графический драйвер | Quadro Driver 258.49 |
Тесты и настройки
дирование видео | |
TMPGEnc 4.7 | Version: 4.7.3.292, Import File: «Terminator II» SE DVD (5 Minutes), Resolution: 720×576 (PAL) 16:9 |
DivX 6.9.2 | Encoding mode: Insane Quality, Enhanced Multi-Threading, Enabled using SSE4, Quarter-pixel search |
Xvid 1.2.2 | Display encoding status=off |
HandBrake 0.9.4 | Version 0.9.4, convert first .vob file from The Last Samurai to .mp4, High Profile |
Приложения | |
Adobe After Effects | CS4 And CS5; Custom Workload, SD project with three picture-in-picture frames, source video at 720p |
Adobe Photoshop | CS4 And CS5; Custom Workload, Radial Blur, Shape Blur, Median, Polar Coordinates filters |
Adobe Premiere Pro | CS4 And CS5; Custom Workload, 1280x720p, 59.94 FPS video, Panasonic DVCPro100, HVX-200 camcorder on P2 media, Render to Work Area. |
Adobe Media Encoder | Custom Workload, Encode Premiere Pro project to h.264 for Blu-ray |
e-on Software Vue 8 PLE | 1920×1080 landscape render, Global Illumination enabled |
NewTek LightWave 3D 9.6 | Custom Workload, high-poly Tom’s Hardware logo; clone surface detail across logo (Modeler, script); OpenGL preview of 600-frame animation of Tom’s Hardware logo (Layout); 1.68 million polygon render of four captured frames using motion blur, ray-traced shadows, global illumination. |
Euler3D | CFD simulation over NACA 445.6 aeroclastic test wing at Mach .5 |
Autodesk MatchMover 2011 | Custom workload, 720p camera footage tracked in 3D space |
Синтетические тесты и настройки | |
SPECapc LightWave 9.6 | LightWave 3D Discovery Edition, Render and MT benchmark scores |
SPECviewperf 11 | Default GUI options; Workloads: CATIA, EnSight, LightWave, Maya, Pro/E, SolidWorks, Teamcenter Visualization Mockup, NX |
SiSoftware Sandra 2010 | CPU Test=CPU Arithmetic/Multimedia, Memory Test=Bandwidth Benchmark, Cryptography |
Cinebench 11.5 | CPU and GPU tests, Built-in benchmark |
Результаты тестов
Sandra 2010
Синтетические тесты лучше всего демонстрируют, на что способна данная аппаратная конфигурация, пусть даже в реальных приложениях мы не наблюдаем такого же результата. В тесте Sandra Arithmetic мы получаем линейную масштабируемость с одного Core i7-980X до пары Xeon X5680 — эквивалент пары 980X на той же материнской плате.
Масштабируемость Xeon W5580 вполне ожидаема. Но поскольку тактовая частота на 133 МГц ниже X5680, мы не получаем масштабируемость 66%, что привело бы к 196 GIPS и 141 GFLOPS на паре 3,33-ГГц CPU.
То же самое мы видим и здесь.Тест Sandra, будучи оптимизированным под столько потоков, сколько вы ему дадите, полностью использует доступные ресурсы на тестовых системах,масштабирование практически линейное.
При тестировании Core i7-980X, тест Sandra 2010 демонстрировал потенциал ускорения инструкций шифрования AES-NI на 32-нм процессоре, пропускная способность AES256 составила целых 11,1 Гбайт/с. Но в данном случае были получены не очень приятные новости от Intel.Если образец Core i7-980X поддерживал инструкции AES-NI,что подтверждала утилита CPU-Z,то эта функция не была активна на процессорах Xeon X5680 — что тоже подтверждается последней версией CPU-Z. В итоге пропускная способность AES новых процессоров существенно ниже, чем у 32-нм моделей для настольных ПК.
В целом же, конфигурации на нескольких сокетах масштабируются в зависимости от доступных вычислительных ресурсов, и тест SHA256 для пары Xeon X5680 даёт в два раза более высокую производительность,чем для Core i7-980X.
Одно из преимуществ перехода на линейку Intel Xeon 5600 заключается в поддержке режима памяти DDR3-1333 с двумя модулями на канал. Наша 12-слотовая конфигурация памяти с двумя сокетами и тремя каналами на CPU идеально подошла для проверки этого утверждения.
Плохая новость заключается в том, что мы не наблюдаем прироста пропускной способности при переходе на память DDR3-1333 с памяти DDR3-1066 у линейки Xeon 5500. К счастью, она уже составляет около 35 Гбайт/с, так что по пропускной способности памяти мы превзошли архитектуры предыдущего поколения, у которых контроллер памяти находился в чипсете, а сам чипсет подключался к CPU через шину FSB. Конечно, здесь масштабирование уже не 2:1 по сравнению с односокетным Core i7-980X, но пропускная способность увеличивается достаточно, чтобы оба шестиядерных процессора были загружены данными. Мы не обнаружили случаев, когда архитектура Westmere (Nehalem) «голодала» в ожидании получения данных через трёхканальный контроллер памяти.
SPECviewperf 11 и SPECapc LightWave 9.6
Недавно выпущенный тестовый пакет SPECviewperf 11 предназначается, главным образом, для измерения производительности графики OpenGL. Он содержит новые наборы viewset из последних версий LightWave, CATIA, EnSight, Maya, Pro/ENGINEER, SolidWorks, Siemens Teamcenter Visualization Mockup и Siemens NX.
SPECviewperf 11 | 2 x Xeon X5680 | 2 x Xeon W5580 | 1 x Core i7-980X |
catia-03 | 21,32 | 22,3 | 22,5 |
ensight-04 | 11,4 | 11,86 | 12,03 |
lightwave-01 | 40,06 | 40,87 | 41,88 |
maya-03 | 8,94 | 14,55 | 16,02 |
proe-05 | 7,74 | 8,09 | 9,21 |
sw-02 | 32,58 | 32,64 | 33,14 |
tcvis-02 | 16,24 | 16,66 | 16,41 |
snx-01 | 13,92 | 16,55 | 16,6 |
Мы надеялись получить высокую производительность в этих тестах, по крайней мере, из-за видеокарты Nvidia Quadro FX 3800 в нашей платформе. Но, увы, ситуация получилась даже обратной. Самые высокие результаты мы получили с одним CPU Core i7-980X — хотя разница, конечно, невелика.
Тест LightWave 9.6 дал нам три результата. Однако из-за пробной версии пакета мы не смогли провести их полностью. Сейчас мы решаем эту проблему с NewTek.
Но даже для пробной версии были получены интересные результаты в тестах Render и многозадачном прогоне (тест LightWave был специально адаптирован,чтобы выигрывать от многозадачности).Тест Render демонстрирует существенный прирост при переходе с одного сокета на двухсокетную конфигурацию Xeon W5580, а затем и на двухсокетную систему Xeon X5680. В тесте MT прирост уже не такой ощутимый, но он всё равно отдаёт преимущество паре Xeon X5680 над парой W5580, а последняя обгоняет один Core i7-980X.
Статья подготовлена по материалам сайта http://www.thg.ru .
3 комментария