Блог
Развитие двухпроцессорных серверных платформ. Часть 1 - многопоточность и многоядерность
- Подробности
- Категория: Блог
- Опубликовано: 22.11.2015 09:46
- Автор: ServersTech.ru
Целью сегодняшнего материала является обзор истории развития двухпроцессорных платформ в северном сегменте на примере продукции Intel, выбор которой обусловлен по ряду причин:
- серверы на базе процессоров Intel имеют значительно большую долю рынка, чем конкурирующие решения;
- двухпроцессорные решения компании Intel появились раньше, чем у AMD (имеют более длинную историю);
- процессоры компании Intel могут выполнять одновременно два потока на одном ядре (что весьма важно с точки зрения истории развития многопоточности).
Также следует отметить, что выбор х86-процессоров и двухпроцессорных платформ не случаен - это наиболее распространенное сочетание в серверном сегменте (в том числе и в списке TOP500).
Как известно, долгое время (до 2002 года) серверные процессоры были однопоточными, но использование двух- и четырех- процессорных материнских плат позволяло серверу выполнять одновременно несколько потоков. Так например, еще в 1995 году компания Intel предлагала двух- и четырех- процессорные серверные платформы на базе Pentium Pro. И до 2002 года ситуация кардинально не менялась (с точки зрения многопоточности).
В 2002 году компания Intel анонсировала технологию Hyper-Threading, что позволило на двухпроцессорных системах выполнять четыре потока (каждое ядро способно было выполнять одновременно два потока). Следующим шагом в развитии многопоточности был анонс процессоров Intel Xeon с двумя ядрами и технологией Hyper-Threading в 2005 году, что позволило выполнять одновременно восемь потоков на двухпроцессорных системах, а в 2009 уже 16... затем количество потоков постоянно росло и достигло 72 в 2014 году.
Рассмотрим детальнее эволюцию двухпроцессорных платформ, начиная с 2001 года - как последнего года однопоточных процессоров (для удобства все таблицы продублированы в отдельном материале).
Таблица 1 - 2001-2003
Год | 2001 | 2002 | 2003 |
Ядро | Foster | Prestonia | Gallatin |
Микроархитектура | NetBurst | NetBurst | NetBurst |
Модель | Xeon 2,0 | Xeon 2,8 | Xeon 3,2 |
Тех.процесс, нм | 180 | 130 | 130 |
Количество ядер/потоков, шт | 1/1 | 1/2 | 1/2 |
Тактовая частота/Turbo Boost, ГГц | 2,0/- | 2,8/- | 3,2/- |
Кэш L1d/L1i, КБ | 8/12 (Kµops) | 8/12 (Kµops) | 8/12 (Kµops) |
Кэш L2, КБ | 256 | 512 | 512 |
Кэш L3, КБ | - | - | 1024 |
ПСП, ГБ/с | 4,2 (2x DDR-266) | 4,2 (2x DDR-266) | 4,2 (2x DDR-266) |
ПС между процессорами, ГБ/с | 3,2 (FSB) | 4,3 (FSB) | 4,3 (FSB) |
TDP, Вт | 77,5 | 74 | 92 |
Как можно заметить, первые процессоры Xeon Foster с архитектурой NetBurst являлись однопоточными, но через год после их анонса (в 2002 году) компания Intel внедряет HT, что позволяет исполнять одновременно два потока на процессоре. Поскольку в рамках HT происходит разделение исполнительных устройств между потоками, то, несмотря на удвоение количества потоков, реальная производительность во многих приложениях поднимается на 5-30% (а в некоторых даже падает). Тем не менее первый шаг к увеличению количества потоков сделан. В 2003 году ничего не меняется с точки зрения многопоточности, хотя остальные характеристики процессора подросли.
Таблица 2 - 2004-2006
Год | 2004 | 2005 | 2006 |
Ядро | Nocona | Paxville DP | Clovertown |
Микроархитектура | NetBurst | NetBurst | Core |
Модель | Xeon 3,6 | Xeon 2,8 | Xeon X5355 |
Тех.процесс, нм | 90 | 90 | 65 |
Количество ядер/потоков, шт | 1/2 | 2/4 | 4/4 |
Тактовая частота/Turbo Boost, ГГц | 3,6/- | 2,8/- | 2,67/- |
Кэш L1d/L1i, КБ | 16/12 (Kµops) | 2х 16/2х 12 (Kµops) | 4x 32/4x 32 |
Кэш L2, КБ | 1024 | 2x 2048 | 2x 4096 |
Кэш L3, КБ | - | - | - |
ПСП, ГБ/с | 6,4 (2x DDR2-400) | 6,4 (2x DDR2-400) | 21,3 (4x FB-DIMM DDR2-667) |
ПС между процессорами, ГБ/с | 6,4 (FSB) | 6,4 (FSB) | 10,6 (FSB) |
TDP, Вт | 103 | 135 | 120 |
После появления НТ в 2002 году и до 2005 года количество потоков не менялось - процессоры могли одновременно выполнять два потока, а двухпроцессорная платформа - четыре. Увеличение производительности обеспечивалось за счет увеличения тактовой частоты, кэша, FSB, ПСП и др. параметров.
В 2005 году компания Интел представила 2-ядерные модели, что увеличило количество потоков вдвое - с четырех до восьми для двухпроцессорной платформы. Стоит заметить, что это последний год для архитектуры NetBurst - в 2006 году двухпроцессорные платформы будут базироваться на процессорах с архитектурой Core.
В 2006 году количество потоков осталось неизменным, но... если в 2005 процессоры были 2-ядерными, но 4-поточными (благодаря НТ), то в 2006 - от НТ компания Intel отказалась, но сохранить прежнее количество потоков удалось благодаря увеличению количества ядер с двух до четырех. Поскольку и сама архитектура Core была более производительной, и количество ядер удвоилось, 8-поточная платформа на базе процессоров Clovertown показывала значительно большую производительность, чем 8-поточная платформа на базе процессоров Paxville DP. То есть несмотря на сохранение количества потоков, производительность удалось значительно поднять. Стоит заметить, что такое количество потоков останется неизменным до 2008 года, а увеличение производительности будет происходить за счет наращивания частоты, кэша, FSB, ПСП и др. параметров.
Что касается НТ, то после отказа от NetBurst, начиная с 2006 и заканчивая 2008 годом включительно, процессорные ядра компании Интел являлись однопоточными.
Таблица 3 - 2007-2009
Год | 2007 | 2008 | 2009 |
Ядро | Harpertown | Harpertown | Gainestown |
Микроархитектура | Core | Core | Nehalem |
Модель | Xeon X5482 | XeonX5492 | XeonW5590 |
Тех.процесс, нм | 45 | 45 | 45 |
Количество ядер/потоков, шт | 4/4 | 4/4 | 4/8 |
Тактовая частота/Turbo Boost, ГГц | 3,2/- | 3,4/- | 3,33/3,6 |
Кэш L1d/L1i, КБ | 4x 32/4x 32 | 4x 32/4x 32 | 4x 32/4x 32 |
Кэш L2, КБ | 2x 6144 | 2x 6144 | 4х 256 |
Кэш L3, КБ | - | - | 8192 |
ПСП, ГБ/с | 25,6 (4x FB-DIMM DDR2-800) | 25,6 (4x FB-DIMM DDR2-800) | 2x 32 (3x DDR3-1333) |
ПС между процессорами, ГБ/с | 12,8 (FSB) | 12,8 (FSB) | 25,6 (QPI) |
TDP, Вт | 150 | 150 | 130 |
В 2009 году история повторяется (смотрим 2002 год) - количество потоков удалось удвоить благодаря технологии НТ, которую вновь внедрили в процессоры, - с 8 до 16 потоков. Также 2009 год можно считать переломным моментом - именно с этого года пойдет постоянное (ежегодное) увеличение количества потоков (исключения: 2011 год и, видимо, 2015).
Таблица 4 - 2010-2012
Год | 2010 | 2011 | 2012 |
Ядро | Westmere-EP | Westmere-EP | SandyBridge-EP |
Микроархитектура | Nehalem | Nehalem | Sandy Bridge |
Модель | Xeon X5680 | Xeon X5690 | Xeon E5-2687W |
Тех.процесс, нм | 32 | 32 | 32 |
Количество ядер/потоков, шт | 6/12 | 6/12 | 8/16 |
Тактовая частота/Turbo Boost, ГГц | 3,33/3,6 | 3,46/3,73 | 3,1/3,8 |
Кэш L1d/L1i, КБ | 6x 32/6x 32 | 6x 32/6x 32 | 8x 32/8x 32 |
Кэш L2, КБ | 6х 256 | 6х 256 | 8х 256 |
Кэш L3, КБ | 12288 | 12288 | 20480 |
ПСП, ГБ/с | 2x 32 (3x DDR3-1333) | 2x 32 (3x DDR3-1333) | 2x 51,2 (4x DDR3-1600) |
ПС между процессорами, ГБ/с | 25,6 (QPI) | 25,6 (QPI) | 2х 32 (QPI) |
TDP, Вт | 130 | 130 | 150 |
Если в 2009 году количество потоков платформы равнялось 16, то в 2010 - 24, в 2012 - 32, в 2013 - 48, а в 2014 - 72. То есть за пять лет компания Intel увеличила количество потоков и ядер в 4,5 раза! А за весь рассматриваемый период (2001-2014) количество ядер увеличилось в 18 раз, а количество потоков в 36 раз! При этом базовая тактовая частота осталась почти неизменной - в 2001 году она составляла 2,0 ГГц, а в 2014 - 2,3 ГГц. То есть увеличение производительность происходило преимущественно путем наращивания количества потоков и ядер (конечно, были и архитектурные изменения, но... это тема для отдельного материала).
Таблица 5 - 2013-2014
Год | 2013 | 2014 |
Ядро | Ivy Bridge-EP | Haswell-EP |
Микроархитектура | Sandy Bridge | Haswell |
Модель | Xeon E5-2697 v2 | Xeon E5-2699 v3 |
Тех.процесс, нм | 22 | 22 |
Количество ядер/потоков, шт | 12/24 | 18/36 |
Тактовая частота/Turbo Boost, ГГц | 2,7/3,5 | 2,3/3,6 |
Кэш L1d/L1i, КБ | 12x 32/12x 32 | 18x 32/18x 32 |
Кэш L2, КБ | 12х 256 | 18х 256 |
Кэш L3, КБ | 30720 | 46080 |
ПСП, ГБ/с | 2x 59,7(4x DDR3-1866) | 2x 68 (4x DDR4-2133) |
ПС между процессорами, ГБ/с | 2х 32 (QPI) | 2х 38,4 (QPI) |
TDP, Вт | 130 | 145 |
Забегая вперед, в 2016 году ожидается выход 22-ядерных процессоров, что повысит общее количество потоков до 88 и станет очередным шагом в развитии двухпроцессорных платформ.
В данном материале развитие двухпроцессорных серверных платформ было рассмотрено с точки зрения многопоточности и многоядерности, в следующих частях попытаемся проследить рост объема кэшей, увеличение ПСП и ПС межпроцессорных соединений. Продолжение следует...
Другие материалы по теме