|
Зависимость производительности процессора от размера кэшу L2  Вступление
Первым процессором, который изготовлялся с кэшем L2, стал Pentium Pro в 1995 году. У него было 256 или 512 Кбайт кэшу второго уровня на кристалле, что давало существенное преимущество над обычными процессорами Pentium, чей кэш располагался на материнской плате. С появлением Pentium II в модуле Slot 1 выделенная кэш-память "поселилась" рядом с процессором. Но только у второго поколения Pentium III для Socket 370 кэш-память перешла на кристалл процессора. Так продолжается и до этого дня. Но есть процессоры с небольшим количеством кэшу, а есть с большой. Стоит ли тратить деньги на модель с большим кэшем? В прошлом дополнительная кэш-память не всегда ощутимо влияла на производительность.
Хотя всегда можно найти измеряемые отличия между двумя процессорами с разными размерами кэшу, для экономии средств вполне можно было покупать процессоры с меньшим кэшем. Но ни один процессор к появлению Core 2 Duo не был доступен с тремя разными вариантами кэшу.
Pentium 4 в своем первом поколении (Willamette, 180 нм) оснащался 256 Кбайт кэшу, а в более успешном втором поколении (Northwood, 130 нм) - уже 512 Кбайт кэшу. В то время дешевые процессоры Celeron с меньшим кэшем проводились на тех же вычислительных ядрах. Celeron относится к первому поколению продуктов с одной технологической базой для high-end и дешевым моделям, которые различаются только доступным размером кэшу и частотами Fsb/ядра. Позже была прибавлена и разница в функциях, чтобы заметнее разделить сегменты рынка.
С выпуском 90-нм ядра Prescott объем кэшу L2 вырос к 1 Мбайт, и этот процессор стал основой линейки настольных процессоров Intel к появлению 2-мбайт 65-нм Cedar Mill. Intel даже использовала два таких ядра для создания процессоров Pentium D 900 второго поколения. Впрочем, более быстрые тактовые частоты и больший объем кэшу даже тогда не значили очень много. Сегодня ситуация изменилась: лучшая производительность Core 2 Duo (Conroe, 65 нм) и меньшее энергопотребление немало обязаны размеру кэшу.
AMD весьма сдержанно относилась к увеличению объема кэшу. Скорее всего, это связано с площадью кристалла (бюджетом транзисторов), поскольку количество 65-нм процессоров не может удовлетворить спросу на рынке, а у менее выгодных 90-нм моделей этот вопрос стоит еще острее. В Intel, с другой стороны, есть преимущество в виде производства всех массовых процессоров по 65-нм техпроцессу, да и емкость кэшу L2 будет еще расти. Например, следующее поколение Core 2 на 45-нм ядре Penryn будет оснащаться до 6 Мбайт кэшу L2. Можно ли рассматривать это как маркетинговый шаг, даст ли увеличение емкости L2 действительно прирост производительности? Давайте посмотрим.
Большой кэш L2: маркетинг или рост производительности?
Кэши процессора играют полностью определенную роль: они уменьшают количество обращений к памяти, буферизуя часто используемые данные. Сегодня емкость ОЗУ составляет от 512 Мбайт до 4 Гбайт, а объем кэшу - от 256 Кбайт до 8 Мбайт, в зависимости от модели. Впрочем, даже небольшого объема кэшу в 256 или 512 Кбайт достаточно, чтобы обеспечить высокую производительность, которую сегодня воспринимают само собой понятной.
Есть разные способы организации иерархии кэшу. В большинстве современных компьютеров установленные процессоры с небольшим кэшем первого уровня (L1, до 128 Кбайт), который обычно разделяется на кэш данных и кэш инструкций. Кэш L2 большего размера обычно используется для хранения данных, он является общим для двух процессорных ядер Core 2 Duo, хотя Athlon 64 X2 или Pentium D имеют раздельные кэши на одно ядро. Кэш L2 может работать эксклюзивно или инклюзивно, то есть он может или хранить копию содержимого кэшу L1, или нет. AMD вскоре представит процессоры с третьим уровнем кэшу, который будет общим для четырех ядер в процессорах AMD Phenom. То же ожидается и для архитектуры Nehalem, какую Intel представит в 2008 году на замену текущим Core 2.
Кэш L1 всегда был в составе процессора. Сначала кэш L2 устанавливался на материнские платы, как было в ряде многих компьютеров 486dx и Pentium. Для кэш-памяти первого уровня использовались простые чипы статической памяти (SRAM, Static RAM). Они вскоре были заменены конвейерным пакетным кэшем (pipelined burst cache) у процессоров Pentium, пока не появилась возможность устанавливать кэш на кристалл. Pentium Pro на 150 - 200 Мгц стал первым процессором, который содержит 256 Кбайт кэш-памяти L2 на кристалле, побив рекорд по размеру керамической упаковки для настольних ПК и рабочих станций. Pentium III для Socket 370, что работает на частотах от 500 Мгц до 1,13 Ггц, стал первым процессором из 256 Кбайт кэш-памяти на кристалле L2, что давало преимущество по снижению задержек, поскольку кэш работает на частоте CPU.
Встроенный кэш L2 дал существенный прирост производительности практически в любых приложениях. Увеличение производительности оказалось таким существенным, что появление интегрированного кэшу L2 можно назвать важнейшим фактором производительности у процессоров x86. Отключение кэшу L2 снизит производительность сильнее, чем отключение второго ядра у двоядерного процессора.
Однако кэш-память влияет не только на производительность. Она стала могучим инструментом, что позволяет создавать разные модели процессоров для low-end, массового и high-end сегментов, поскольку производитель может гибко отбирать процессоры по отбракованию и тактовым частотам. Если на кристалле нет дефектов, то можно включить весь кэш L2, да и частоты выходят высокие. Если же желаемых тактовых частот достичь не удастся, то кристалл может стать моделью начального уровня в high-end линейке, например, Core 2 Duo 6000 из 4 Мбайт кэшу и низкими частотами. Если дефекты присутствуют в кэше L2, то производитель должен возможность отключить его часть и создать модель начального уровня с меньшим объемом кэшу, например, Core 2 Duo E4000 из 2 Мбайт кэшу L2 или даже Pentium Dual Core всего из 1 Мбайт кэшу. Все это действительно так, но вопрос заключается в следующем: насколько отличие в объеме кэшу влияет на производительность?
Варианты Core 2 Duo
Intel выпустила на рынок большой ассортимент настольных процессоров. Сегодня еще можно найти Pentium 4 и Pentium D, но большинство моделей построено на микро-архитектури Core. Мы не рекомендуем брать процессоры Pentium 4 или Pentium D, хотя их тактовые частоты до 3,8 Ггц могут выглядеть привлекательно. Но любой процессор Core 2 на частоте 2,2 Ггц и выше способный победить даже самые быстрые модели Pentium D (собственно, как и Athlon 64 X2), поскольку Core 2 дает намного лучшую производительность на такт.
Благодаря меньшим тактовым частотам процессоры Core 2 более эффективны по энергопотреблению. Если топови модели Pentium D 800 "съедают" до 130 Вт, то Core 2 Extreme с четырьмя ядрами преодолевает порог лишь 100 Вт. Все двоядерни процессоры потребляют не больше 65 Вт. Кроме того, энергопотребление в режиме бездеятельности процессоров Core 2 Duo еще ниже, поскольку рабочая частота в режиме бездеятельности меньше (максимум 1,2 Ггц для Core 2 Duo/quad против 2,8 Ггц для Pentium D/4). На снижение энергопотребления повлиял улучшивший дизайн транзисторов с уменьшенными токами истока.
Сегодня доступные модели E и X. Модели E предназначены для массового рынка, а X относятся к классу Extreme Edition. Q помечает четыре ядра, какие Intel создает, размещая два двоядерних кристалла в одной физической упаковке. Процессоры E6000 оснащены 4 Мбайт кэшу L2, если их модельный номер выше E6400 или заканчивается на 20 (например, E6320). Модели, которые заканчиваются на 00 (например, E6600) работают из FSB 266 Мгц (Fsb1066), а модели, которые заканчиваются на 50 (E6750), работают из FSB 333 Мгц (Fsb1333). Последняя требует чипсета P35 или X38 и дает немного высшую производительность. E4000 работает из FSB 200 Мгц (Fsb800) и имеет всего 2 Мбайт кэшу L2. Версии из 1 Мбайт кэшу продаются как Pentium Dual Core E2140, E2160 и E2180 с частотами от 1,6 до 2,0 Ггц. Кроме названия и некоторых функций, какие Intel отключает у дешевых процессоров, упомянутые модели Pentium Dual Cores идентичные Core 2 Duo.
Вывод
Если объем кэш-памяти частично помтиний на таки синтетических тестах, как Pcmark05, то разница в производительности большинства реальных приложений оказалась весьма существенной. Сначала это кажется удивительным, поскольку опыт говорит, что именно синтетические тесты дают самую чувствительную разницу в производительности, которая мало отражается на реальных приложениях.
Ответ простой: размер кэшу очень важен для современных процессоров из микро-архитектурой Core 2 Duo. Мы во время тестов использовали 4-мбайт Core 2 Extreme X6800, 2-мбайт Core 2 Duo E4400 и Pentium Dual Core E2160, который является процессором Core 2 Duo с кэшем L2 всего 1 Мбайт. Все процессоры работали на одинаковой системной шине 266 Мгц и с множителем 9x, чтобы частота составила 2 400 Мгц. Единственная разница заключается в размере кэшу, поскольку все современные двоядерни процессоры, за исключением старого Pentium D, изготовляются из одинаковых кристаллов. Чем станет ядро, Core 2 Extreme Edition или Pentium Dual Core, определяется выходом пригодных кристаллов (дефектами) или спросом рынка.
Если вы сравните результаты 3d-шутерив Prey и Quake 4, что считаются типичными игровыми приложениями, разница в производительности между 1 и 4 Мбайт составляет приблизительно один шаг по частоте. То же касается тестов кодировки видео для кодеков DIVX 6.6 и XVID 1.1.2, а также архиватора WINRAR 3.7. Однако, такие интенсивно нагружающие CPU применения, как 3dstudio Max 8, Lame Mp3 Encoder или H.264 Encoder V2 от Mainconcept не очень сильно выигрывают от увеличения размера кэшу.
Впрочем, подход Intel, а именно, использование всего доступного бюджета транзисторов, который увеличился при переходе из 65-нм техпроцесу на 45-нм, имеет для микро-архитектури Core 2 Duo определенную значимость. Кэш L2 у этих процессоров работает очень эффективно, особенно, если учесть, что он общий для двух ядер. Поэтому кэш нивелирует влияние разных частот памяти и предотвращает "узкое место" в виде FSB. И делает он это замечательно, поскольку тесты наглядно показывают, что производительность процессора с одним мегабайтом кэш-памяти невысокая.
С этой точки зрения увеличение размера кэшу L2 из 4 Мбайт к, максимум, 6 Мбайт в грядущих 45-нм двоядерних процессоров Penryn (линейка Core 2 Duo E8000) имеет смысл. Уменьшение техпроцесу с 65 до 45 нм позволяет Intel увеличить бюджет транзисторов, и благодаря увеличению объема кэшу мы снова получим рост производительности. Впрочем, Intel извлечет выгоду от разных вариантов процессоров с 6, 4, 2 или даже 1 Мбайт кэшу L2. Благодаря нескольким вариантам Intel может использовать большее число кристаллов из пластины, несмотря на наличие случайных дефектов, которые иначе приводили бы к попаданию кристалла в мусорную корзину. Большой размер кэшу, как видим, важный не только для производительности, но и для прибыли Intel.
За материалами: THG.ru Опубликовал admin 10 November 2007 12:54128 Прочитанных -     
|