sonyps4.ru

Пентиум 4 сколько ядер. Процессоры

Процессоры такого типа покупаются в первую очередь заядлыми игроками и энтузиастами, так как цены на них достаточно высоки.

Как это часто случается с конкурирующими компаниями, стоит одной из них попытаться объявить очередную сногсшибательную новинку, другая обязательно попытается прекратить триумфальный момент объявлением какого-нибудь собственного продукта. Ярким примером здесь будут компании ATI и NVIDIA. Создается впечатление, что они только этим и занимаются. То появляется новая немного модернизированная видеокарта, то новый пакет драйверов и т.д.

Интел собирается точно также подпортить праздник AMD, но, представляя не Prescott, а все тот же Pentium 4 Northwood, но более быстрый, хоть он и обладает точно такой же тактовой частотой, что и обычный 3.2 ГГц Northwood. Давайте попробуем разобраться, чем же отличается новый процессор Интел и какие у него преимущества над остальными.

Осмотр в любых исследованиях является самым простым методом выявления отличий (найдите десять отличий:-). Так что предлагаем посмотреть на то, что Интел называет "Экстремальной Редакцией" - Extreme Edition.

Как видно, из этого много информации не получишь. Слева - опытный образец процессора Pentium 4 3.2 ГГц, а справа - Extreme Edition.

Несколько отличий можно заметить, взглянув на обратную сторону. Находящийся справа Extreme Edition обладает большим количеством конденсаторов, чем обычный Northwood. Очевидно, количество ножек осталось точно таким же, так как он без проблем входит в Socket-478. Пока что существенных отличий нет, давайте поищем их глубже.

Оба процессора - опытные образцы, но EE, данные о котором сейчас приведены слева, в отличие от стандартного Northwood, обладает 2 MБ кэша третьего уровня. Дальнейшее исследование не показало никаких других различий между этими двумя процессорами.

Зачем увеличивать кэш?

Первичная причина увеличения объема встроенного кэша может заключаться в том, что кэш-память в современных процессорах работает на той же скорости, что и сам процессор. Как вы могли заметить, частота процессора в этом случае никак не меньше 3200 MГц. Больший объем кэша позволяет процессору держать большие части кода готовыми к выполнению. Такая архитектура процессоров сфокусирована на уменьшении задержек, связанных с простоем процессора в ожидании данных. Игры используют большие части кода, который необходимо извлекать из системной памяти по первому требованию процессора. Уменьшение промежутков времени, уходящих на передачу данных от памяти к процессору, - это надежный метод увеличения производительности приложений, требующих интенсивного взаимодействия с памятью. Кэш Level 3 имеет немного более высокое время ожидания, чем Level 1 и 2, это вполне естественно. Хоть он и медленнее, но все-таки он значительно более быстрый, чем обычная память. Не все приложения выигрывают от увеличения объема или скорости кэш-памяти. Это сильно зависит от природы приложения. Так как Интел нацеливает этот процессор в первую очередь на игровой рынок, следует ожидать, что здесь он покажет значительное преимущество перед обычным 3.2 ГГц.

Если большой объем встроенного кэша - это хорошо, тогда что же удерживало Интел от этой стратегии ранее? Простым ответом является высокая себестоимость такого решения. Резервирование пространства для кэша очень дорого. Стандартный 3.2GHz Northwood содержит 55 миллион транзисторов. Добавляя 2048 КБ кэша L3, Интел идет на увеличение количества транзисторов до 167 миллионов. Простой математический расчет покажет нам, что EE - один из самых дорогих процессоров. Но начало положено, и, скорее всего, за этим процессором последует целая линейка экстремальных моделей.

Пришло время тестирования

Вот основные параметры системы, на которой проводилось тестирование, и процессоры, принимавшие в нем участие.

  • Intel Pentium 4 3.2GHz Extreme Edition ES 800FSB CPU (12x - 28x)
  • Intel Pentium 4 3.2GHz ES 800FSB CPU (12x - 16x)
  • AMD Athlon 64 FX-51 CPU (2.2GHz) RAM (DDR400, dual channel)
  • AMD Athlon 64 3200+ (2.0GHz) RAM (DDR400, single channel)
  • AMD Barton XP3200+ S462 CPU (2200MHz / 200FSB)
  • EPoX 4PDA2+ i865PE Springdale с PAT-подобным BIOS (15/08/03) для обоих процессоров Интел
  • ASUS SK8N nForce3 Pro150 для Athlon 64 FX-51
  • EPoX 8HDA3+ VIA K8T800 для AMD Athlon 64 3200+
  • EPoX 8RDA3G nForce2 Ultra 400 для XP3200+ Barton
Другие компоненты
  • ATi Radeon 9800 Pro (380/340)
  • 2 x 256MB Corsair XMS3500C2, 2-6-2-2 @ DDR400 для обоих P4, VIA K8T800 (SC) и материнские платы nForce2.
  • 2 x 512MB Legacy Electronics DDR400 ECC/Registered 2.5-3-3-10
  • Liteon 16x DVD
  • Samcheer 420w PSU
  • Монитор Samsung 181T TFT
  • AMD reference S940/754 cooler
  • Akasa Silver Mountain cooler
  • Thermaltake AX478 cooler с вентилятором 25CFM
Программное обеспечение
  • Windows XP Professional SP1
  • DirectX9.0a
  • NVIDIA nForce 3 3.43 драйверы для чипсета
  • Intel 5.00.1012 драйверы для чипсета
  • NVIDIA nForce 2.45 драйверы
  • VIA Hyperion 4.49v2 драйверы
  • ATI CATALYST 3.7 драйверы и панель управления (6378s)
  • ScienceMark 2.0
  • Pifast v41
  • LAME v3.92 MP3
  • HEXUS SETI benchmark 0.417AR WU
  • Realstorm Raytracing benchmark v1.10 320x180x32
  • WinRAR 3.20
  • Kribi Benchmark v1.19
  • 3DMark 2001SE v330
  • UT2003 (Build 2225)
  • X2: The Threat - Rolling Demo
  • Comanche 4 benchmark
  • Serious Sam 2: Sierra De Chiapas Demo.
  • Quake 3 v1.30 HQ

Примечания

В качестве оппонентов процессору EE выступят три лучших процессора AMD и Интеловский 3.2 ГГц Northwood. Процессор будет работать в своем стандартном режиме 3.2 ГГц / 200 FSB (800 МГц QDR) и при разгоне до 3.6 ГГц / 200 FSB (множитель 18x). При тактовой частоте 3.6 ГГц процессор работал на стандартном напряжении и с довольно тихим воздушным охлаждением. Тесты запускались по три раза (SETI один) и при расхождении в результатах отбрасывались самый высокий и самый низкий показатели. Если отдельно не указаны разрешение экрана, глубина цвета и частота обновления, то подразумеваются такие параметры: 1024x768x32 85 Гц.

Основные характеристики всех процессоров приведены в таблице:

Процессор Pentium 4 3.2 ГГц EE Pentium 4 3.2 ГГц AMD Athlon FX-51 AMD Athlon 64 3200+ AMD Barton XP3200+
Тактовая Частота 3200 MГц 3200 MГц 2200 MГц 2000 MГц 2200 MГц
кеш L1 20 КБ 20 КБ 128 КБ 128 КБ 128 КБ
кеш L2 512 КБ 512 КБ 1024 КБ 1024 КБ 512 КБ
кеш L3 2048kb - - - -
Полоса пропускання памяти 6.4 ГБ/с 6.4 ГБ/с 6.4 ГБ/с 3.2 ГБ/с 6.4 ГБ/с
FSB 800 МГц 800 МГц Частота ядра Частота ядра 400 МГц
Площадь подложки 231 мм 2 131 мм 2 193 мм 2 193 мм 2 101 мм 2
Количество транзисторов 167 млн. 55 млн. 105.9 млн. 105.9 млн.? 54 млн.
Производственный процесс 0.13 микрон 0.13 микрон 0.13 микрон SOI 0.13 микрон SOI 0.13 микрон
Разрядность ОС 32 бит 32 бит 32/64 бит 32/64 бит 32 бит
Напряжение 1.525/1.55 В 1.525/1.55 В 1.525-1.55 В 1.525-1.55 В 1.65 В
Количество контактов 478 478 940 754 462

Мы опустили любую форму поддержки Hyper-Threading по той причине, что эффективность этой технологии сильно зависит от выполняемых задач.

Перейдем к тестированию

ScienceMark 2.0 обеспечивает исчерпывающий анализ полосы пропускания и времени ожидания. Это как раз те два показателя, которые помогут EE продемонстрировать свое отличие от других процессоров. Мы тестировали ЕЕ в двух режимах: 3.2 ГГц и 3.6 ГГц.


МБ, больше - лучше
A64 FX-51, 5479
3,6 ГГц EE, 4258
3,2 ГГц ЕЕ, 4195
3,2 ГГц, 4102
A64 3200+, 2922
XP3200+, 2817

Измерение полосы пропускания памяти требует демонстрации возможностей кэша. ЕЕ показал себя хорошо - немного быстрее стандартного 3.2 ГГц и на ступень ниже впечатляющих показателей Athlon 64 FX-51.

ScienceMark 2.0 скорость доступа к памяти 4 МБ/512 Б
нс, меньше - лучше
A64 3200+, 53
A64 FX-51, 57
3,6 ГГц EE, 65
3,2 ГГц ЕЕ, 73
3,2 ГГц, 84
XP3200+, 94

Время ожидания, возможно, является более важным показателем производительности. Кроме того, выбранный объем блока данных 4 МБ позволил ослабить влияние увеличенного кеша EE на результаты. Он снова оказывается более быстрым, чем стандартный P4 и еще более быстрым при более высокой тактовой частоте. Но первенство Athlon 64, тем не менее, ничем не нарушается.

Pifast - скромный тест на более низкое время ожидания или более широкую полосу пропускания.

Pifast
3,6 ГГц EE, 53,69
A64 FX-51, 55,72
3,2 ГГц ЕЕ, 59,57
3,2 ГГц, 61,48
XP3200+, 63,31
A64 3200+, 64,17

EE почти на 2 секунды опережает стандартный Pentium 4 3.2 ГГц, а при разгоне до 3.6 ГГц EE становится лидером. Но нужно отметить, что ему необходима для этого более высокая тактовая частота, при том, что Athlon FX-51 работает на частоте 2.2 ГГц.

Перекодировка WAV в MP3
время в секундах, меньше - лучше
3,6 ГГц EE, 147
3,2 ГГц ЕЕ, 165
3,2 ГГц, 165
A64 FX-51, 181
XP3200+, 183
A64 3200+, 200

Более высокая тактовая частота обеспечивает превосходство EE. Дополнительный кеш здесь вообще не играет основной роли. Это то, о чем мы говорили выше. При увеличении объема кэш-памяти производительность в стандартных приложениях существенно не увеличится. Основные преимущества будут заметны в вычислительных задачах.

SETI
время в формате ч:м:с, меньше - лучше
3,6 ГГц EE, 1:39:32
A64 FX-51, 1:46:35
3,2 ГГц ЕЕ, 1:51:34
A64 3200+, 1:58:29
3,2 ГГц, 2:07:20
XP3200+, 2:10:55

Результаты SETI сильно отличаются. Загрузите большой кэш большим объемом данных и вы пронаблюдаете, как ЕЕ опережает стандартный Pentium 4 больше, чем на 15 минут, причем, работая на стандартной частоте с абсолютно одинаковым стандартным блоком данных 0.417AR. Значительное превосходство ЕЕ в этом тесте обеспечивается низким временем ожидания при работе со встроенным кэшем. Время работы в режиме 3.6 ГГц самое быстрое из тех, что мы видели в этом тесте. (1:39:32)

Kribi Bench v1.19, Jetshadow, Realistic
FPS, больше - лучше
3,6 ГГц EE, 10,33
3,2 ГГц ЕЕ, 9,4
3,2 ГГц, 8,559
A64 FX-51, 6,72
A64 3200+, 6,01
XP3200+, 5,1

Следующий тест Kribi является тестовой системой с программным рендерингом от Adept Development. Тестирующую программу можно переписать по этой ссылке. Тест создает модели, содержащие до 16.7 миллиардов полигонов. Для нашего тестирования была выбрана встроенная модель JetShadow в реалистичном режиме. Реализация SSE и поддержка Hyper-Threading показывает, что этот тест в большей степени предрасположен к процессорам от Интел, чем от AMD (об этом красноречиво говорят и результаты). Дополнительный кэш в этом случае значительно повлиял на результат.


FPS, больше - лучше
A64 FX-51, 59,73
A64 3200+, 53,47
XP3200+, 50,69
3,6 ГГц EE, 46,74
3,2 ГГц ЕЕ, 41,91
3,2 ГГц, 41,02
WinRAR 3.2, 168 МБ/38 файлов/Best/4096 КБ
время в секундах, меньше - лучше
A64 FX-51, 126
3,6 ГГц EE, 130
3,2 ГГц ЕЕ, 145
3,2 ГГц, 146
A64 3200+, 180
XP3200+, 210

В качестве следующего теста был выбран популярный архиватор WinRAR 3.20. Нужно было создать архив из 38 файлов разных размеров от 1 КБ до 50 МБ. Разогнанный EE показал неплохой результат, но все же ему не хватило мощности, чтобы опередить Athlon 64 FX-51. Такая картина подтверждает наши ожидания и результаты большинства неигровых тестов. ЕЕ в определенных условиях оказывается заметно более быстрым, чем его стандартный собрат. Возможно, игровые тесты внесут изменения в получающуюся картину.

Начнем с 3DMark 2001SE. Большие наборы данных и ширина полосы пропускания памяти должны обеспечить первенство для EE.

Realstorm Raytracing 320x180x32, отражения и тени
FPS, больше - лучше
A64 FX-51, 59,73
A64 3200+, 53,47
XP3200+, 50,69
3,6 ГГц EE, 46,74
3,2 ГГц ЕЕ, 41,91
3,2 ГГц, 41,02

Из результатов теста Realstorm Raytracing видно, что он предпочитает процессоры AMD. Даже результаты 3.6 ГГц EE здесь оставляют желать лучшего.

3DMark 2001SE v330
больше - лучше
3,6 ГГц EE, 20924
3,2 ГГц ЕЕ, 20097
A64 FX-51, 20079
A64 3200+, 19527
3,2 ГГц, 19106
XP3200+, 18136

Так оно и произошло, процессор EE опережает стандартный почти на тысячу условных "попугаев". Разогнанная версия показала самый лучший результат, почти достав до отметки в 21000. Это, конечно, впечатляет, даже несмотря на незначительный отрыв показателей 3,2 ГГц ЕЕ от A64FX-51.

Comanche 4
FPS, больше - лучше
3,6 ГГц EE, 84,31
3,2 ГГц ЕЕ, 75,43
A64 FX-51, 73,84
3,2 ГГц, 68,23
A64 3200+, 66,71
XP3200+, 56,73

Comanche 4 является еще одним требовательным к объему кэш-памяти тестом. По его результатам отчетливо видно обеспеченное кэшем 10% увеличение производительности 3,2 ГГц ЕЕ по сравнению с обычным Pentium 4 3,2 ГГц.

Давайте посмотрим фактам в лицо. Интел узнает, что новые процессоры AMD гораздо быстрее работают с 32-разрядными приложениями, чем собственные аналоги компании. Процессор Opteron, который был прародителем как FX-51, так и меньших 3200+ Clawhammer, мусировался на сайтах новостей и обзоров в течении нескольких месяцев. Практически каждый рецензент замечал, насколько высок уровень производительности этих процессоров при их тактовых частотах. Мы видели процессоры Opteron с частотами 1.6 ГГц и 1.8 ГГц, которые обладают значительно более высокой производительностью, чем лучшие Hyper-Threading процессоры Интел, особенно в игровых тестах. Эти факты и заставили Интел предпринять какой-то шаг. Этим шагом оказался Pentium 4 Extreme Edition.

Наши тесты в целом показали, что таланты EE лучше всего проявляются в игровых тестах, где требуется обработка большого объема данных. Если же во внимание принимать результаты всех тестов, то вы должны были заметить, что AMD Athlon FX-51 вместе с Pentium 4 Extreme Edition занимают то первое, то второе место. Производительность и цена этих процессоров значительно не отличаются.

У энтузиастов с толстыми кошельками появилась возможность выбора между двумя игровыми монстрами, а Интел удастся отвлечь часть этих потенциальных покупателей от Athlon FX-51. Ориентировочная цена обоих процессоров практически одинакова: Athlon FX-51 - 900 $; Pentium 4 Extreme Edition - 925 $.

что делать, когда делать больше нечего?

Ни для кого не секрет, что рост частот современных x86 CPU в последнее время замедлился, и не помогают производителям ни новые ядра, ни новые техпроцессы. В общем, печальная картина для любителей сенсаций. Однако нет худа без добра: зато компания Intel смогла в очередной раз сделать невозможное - она выпустила два весьма интересных десктопных процессора: eXtreme Edition и обычный Pentium 4 с Processor Number 660. Оба они базируются на новой модификации ядра Prescott (называемой обычно «Prescott-2M»), оснащенной кэшем второго уровня размером два мегабайта: своего рода рекорд для десктопных CPU. Причина достижения такого результата лежит на поверхности: дальнейшее наращивание частот у ядра Prescott, можно сказать, «официально отменено» (у Intel из roadmap пропал процессор с частотой 4 ГГц), а наращивать производительность, тем не менее, как-то нужно. Но нам-то, в конце концов, все равно, за счет чего она будет расти, не так ли? Вот и выясним, дало ли нововведение какой-нибудь эффект. А для начала посмотрим, как соотносятся технические характеристики старых (уже «старых») процессоров Intel с новыми, а также с основным конкурентом.

Характеристика Athlon 64
FX-55
Pentium 4
560
Pentium 4
660
Pentium 4 XE
3,46 GHz
Pentium 4 XE
3,73 GHz
Техпроцесс, нм 130 90 90 130 90
Количество транзисторов, млн. 106 125 169 178 169
Сокет Socket 939 LGA775 LGA775 LGA775 LGA775
Частота ядра, МГц 2600 3600 3600 3430 3730
Размер L1D, КБ 64 16 16 8 16
Размер L1I 64 KB 12 Kuops 12 Kuops 8 Kuops 12 Kuops
Размер L2, КБ 1024 1024 2048 512 2048
Размер L3, КБ - - - 2048 -
ПС процессорной шины (Intel), МГц - 800 (4x200) 800 (4x200) 1066 (4x266) 1066 (4x266)
ПС контроллера памяти (AMD), МГц 800 (2x400) - - - -
Поддержка расширенных наборов команд MMX, 3DNow!, SSE, SSE2 MMX, SSE, SSE2, SSE3 MMX, SSE, SSE2, SSE3 MMX, SSE, SSE2 MMX, SSE, SSE2, SSE3
Поддержка 64-битных расширений x86 AMD64 - EM64T - EM64T
Поддержка DEP NX - XD - XD
Технология управления энергосбережением и нагревом Cool"n"Quite TM2/C1E EIST - -
TDP, Вт 89 115 115 111 115

Как видите, оба новых процессора поддерживают технологию EM64T, родную сестричку AMD64, ранее известную как x86-64, что опять-таки внове для десктопных CPU от Intel — ранее EM64T присутствовала только в серверных Xeon Nocona. Однако несмотря на то, что энтузиазм AMD по поводу 64-битных вычислений на десктопных платформах оказался заразительным, и к ней присоединилась даже Intel, основной «рулевой» другой небезызвестной компании — Microsoft, ныне именующий себя «Главным программным архитектором», не спешит нас порадовать официальным релизом 64-битной версии Windows для AMD64/EM64T. Поэтому сегодня нам остается по старинке исследовать те аспекты производительности новых процессоров, которые актуальны для большинства пользователей: скорость исполнения тестов на 32-битной Windows XP и на аналогичном по «битности» программном обеспечении.

Кроме того, видно, что концепция eXtreme Edition себя несколько дискредитировала: теперь XE от Intel уже ничуть не «эксклюзивнее» по отношению к обычным Pentium 4, чем FX от AMD по отношению к обычным Athlon 64: новый Pentium 4 eXtreme Edition 3.73 GHz отличается от обычных десктопных CPU только большей частотой работы ядра и более скоростной шиной. А у AMD FX отличается только частотой, но главное - оба производителя пришли к тому, чтобы делать обычные и «экстремальные» процессоры на одном и том же ядре, «открывая» или «закрывая» некоторые возможности (кто-то сомневается в том, что Pentium 4 660 сможет работать на шине 1066 МГц, если ему понизить коэффициент умножения?). Линейка Pentium 4 6XX будет насчитывать четыре процессора: Pentium 4 660 (3.6 ГГц), Pentium 4 650 (3.4 ГГц), Pentium 4 640 (3.2 ГГц), Pentium 4 630 (3.0 ГГц). Даже судя по одним только частотам можно предположить, что 1066-мегагерцевой шины мы на обычных Pentium 4, увы, так и не увидим. По крайней мере, еще довольно долгое время.

Тоскующим по 64-битным сенсациям мы через некоторое время предложим тестирование новых процессоров в SPEC CPU под одной из 64-битных версий Linux. А для тех, кто интересуется архитектурными особенностями процессорных ядер, можем предложить , главного разработчика пакета RightMark Memory Analyzer, который традиционно исследовал новые ядра с помощью своего пакета и со свойственной ему бескомпромиссной дотошностью даже смог выловить парочку интересных моментов. Таким образом, оставив будущее - будущему, а тонкие моменты - их профессиональным исследователям, приступим к процедуре, которая несмотря на некоторую заезженность является все-таки самой информативной: тестированию производительности в реальных приложениях. К слову, чтобы не делать ее совсем традиционной, не так давно мы весьма существенно поменяли состав тестового ПО, чему была посвящена . Соответственно, тесты, представленные ниже, проведены по новой методике, причем она несколько модифицирована даже по отношению к той, что была описана в статье (надеемся, в лучшую сторону).

Конфигурация тестовых стендов

  • Процессоры
    • Intel Pentium 4 eXtreme Edition 3.73 (266x14) ГГц, LGA775, 2 МБ L2
    • Intel Pentium 4 660 (200x18 ГГц), LGA775, 2 МБ L2
    • Intel Pentium 4 eXtreme Edition 3.46 (266x13) ГГц, LGA775, 512 КБ L2, 2 МБ L3
    • Intel Pentium 5 560 (200x18 ГГц), LGA775, 1 МБ L2
    • AMD Athlon 64 FX-55 (2.6 ГГц, Socket 939)
  • Системные платы
    • ASUS P5AD2-E Premium (чипсет i925XE, Socket 775)
    • Инженерный образец платы на чипсете ATI Xpress 200P (RX480, Socket 939)
    • Albatron K8X890 Pro (чипсет VIA K8T890, Socket 939)
  • Память
    • 2x512 МБ PC3200 (DDR400) DDR SDRAM DIMM Corsair, 2-2-2-5
    • 2x512 МБ PC2-4300 (DDR2-533) DDR2 SDRAM DIMM Corsair, 4-4-4-11
  • Видеокарта ATI Radeon X800 256 MB (PCI Express x16)
  • Жесткий диск Samsung SP1614C (SATA), 7200 об/мин, 8 МБ кэша
  • Windows XP Professional SP2, DirectX 9.0c
  • ATI CATALYST 5.2 (Display Driver 6.14.10.6512)

Небольшой комментарий к конфигурации тестовых стендов: некоторые, быть может, заметят, что в качестве основы для стенда на базе AMD Athlon 64 FX-55 указаны две платы. Дело в том, что ввиду новизны чипсетов для Socket 939 с поддержкой PCI Express, мы решили «подстраховаться», поэтому некоторые тесты выборочно запускали на двух платах, чтобы сравнить результаты. Никаких существенных различий выявлено не было, поэтому на диаграммах вы наблюдаете только один столбец, соответствующий данному процессору.

Также легко заметить, что в качестве оппонента новым процессорам был выбран всего один CPU от AMD. Нам это кажется вполне логичным: мы исследуем производительность топовых решений от Intel, поэтому в качестве ориентира вполне хватит самого быстрого на данный момент процессора AMD. Присутствие других CPU от Intel также объяснимо: новому Pentium 4 XE вполне закономерно противостоит предыдущий, с такой же как у него 1066-мегагерцевой шиной, а Pentium 4 660 соревнуется с Pentium 4 560, от которого он отличается, по сути, только увеличенным в два раза кэшем второго уровня (наличие поддержки EM64T при тестировании под 32-битной версией Windows не актуально, а всевозможные продвинутые технологии энергосбережения при 100% загрузке процессора, по идее, работать не должны). Результаты тестов«Полусинтетика»

CPU RightMark (RMCPU 2004B)

Большой кэш новых процессоров Intel не дал им возможности совершить большой количественный рывок, но зато позволил произвести рывок качественный: ранее (об этом можно судить по результатам Pentium 4 560) у Intel не было «обычного» (не eXtreme Edition) процессора, который мог бы обогнать «экстремала» от AMD. Сейчас такой процессор есть: Pentium 4 660. Однако даже несмотря на большой объем кэша, Lightwave 8 по-прежнему не шибко любит ядро Prescott (в том числе 2M-модификацию), оно в данной программе «берет свое» явно «числом» (мегагерцами, кэшем), но не «умением». Доказательство этому - результат по-прежнему никем не превзойденного Pentium 4 eXtreme Edition 3.46 GHz на старом ядре Gallatin. Работа с растровой графикой
и допечатная подготовка

Основным тестом в данном разделе является скрипт для Adobe Photoshop CS (8), разработанный в нашей тестовой лаборатории. Он включает в себя наиболее часто повторяемые действия: фильтры Blur и Sharpen, изменение цветовой модели (RGB -> CMYK -> Lab), эффекты освещения, вращение изображения, изменение размера, операции типа «Transform». Действия производятся над реальной фотографией, снятой с помощью цифровой камеры. Также по просьбе достаточно большого количества читателей в раздел добавлено тестирование с помощью Adobe Acrobat Distiller - преобразование формата PS в PDF..

Adobe Photoshop CS (8)

Пестрая картина, однако объяснимая: старое ядро Intel и архитектура AMD не в чести, хороши Prescott. Новая модификация этого ядра с двухмегабайтным кэшем не намного быстрее старой — видимо, дальнейшее наращивание его объема для Photoshop не критично.

Adobe Acrobat 6 Distiller

Adobe Acrobat Distiller отдает безоговорочное предпочтение архитектуре от Intel - NetBurst, причем как более старой ее разновидности в лице P4 XE 3.46 МГц, так и новым процессорам с ядром Prescott[-2M]. В целом: ярко выраженный пример приложения, где ведущую роль играет частота. Сравним соотношения: Pentium 4 560 выполнил задачу на 46% быстрее, чем Athlon 64 FX-55. Соотношение частот: 3600/2600, частота P4 560 больше на 38%. Да, все-таки архитектура тут явно «причем», но все-таки цифры получились более-менее сопоставимые… CAD/CAM

SolidWorks 2003

Традиционно для многих тестов SPECapc, тестовый скрипт имитирует работу пользователя и в итоге выдает четыре результата: общий балл, производительность графической подсистемы, подсистемы ввода/вывода, и процессора. Стоит заметить, что для SPECapc for SolidWorks 2003 система оценки скорости в баллах сохранена, но наилучшим является меньший результат.

Архитектурные предпочтения SolidWorks 2003 ясны: с очень большим отрывом победил процессор AMD. Далее все менее понятно, но попробуем докопаться до истины. Итак, большой кэш сам по себе, похоже, не очень важен: преимущество Pentium 4 660 над Pentium 4 560 не очень велико. P3 XE 3.46 тоже не впечатляет: несмотря на шину, он проигрывает Pentium 4 660. Предположим, что за счет старого ядра - вполне логичное предположение, не так ли? Тогда получается, что архитектуре NetBurst может помочь только комбинация из трех составляющих: большой кэш, Prescott-подобное ядро, и быстрая системная шина 1066 MHz. А дальше - только частоту наращивать… Кодирование медиаданных

В данном разделе объединено все что связано с кодированием видео- и аудиоинформации, то есть классическое преобразование WAV -> MP3, а также сжатие видеоданных посредством наиболее распространенных кодеков.

Кодирование аудиоданных

Старый, добрый LAME… Ввиду громадного количества пресетов, и не меньшего количества их ярых поклонников, мы пошли по компромиссному пути: исследуется кодирование с максимально возможным качеством: (320 kbps CBR, q=0) и кодирование VBR от 160 до 320 kbps с «высоким» (опция «-q 2», или просто «-h») качеством, после чего от полученных результатов берется среднее геометрическое.

Введение в тест второго подтеста, откуда убрана «нелюбимая» процессорами AMD опция Q=0, кардинально ситуации не изменило, и причина проста: при наборе опций «-b 160 -B 320 -m j -q 2 -V 0» все процессоры пришли к финишу практически одновременно: наихудший результат (Pentium 4 560) равен одной минуте и шести секундам, а наилучший (Athlon 64 FX-55, Pentium 4 eXtreme Edition 3.73 GHz, Pentium 4 660)… одной минуте ровно. Таким образом, между «рядом стоящими» процессорами от обоих производителей, разницы между кодированием MP3 с помощью LAME в режимах с Q>0, можно сказать, просто не существует. А при Q=0 выигрывают процессоры Intel Pentium 4. Кстати, обратите внимание, что наилучший результат из подгруппы Pentium 4 отнюдь не у нового ядра.

Кодирование видеоданных (MPEG4)

Результат, представленный на диаграмме ниже — это плод компромисса между желанием охватить максимально большое количество широко распространенных кодеков, и нежеланием загромождать статью диаграммами. Вы видите перед собой усредненное время кодирования тестового файла тремя кодеками: DivX, XviD, и Windows Media Video 9. Чтобы успокоить тех, кто боится эффекта «средней температуры по больницe», уточним: распределение мест отдельно по каждому кодеку, и на сводной диаграмме — оказалось одинаковым.

Мы первый раз тестируем Athlon 64 FX-55, и не обошлось без сюрприза: несмотря на то, что в кодировании видео традиционно сильны процессоры Intel, первое место занял все-таки топовый CPU от AMD. Впрочем, легко заметить, что преимущество это весьма невелико, и по большому счету, все процессоры справились с задачей вполне успешно, и отдавать предпочтение в данном случае следует, несомненно, самому дешевому, а не самому быстрому: разницы в той быстроте — единицы процентов…

Кодирование видеоданных (MPEG2)

По многочисленным пожеланиям читателей, в данном тесте теперь используется кодер от Canopus — ProCoder 2 (ранее мы использовали Mainconcept MPEG Encoder 1.4).

Еще один тест, который очень «не нравился» поклонникам AMD, причем настолько, что они даже упрекали нас в предвзятости: дескать, мы используем Mainconcept MPEG Encoder специально чтобы «вытянуть» процессоры Intel. Будем надеяться, что против рекомендованного ими же Canopus ProCoder у них возражений не возникнет. И что в результате? А в результате Pentium 4 все равно лучше:). Визуализация трехмерной графики

Современные трехмерные игры

Для всех игр мы используем режим 640x480x32 с минимальными настройками качества, поэтому, строго говоря, на тестирование реальной производительности в играх данный раздел претендовать не может. Однако он не мог бы претендовать на эту роль и в том случае если бы установки были более реалистичными, так как в любом случае мы используем всего одну видеокарту — а производительность в играх зависит от этого компонента никак не меньше, чем от процессора.

Зачем нужен данный тест? В общем-то, больше из теоретического интереса, чем из практического. Сведя к минимуму влияние видеокарты, мы анализируем процессорные предпочтения игровых движков . Разумеется, если бы использовалась только одна игра, это было бы малоинтересно. Однако четыре современные игры, если их результат усреднить, дают возможность с более высокой степенью приближения ответить на вопрос: «Какие CPU предпочитают современные игровые движки»? В дальнейшем мы, вполне возможно, введем в тесты еще больше игр, но анализировать будем только последнюю диаграмму: сводную. И именно с той точки зрения, что описана выше.

Убедительная победа процессора AMD, и, похоже, одна из самых убедительных побед в данном тестировании. Можно, конечно, вспомнить Adobe Distiller, но там все-таки одно приложение, а здесь — сводная диаграмма по результатам четырех тестов. Рискнем предположить, что даже пока отсутствующий в списке Half-Life 2 при любом исходе вряд ли смог бы переломить ситуацию, так что для современных игр мы с чистой совестью можем рекомендовать процессоры AMD. Конечно, в «настоящих» игровых режимах преимущество процессора будет намного менее очевидно, так как скажется влияние видеокарты, но если одно число больше другого — то на сколько их не дели, второе больше первого все равно не станет, не так ли?

Пакеты трехмерного моделирования

Достаточно просто трактуемая диаграмма: чем больше кэш — тем лучше. Группы так и распределились: внизу два процессора с 1 МБ L2, чуть повыше — два процессора с двухмегабайтным кэшем (видимо, тесту все равно, какого он уровня), еще выше — CPU с двухмегабайтным кэшем и быстрой шиной 1066 МГц. Заключение

Для начала приведем небольшую табличку, позволяющую, как нам кажется, наиболее интересным (хотя и не бесспорным!) способом оценить результаты всех тестов в совокупности. В ней снова приведены результаты всех процессоров во всех тестах, но уже в процентном отношении, при этом за 100% берется наихудший результат (понятно, что в зависимости от теста его показывают разные CPU). А в конце полученные проценты сведены вместе методом простейшего среднего арифметического. Разумеется, такая оценка весьма приблизительна, так как предусматривает, что нас в равной степени интересуют результаты всех тестов, однако, учитывая многообразие вкусов различных пользователей, нам такой метод представляется, как минимум, ничуть не менее предпочтительным, нежели любой другой. Для удобства просмотра худшие результаты (100%) выделены красным, а лучшие — синим.

Тест Athlon 64
FX-55
Pentium 4
560
Pentium 4
660
Pentium 4
XE 3.46 GHz
Pentium 4
XE 3.73 GHz
CPU RM (solver) 129% 106% 106% 100% 110%
CPU RM (render) 100% 120% 120% 101% 124%
7-Zip 100% 102% 105% 106% 110%
WinRAR 121% 100% 106% 112% 115%
3ds max 6 (interactive) 126% 100% 103% 102% 108%
Maya 6 (CPU) 113% 100% 104% 101% 114%
Maya 6 (overall) 105% 100% 104% 107% 109%
Lightwave 3D 8 106% 100% 107% 113% 111%
Adobe Photoshop CS 104% 112% 114% 100% 120%
Adobe Distiller 6 100% 147% 152% 156% 157%
SolidWorks 2003 132% 100% 105% 103% 116%
LAME 100% 125% 126% 134% 130%
MPEG4 106% 101% 101% 100% 105%
MPEG2 100% 113% 113% 107% 115%
Games 128% 100% 102% 104% 110%
SPEC viewperf 102% 100% 111% 108% 117%
Overall 111% 108% 111% 110% 117%

Итак, если рассматривать вышеприведенную таблицу в качестве оснований для выводов, то основных выводов будет два:

  1. В общем зачете новый топовый процессор Intel вырвал пальму первенства из рук AMD (так и представляешь себе, как он ее, прямо с корнем, вырывает…), более того: новый «неэкстремальный» Pentium 4 660 идет с Athlon 64 FX-55 наравне, обгоняя при этом предыдущий P4 XE от самой Intel. Глядя на эту безрадостную картину, начинаешь понимать всю тщету гонки за громкими названиями типа «eXtreme Edition» или «FX»: что в них толку, если через мизерный срок (не более полугода) выйдет обычный процессор, который окажется быстрее?
  2. Разница между худшим и лучшим показателями составляет… 9%. То есть если брать производительность рассмотренных нами процессоров «в среднем», вероятность того, что пользователь сможет почувствовать разницу в скорости систем на их основе — чрезвычайно мала . Как общеизвестно, чувствительность человека намного ниже чувствительности бенчмарка. Возникает, соответственно, законный вопрос: а не много ли шума из ничего? Впрочем, на него каждый отвечает самостоятельно.

Мы лишь можем констатировать: с точки зрения сравнения производительности топовых CPU, все по-прежнему сводится к продолжающемуся спору о том, «кто хозяин горы», то есть занимает формальное первое место. Кажется, уже всем без исключения понятно, что решения, которое разгромит конкурента в пух и прах, ни один из производителей предоставить не в состоянии. Или не хочет. Что, к слову, не так уж фантастично, как кажется на первый взгляд. Возможна и вариация, совмещающая в себе оба варианта: один осознанно «притормаживает» выход своего нового продукта, второй же рвется к вершине, достигает ее… и через некоторое время получает в качестве ответа давно готовый к выпуску CPU от конкурента. Какой из этих трех вариантов имеет место на самом деле, мы, скорее всего, не узнаем… да и не особенно хочется, честно говоря. Ибо причин может быть масса, а следствие все равно одно: быстродействие CPU растет, но не скачкообразно, а небольшими, четко отмеренными порциями, а смена формального лидера столь же неизбежна как пришествие нового времени года. Впрочем, так или иначе, шоу продолжается! Зритель, правда, порядком подустал. Поэтому наш прогноз на будущее несколько парадоксален: к тому времени, когда два ведущих конкурента на рынке x86 CPU наконец-то сподобятся окончательно выяснить, кто из них делает самые быстрые процессоры — это уже мало кого будет интересовать:).

Впрочем, все вышесказанное отнюдь не мешает поздравить Intel с очередной победой. В конце концов, не так важно, кто победил — важно, что в очередной раз планка производительности поднята еще выше. До тех пор, пока ее кто-нибудь время от времени поднимает, можно не переживать за индустрию в целом: куда-то она все-таки движется…

Как известно, революции в компьютерном
мире случаются все реже. Да и так ли они необходимы там, где, в общем-то, "все
хорошо", где возможности систем и продуктов с лихвой покрывают нужды большинства
современных пользователей. Это в полной мере относится и к процессорам корпорации
Intel, лидера индустрии. У компании есть полная линейка высокопроизводительных
CPU всех уровней (серверные, десктопные, мобильные), тактовые частоты давно уже
перевалили за "заоблачные" 3 GHz, продажи идут просто "на ура".
И наверное, если бы не оживившиеся конкуренты (точнее, конкурент ), то все
было бы совсем хорошо.

Но "гонка гигагерцев" не прекращается. Оставим в стороне рассмотрение вопросов вроде "Кому это нужно? " и "Насколько это востребовано? " — примем лишь как факт: чтобы удержаться на плаву, производители CPU просто вынуждены тратить силы на выпуск все более быстродействующих (или как минимум более высокочастотных ) продуктов.

Начало февраля Intel отметила представлением целой обоймы новых процессоров. Компания
выпустила сразу семь новых CPU, в числе которых:

  • Pentium 4 3,40 GHz ("старое" ядро Northwood);
  • Pentium 4 Extreme Edition 3,40 GHz;
  • целых четыре представителя новой линейки с ядром Prescott (кстати, ударение
    на первом слоге) — 3,40E, 3,20E, 3,0E и 2,80E GHz, изготовленные по 90-нанометровой
    технологии и оснащенные кэшем второго уровня объемом 1 MB.

Все эти CPU рассчитаны на шину 800 MHz и поддерживают технологию Hyper-Threading. Кроме того, Intel выпустила Pentium 4 на ядре Prescott с частотой 2,8A GHz, также изготовленный по 90-нанометровому процессу, но рассчитанный на частоту FSB 533 MHz и не поддерживающий Hyper-Threading . По информации Intel, предназначен этот процессор специально для OEM-производителей ПК в ответ на их пожелания. От себя добавим — и на радость оверклокерам, которые наверняка оценят его возможности разгона.

С выпуском новых CPU семейство Pentium 4 значительно пополнилось и сейчас выглядит так, как показано в табл. 1. Естественно, пока Intel вовсе не собирается сворачивать производство Pentium 4 на ядре Northwood с FSB 533 и 800 MHz. Кроме того, в линейке остаются и несколько моделей, рассчитанных на шину 400 MHz (пять процессоров от 2A до 2,60 GHz).

Разрабатывая 90-нанометровые технологии, которые должны обеспечить нормальное
функционирование процессоров класса Prescott, инженеры Intel вынуждены
были преодолевать серьезные препятствия. Природа этих преград состояла
не в недостаточном разрешении производственного оборудования, а в проблемах
физического характера, связанных с невозможностью изготовления столь малых
транзисторов по традиционным технологиям.

Первой проявилась утечка заряда с затвора транзистора через истончившийся
слой диэлектрика между затвором и каналом. При разрешении 90 нм он "выродился"
в барьер из четырех атомов SiO2 толщиной 1,2 нм. Появилась необходимость
в новых изолирующих материалах с более высоким значением константы диэлектрической
проницаемости (high-K dielectric). За счет большей проницаемости они позволяют
наращивать толстый (до 3 нм) изолирующий слой, не создавая при этом препятствий
для электрического поля затвора. Таковыми стали оксиды гафния и циркония.
К сожалению, они оказались несовместимы с применяемыми ныне поликристаллическими
затворами, да и фононные колебания, возникающие в диэлектрике, вызывают
снижение подвижности электронов в канале.

На границе с затвором наблюдается иное явление, выражающееся в значительном
повышении порогового уровня напряжения, необходимого для изменения состояния
проводимости канала транзистора. Решение было найдено в виде металлического
затвора. В прошлом году специалисты корпорации подобрали, наконец, два
подходящих металла, которые позволили сконструировать новые миниатюрные
NМOS- и PMOS-транзисторы. Какие именно металлы они использовали — до
сих пор держится в секрете.

Чтобы увеличить быстродействие транзисторов (оно определяется скоростью
перехода в открытое/закрытое состояние), Intel прибегла к формированию
канала из единого кристалла напряженного кремния. "Напряжение"
в данном случае означает деформирование кристаллической решетки материала.
Как оказалось, сквозь структурно нарушенный кремний как электроны (+10%
для NМOS), так и дырки (+25% для PMOS) проходят с меньшим сопротивлением.
Улучшение подвижности увеличивает максимальный ток транзистора в открытом
состоянии.

Для NМOS- и PMOS-транзисторов напряженное состояние достигается различными
методиками. В первом случае все очень просто: обычно транзистор сверху
"укрыт" слоем нитрида кремния, который выполняет функцию предохраняющей
маски, а для создания напряжения в канале толщину слоя нитрида увеличивают
вдвое. Это ведет к созданию дополнительной нагрузки на области истока
и стока и, соответственно, растягивает, деформирует канал.

PMOS-транзисторы "напрягают" по другой схеме. Сначала зоны
истока и стока вытравливают, а потом наращивают в них слой SiGe. Атомы
германия превышают по размерам атомы кремния и поэтому германиевые прослойки
всегда использовались для создания напряжения в кремнии. Однако особенность
технологии Intel заключается в том, что в данном случае сжатие кремниевого
канала происходит в продольном сечении.

Новый технологический процесс также позволил увеличить количество слоев
металлизации с шести до семи (медные соединения). Любопытно, что на производственной
линии "плечом к плечу" трудятся как литографические аппараты
нового поколения с длиной волны 193 нм, так и их предшественники с длиной
волны 248 нм. Вообще процент повторно использованной техники достиг 75,
что позволило снизить стоимость модернизации фабрик.

Особенности Prescott

В дискуссиях, предшествовавших выпуску процессора на ядре Prescott, он в шутку именовался не иначе как "Pentium 5". Собственно, именно таким был типичный ответ компьютерного профи на вопрос "Что такое Prescott?". Конечно, Intel не стала менять торговую марку, да и достаточных оснований для этого не было. Вспомним практику выпуска программного обеспечения — там смена номера версии происходит только при кардинальной переработке продукта, тогда как менее значительные изменения обозначаются дробными номерами версий. В процессорной индустрии дробные номера пока не приняты, и то, что Prescott продолжил линейку Pentium 4, как раз и является отражением того факта, что перемены носят не настолько радикальный характер.

Процессоры на ядре Prescott хоть и содержат немало новшеств и модификаций по сравнению
с Northwood, однако основаны на той же архитектуре NetBurst, имеют ту же корпусировку,
что и предыдущие Pentium 4, устанавливаются в тот же разъем Socket 478 и, в принципе,
должны работать на большинстве материнских плат, поддерживающих 800 MHz FSB и
обеспечивающих должные напряжения питания (естественно, потребуется обновление
BIOS).

Детальное изучение практических вопросов, касающихся Prescott, мы оставим для отдельного материала. А пока попробуем рассмотреть, какие изменения появились в Prescott, и понять, насколько этот процессор отличается от своего предшественника и чего можно в результате ожидать.

Основные новшества, реализованные в ядре Prescott, следующие:

  • Перевод производства кристаллов на техпроцесс 90 нм.
  • Возросшая длина конвейера (с 20 до 31 стадии).
  • Вдвое увеличенные кэши L1 (кэш данных — с 8 до 16 KB) и L2 (с 512 KB до
    1 MB).
  • Изменения в архитектуре:
    -модифицированный блок предсказания переходов;
    -усовершенствованная логика работы L1-кэша (улучшенная предварительная выборка
    данных);
    -появление новых блоков в процессоре;
    -увеличенный объем некоторых буферов.
  • Усовершенствованная технология Hyper-Threading.
  • Появление поддержки нового набора SIMD-инструкций SSE3 (13 новых команд).

Главные различия трех процессорных ядер, использовавшихся в Pentium 4, сведены в табл. 2. Число транзисторов в Prescott увеличилось более чем вдвое — на 70 млн. Из них, по грубым оценкам, порядка 30 млн. можно отнести на счет удвоившегося L2-кэша (дополнительные 512 KB, по 6 транзисторов на одну ячейку). Причем остается еще вполне солидное число, и даже по одному этому значению можно косвенно судить о масштабах произошедших в ядре изменений. Заметим, что, несмотря на такой рост числа элементов, площадь ядра не только не увеличилась, но даже уменьшилась по сравнению с Northwood.

С 90-нанометровым технологическим процессом все, в общем-то, понятно (конечно, на упрощенном, "пользовательском" уровне). Меньший размер транзисторов позволит снизить напряжение питания процессора и уменьшить рассеиваемую им мощность, а следовательно, и нагрев. Это откроет дорогу для дальнейшего увеличения тактовых частот, которое хотя и будет сопровождаться ростом тепловыделения, но "начало отсчета" для этого роста будет уже другим, несколько ниже. Отметим, что с учетом большего числа транзисторов в Prescott по сравнению с Northwood правильнее было бы говорить не об уменьшении, а о сохранении или же меньшем увеличении рассеиваемой мощности.

Удлиненный конвейер . Как видно из табл. 2, по длине конвейера Prescott (31 стадия) более чем наполовину превосходит Northwood. Что за этим кроется, вполне понятно: это не первый случай, когда Intel увеличивает длину конвейера, нацеливаясь на повышение тактовых частот — известно, что чем длиннее конвейер, тем лучше "разгоняется" процессорное ядро. В принципе, сложно сказать однозначно, так ли необходимо такое "удлинение" на текущем этапе, на частотах в районе 3,5 GHz — энтузиасты-оверклокеры разгоняли Pentium 4 (Northwood) и до более высоких значений. Но рано или поздно рост числа стадий оказался бы неизбежен — так почему бы не совместить это событие с выпуском нового ядра?

Увеличенные объемы кэшей и буферов . В принципе, этот пункт напрямую связан с предыдущим. Чтобы обеспечить работой длинный конвейер на высоких частотах, желательно иметь большего объема "подручный склад" в виде кэша для уменьшения количества простоев, при которых процессор ожидает загрузки требуемых данных из памяти. Кроме того, хорошо известно, что при прочих равных из двух процессоров с разной длиной конвейера производительнее окажется тот, у которого этот параметр меньше. При ошибках предсказания перехода процессор вынужден "сбрасывать" свой конвейер и загружать его работой по-новому. И чем большее число стадий в нем содержится, тем болезненнее оказываются подобные промахи. Полностью их исключить, конечно же, нельзя, и на одинаковых частотах Northwood и Prescott последний оказался бы менее производительным… не будь у него большего L2-кэша, во многом компенсирующего отставание. Естественно, здесь все зависит от специфики конкретных приложений, что мы и попытаемся проверить в практической части.

Как говорилось выше, в Prescott увеличен не только общий L2-кэш, но и L1-кэш данных, объем которого вырос с 8 до 16 KB. Также изменились его организация и часть логики работы — к примеру, введен механизм принудительного продвижения (force forwarding ), уменьшающий задержки в случаях, когда зависимая операция загрузки данных из кэша не может спекулятивно выполняться до завершения предшествующей операции помещения этих данных в кэш.

Кроме объемов кэшей, увеличению подверглась и емкость двух планировщиков, отвечающих за хранение микроопераций (uops ), которые используются в инструкциях x87/SSE/SSE2/SSE3. Это, в частности, позволило более эффективно находить параллелизм в мультимедиаалгоритмах и выполнять их с лучшей производительностью.

Собственно, некоторых новшеств в архитектуре Pentium 4, реализованных в Prescott, мы уже успели коснуться, поскольку они "разбросаны" по ядру процессора и затрагивают многие его блоки. Следующим важным изменением является…


Модифицированный блок предсказания переходов . Как известно, точность
работы этого блока является критически важной для обеспечения высокой производительности
современного процессора. "Просматривая" программный код, следующий за
выполняемым в настоящий момент, процессор может заранее выполнять части
данного кода — это хорошо известное спекулятивное выполнение . Если же
в программе встречается ветвление в результате условного перехода (если-то-иначе ),
то возникает вопрос о том, какую из двух веток "лучше" выполнять заранее.
Алгоритмы в Northwood действовали относительно просто: переходы назад предполагались
совершающимися, вперед — нет. Это большей частью работало для циклов,
но не для других видов переходов. В Prescott используется понятие длины
перехода : исследования показали, что если дальность перехода превышает
определенный предел, то переход с большой долей вероятности совершаться не будет
(соответственно, спекулятивно выполнять эту часть кода не нужно). Также в Prescott
введен более тщательный анализ самих условий перехода, на основании которого принимаются
решения о вероятности выполнения перехода. Кроме статических алгоритмов предсказания,
изменениям подверглись и динамические алгоритмы (кстати, новые идеи были частично
заимствованы из мобильного Pentium M).

Появление новых блоков в процессоре . Два новых блока в Prescott — это блок побитовых сдвигов и циклических сдвигов (shifter/rotator) и выделенный блок целочисленного умножения . Первый позволяет осуществлять наиболее типичные операции сдвига на одном из двух быстрых ALU, работающих на удвоенной частоте ядра CPU (в предыдущих модификациях Pentium 4 эти операции выполнялись как целочисленные и занимали несколько тактов). Для осуществления целочисленного умножения ранее задействовались ресурсы FPU, что достаточно долго — нужно было передать данные в FPU, выполнить там сравнительно медленное умножение и передать результат обратно. В Prescott для ускорения этих операций добавлен новый блок, отвечающий за такие операции умножения.

Улучшенный Hyper-Threading . Конечно, все перечисленные выше новшества введены в Prescott неспроста. По словам специалистов Intel, большинство модификаций в логике работы кэшей, очереди команд и пр. так или иначе связаны с быстродействием процессора при использовании Hyper-Threading, т. е. при одновременной работе нескольких программных потоков. В то же время на производительность "однопоточных" (single-threaded) приложений эти нововведения оказывают лишь незначительное влияние. Также в Prescott увеличился набор инструкций, которым "позволено" исполняться на процессоре параллельно (например, операция с таблицей страниц и операция с памятью, разбивающая строку кэша). Опять-таки, для однопоточных приложений невозможность совмещения подобных операций практически не сказывалась на производительности, тогда как при выполнении двух потоков такое ограничение зачастую становилось "узким местом". Другой пример — если в Northwood происходило "непопадание в кэш" (cache miss) и возникала необходимость чтения данных из оперативной памяти, следующие операции просмотра кэша откладывались до окончания этого действия. В результате одно приложение, часто "промахивающееся" мимо кэша, могло существенно затормозить работу остальных потоков. В Prescott этот конфликт легко преодолевается, операции могут выполняться параллельно. Также в Prescott была переделана логика арбитража и разделения ресурсов между потоками с целью увеличения общей производительности.

Инструкции SSE3. Как мы помним, последний раз расширение набора SIMD-инструкций
Intel провела, выпустив первый Pentium 4 (Willamette) и реализовав в нем SSE2.
Очередное расширение, получившее название SSE3 и содержащее 13 новых инструкций,
осуществлено в Prescott. Все они, за исключением трех, используют SSE-регистры
и предназначены для повышения производительности в следующих областях:

  • быстрое преобразование вещественного числа в целое (fisttp );
  • сложные арифметические вычисления (addsubps, addsubpd, movsldup, movshdup,
    movddup
    );
  • кодирование видео (lddqu );
  • обработка графики (haddps, hsubps, haddpd, hsubpd );
  • синхронизация потоков (monitor, mwait ).

Естественно, детальное рассмотрение всех новых инструкций выходит за рамки материала, эта информация приведена в соответствующем руководстве для программистов. Инструкции первых четырех категорий служат как для ускорения выполнения самих операций, так и для того, чтобы сделать их более "экономными" в смысле использования ресурсов процессора (и, следовательно, оптимизации работы Hyper-Threading и механизма спекулятивного выполнения). Программный код при этом также значительно сокращается и, что немаловажно, упрощается. Например, инструкция ускоренного преобразования вещественного числа в целое fisttp заменяет семь (!) команд традиционного кода. Даже по сравнению с инструкциями SSE2 (которые сами по себе также ускоряют выполнение кода и сокращают его объем) команды SSE3 во многих случаях дают немалую экономию. Две инструкции последней группы — monitor и mwait — позволяют приложению (точнее потоку ) сообщать процессору, что в данный момент оно не выполняет полезной работы и находится в режиме ожидания (например, записи в определенную ячейку памяти, возникновения прерывания или исключительной ситуации). Процессор при этом может переводиться в режим пониженного энергопотребления или же, при использовании Hyper-Threading, отдавать все ресурсы другому потоку. В общем, с SSE3 для программистов открываются новые возможности по оптимизации кода. Проблема здесь, как всегда в таких случаях, одна: пока новый набор инструкций не стал общепринятым стандартом, разработчикам ПО придется поддерживать две ветки кода (с SSE3 и без оной), чтобы приложения работали на всех процессорах…

Камо грядеши?..

В общем, объем новшеств, реализованных в ядре Prescott, вполне можно назвать
значительным. И хотя до "настоящего Pentium 5" он недотягивает, но к
"четырем с половиной" вполне может приблизиться. Переход от ядра Northwood
к Prescott — в принципе, эволюционный процесс, хорошо укладывающийся в общую
стратегию Intel. Постепенные изменения в архитектуре Pentium 4 хорошо видны на
схеме: архитектура модифицируется и пополняется новыми особенностями — идет последовательная
оптимизация процессора под определенный набор ПО.

Чего же можно ожидать от Prescott? Пожалуй, прежде всего (хотя это может показаться и несколько странным) — новых частот. Intel сама признает, что на равных частотах производительность Prescott и Northwood будет мало отличаться. Положительное влияние большого L2-кэша и прочих новшеств Prescott во многом "компенсируется" его значительно более длинным конвейером, который болезненно реагирует на ошибки предсказания переходов. И даже с учетом того, что блок этого самого предсказателя переходов был усовершенствован, все равно идеальным он быть не может. Главное преимущество Prescott в другом: новое ядро позволит дальше наращивать частоту — до значений, недостижимых ранее с Northwood. По планам Intel ядро Prescott рассчитано на два года, пока его не сменит следующее ядро, изготовленное по технологии 65 нм (0,065 мкм).

Поэтому выпущенный сейчас процессор на новом ядре Prescott не претендует прямо со старта на лавры чемпиона производительности и во всей красе должен проявить себя в будущем. Еще одним подтверждением тому является и позиционирование процессора: Pentium 4 на ядре Prescott рассчитан на mainstream-системы, в то время как топовым CPU был и остается Pentium 4 Extreme Edition. Кстати, хотя планка частот у процессоров Intel номинально поднялась до 3,4 GHz с выходом Prescott, но появление первых OEM-систем на базе Pentium 4 3,4 GHz на новом ядре произойдет несколько позднее в этом квартале (а ведь коммерческие поставки Prescott начаты еще в IV квартале 2003 г.).

Еще одна область, где может проявить себя Prescott (и наверняка проявит), — это работа ПО, оптимизированного под SSE3. Процесс оптимизации уже начался, и на сегодня существует как минимум пять приложений с поддержкой нового набора инструкций: MainConcept (MPEG-2/4), xMPEG, Ligos (MPEG-2/4), Real (RV9), On2 (VP5/VP6). В течение 2004 г. поддержка SSE3 должна появиться в таких пакетах, как Adobe Premiere, Pinnacle MPEG Encoder, Sony DVD Source Creator, Ulead MediaStudio и VideoStudio, всевозможные аудио- и видеокодеки и т. д. Вспоминая процесс оптимизации под SSE/SSE2, можно понять, что результаты SSE3 мы увидим, но отнюдь не сразу — опять-таки, это в определенном смысле "задел на будущее".

Ну а что же "по ту сторону линии фронта"? Главный конкурент Intel по-прежнему идет своим путем, все дальше отдаляясь от "генеральной линии". AMD продолжает наращивать "голую производительность", пока что обходясь значительно более низкими частотами. Контроллер памяти, в Athlon 64 перекочевавший из северного моста в процессор, подлил масла в огонь, обеспечив невиданную ранее скорость доступа к ОЗУ. А недавно был выпущен процессор с рейтингом 3400+ (нет, о полном соответствии продукту конкурентов по частоте никто не говорит…).

Однако Intel и AMD сейчас находятся примерно в равных ситуациях — их топовые процессоры ожидают выхода соответствующего оптимизированного ПО, чтобы проявить себя на полную мощность. Intel все больше "уходит в мультимедиа": для офисного ПО производительности Pentium 4 хватает с лихвой, и чтобы Prescott реализовал свой потенциал, нужны оптимизированные мультимедиаприложения (и/или высокие тактовые частоты, в возможности достижения которых можно не сомневаться). Стоит отметить тот факт, что переработка кодеков под SSE3 — пожалуй, не самая сложная операция, а эффект от этого сразу почувствуют все приложения, использующие такие кодеки (причем переработка самих приложений при этом совсем необязательна).

С другой стороны, в середине 2004 г. выйдет 64-разрядная версия Windows для платформы AMD64, на которой как раз и должны проявиться возможности Athlon 64. Конечно, здесь встанет обычный вопрос о наборе приложений под новую ОС, без которых система остается практически бесполезной. Но вспомним, что уже как минимум существуют те же кодеки, откомпилированные под 64-битные Athlon. Так что есть вероятность того, что в недалеком будущем и платформе AMD будет где себя показать. В общем, создается впечатление, что пока титаны просто накачивают мускулы, строят оборонительные сооружения и готовят тылы перед главным… нет, скорее, очередным сражением…

integrated heat spreader ) кристаллом, установленную на плату-переходник (англ. interposer ) с 423 штырьковыми контактами (размеры корпуса - 53,3×53,3 мм) . Между контактами на обратной стороне платы-переходника установлены SMD -элементы.

Поздние процессоры на ядре Willamette, процессоры Pentium 4 на ядре Northwood, часть процессоров Pentium 4 Extreme Edition на ядре Gallatin и ранние процессоры на ядре Prescott с по 2005 год выпускались в корпусе типа FC-mPGA2 , представлявшем собой подложку из органического материала с закрытым теплораспределительной крышкой кристаллом с лицевой стороны и 478 штырьковыми контактами, а также SMD-элементами, с обратной (размеры корпуса - 35×35 мм).

Часть процессоров Pentium 4 Extreme Edition на ядре Gallatin, поздние процессоры на ядре Prescott, процессоры на ядрах Prescott-2M и Cedar Mill c весны по осень 2007 года выпускались в корпусе типа FC-LGA4 , представлявшем собой подложку из органического материала с закрытым теплораспределительной крышкой кристаллом с лицевой стороны и 775 контактными площадками с обратной (размеры корпуса - 37,5×37,5 мм). Как и в двух предыдущих типах корпусов, между контактами установлены SMD-элементы.

Часть мобильных процессоров на ядре Northwood выпускалась в корпусе типа FC-mPGA . Основным отличием этого типа корпуса от FC-mPGA2 является отсутствие теплораспределительной крышки.

Маркировка процессоров, имеющих теплораспределительную крышку, нанесена на её поверхность, а у остальных процессоров маркировка нанесена на две наклейки, расположенные на подложке с двух сторон от кристалла.

Особенности архитектуры

Конвейер процессора на ядре Northwood

Конвейер состоит из 20 стадий:

  • TC, NI (1, 2) - поиск микроопераций, на которые указывает последняя выполненная инструкция.
  • TR, F (3, 4) - выборка микроопераций.
  • D (5) - перемещение микроопераций.
  • AR (6-8) - резервирование ресурсов процессора, переименование регистров.
  • Q (9) - постановка микроопераций в очереди.
  • S (10-12) - изменение порядка исполнения.
  • D (13-14) - подготовка к исполнению, выборка операндов.
  • R (15-16) - чтение операндов из регистрового файла.
  • E (17) - исполнение.
  • F (18) - вычисление флагов.
  • BC, D (19, 20) - проверка корректности результата.

Архитектура NetBurst (рабочее наименование - P68 ), лежащая в основе процессоров Pentium 4, разрабатывалась компанией Intel, в первую очередь, с целью достижения высоких тактовых частот процессоров. NetBurst не является развитием архитектуры , использовавшейся в процессорах Pentium III , а представляет собой принципиально новую по сравнению с предшественниками архитектуру. Характерными особенностями архитектуры NetBurst являются гиперконвейеризация и применение кэша последовательностей микроопераций вместо традиционного кэша инструкций. АЛУ процессоров архитектуры NetBurst также имеет существенные отличия от АЛУ процессоров других архитектур.

Основными недостатками длинного конвейера являются уменьшение удельной производительности по сравнению с коротким конвейером (за один такт выполняется меньшее количество инструкций), а также серьёзные потери производительности при некорректном выполнении инструкций (например, при неверно предсказанном условном переходе или кэш-промахе).

Для минимизации влияния неверно предсказанных переходов, в процессорах архитектуры NetBurst используются увеличенный по сравнению с предшественниками буфер предсказания ветвлений (англ. branch target buffer ) и новый алгоритм предсказания ветвлений, что позволило достичь высокой точности предсказания (около 94 %) в процессорах на ядре Willamette. В последующих ядрах механизм предсказания ветвлений подвергался модернизациям, повышавшим точность предсказания.

Кэш последовательностей микроопераций (англ. Execution Trace Cache )

Процессоры архитектуры NetBurst, как и большинство современных x86 -совместимых процессоров, являются CISC -процессорами с RISC -ядром: перед исполнением сложные инструкции x86 преобразуются в более простой набор внутренних инструкций (микроопераций), что позволяет повысить скорость обработки команд. Однако, вследствие того, что инструкции x86 имеют переменную длину и не имеют фиксированного формата, их декодирование связано с существенными временными затратами.

В связи с этим, при разработке архитектуры NetBurst было принято решение отказаться от традиционной кэш-памяти инструкций первого уровня, хранящей команды x86, в пользу кэша последовательностей микроопераций, хранящего последовательности микроопераций в соответствии с предполагаемым порядком их исполнения. Такая организация кэш-памяти позволила также снизить временные затраты на выполнение условных переходов и на выборку инструкций.

АЛУ и механизм ускоренного выполнения целочисленных операций (англ. Rapid Execution Engine )

Так как основной целью разработки архитектуры NetBurst было повышение производительности за счёт достижения высоких тактовых частот, возникла необходимость увеличения темпа выполнения основных целочисленных операций. Для достижения этой цели АЛУ процессоров архитектуры NetBurst разделено на несколько блоков: «медленное АЛУ», способное выполнять большое количество целочисленных операций, и два «быстрых АЛУ», выполняющих только простейшие целочисленные операции (например, сложение). Выполнение операций на «быстрых АЛУ» происходит последовательно в три этапа: сначала вычисляются младшие разряды результата, затем старшие, после чего могут быть получены флаги.

«Быстрые АЛУ», обслуживающие их планировщики, а также регистровый файл синхронизируются по половине такта процессора, таким образом, эффективная частота их работы вдвое превышает частоту ядра. Эти блоки образуют механизм ускоренного выполнения целочисленных операций.

В процессорах на ядрах Willamette и Northwood «быстрые АЛУ» способны выполнять лишь те операции, которые обрабатывают операнды в направлении от младших разрядов к старшим. При этом результат вычисления младших разрядов может быть получен через половину такта. Таким образом, эффективная задержка составляет половину такта. В процессорах на ядрах Willamette и Northwood отсутствуют блоки целочисленного умножения и сдвига, а данные операции выполняются другими блоками (в частности, блоком инструкций MMX).

В процессорах на ядрах Prescott и Cedar Mill присутствует блок целочисленного умножения, а «быстрые АЛУ» способны выполнять операции сдвига. Эффективная задержка операций, исполняемых «быстрыми АЛУ», возросла по сравнению с процессорами на ядре Northwood и составляет один такт.

Система повторного исполнения микроопераций (англ. Replay System )

Основной задачей планировщиков микроопераций является определение готовности микроопераций к исполнению и передача их на конвейер. Вследствие большого числа стадий конвейера, планировщики вынуждены отправлять микрооперации на исполнительные блоки до того, как завершится выполнение предыдущих микроопераций. Это обеспечивает оптимальную загрузку исполнительных блоков процессора и позволяет избежать потери производительности в том случае, если данные, необходимые для выполнения микрооперации, находятся в кэш-памяти первого уровня, регистровом файле, или могут быть переданы минуя регистровый файл.

При определении готовности новых микроопераций к передаче на исполнительные блоки, планировщику необходимо определить время выполнения тех предыдущих микроопераций, результатом которых являются данные, необходимые для выполнения новых микроопераций. В том случае, если время выполнения заранее не определено, планировщик для его определения использует наименьшее время её выполнения.

Если оценка времени, необходимого для получения данных, оказалась верной, микрооперация выполняется успешно. В том случае, если данные не были получены вовремя, проверка корректности результата заканчивается неудачей. При этом микрооперация, результат выполнения которой оказался некорректен, ставится в специальную очередь (англ. replay queue ), а затем вновь направляется планировщиком на исполнение.

Несмотря на то, что повторное исполнение микроопераций приводит к значительным потерям производительности, применение данного механизма позволяет в случае ошибочного исполнения микроопераций избежать останова и сброса конвейера, который приводил бы к более серьёзным потерям.

Модели

Процессор с кодовым именем Willamette впервые появился в официальных планах компании Intel в октябре 1998 года , хотя его разработка и началась вскоре после завершения работ над процессором Pentium Pro , вышедшим в конце 1995 года , а название «Willamette» упоминалось в анонсах 1996 года . Необходимость в проектировании нового процессора архитектуры IA-32 появилась в связи со сложностями, возникшими при разработке 64-битного процессора Merced , которому в соответствии с планами компании Intel была отведена роль преемника процессоров архитектуры : разработка, осуществлявшаяся с 1994 года , сильно затянулась, а производительность Merced при выполнении инструкций x86 оказалась неудовлетворительной по сравнению с процессорами, для замены которых он предназначался .

Предполагалось, что Willamette выйдет во второй половине 1998 года , однако, в результате многочисленных задержек анонс был перенесён на конец 2000 года . В феврале 2000 года на форуме разработчиков Intel (IDF Spring 2000) был продемонстрирован компьютер, основой которого служил инженерный образец процессора Willamette, получившего наименование «Pentium 4», работающий на частоте 1,5 ГГц .

Первые серийные процессоры Pentium 4 на ядре , анонсированные 20 ноября 2000 года, производились по 180 нм технологии. Дальнейшим развитием семейства Pentium 4 стали процессоры на ядре , производившиеся по 130 нм технологии. 2 февраля 2004 года были представлены первые процессоры на ядре (90 нм), а последним ядром, использовавшимся в процессорах Pentium 4 стало ядро (65 нм). На базе ядер Northwood и Prescott выпускались также мобильные процессоры Pentium 4 и Pentium 4-M, представлявшие собой Pentium 4 с пониженным энергопотреблением. На базе всех ядер, перечисленных выше, выпускались также процессоры Celeron , предназначенные для бюджетных компьютеров, представлявшие собой Pentium 4 с уменьшенным объёмом кэш-памяти второго уровня и пониженной частотой системной шины .

Ниже представлены даты анонса различных моделей процессоров Pentium 4, а также их стоимость на момент анонса.

Мобильные процессоры Pentium 4
Процессор Pentium 4-M Mobile Pentium 4
Тактовая частота, ГГц 1,6 1,7 1,4 1,5 1,8 1,9 2 2,2 2,4 2,5 2,6 2,4 2,666 2,8 3,066 3,2 3,333
Анонсирован 4 марта 23 апреля 24 июня 16 сентября 14 января 16 апреля 11 июня 23 сентября 28 сентября
2002 года 2003 года 2004 года
Цена, $ 392 496 198 268 637 431 637 562 562 562 562 185 220 275 417 653 262

Pentium 4

Willamette

Pentium 4 1800 на ядре Willamette (FC-mPGA2)

Ещё до выхода первых Pentium 4 предполагалось, что и процессоры на ядре Willamette, и разъём Socket 423 будут присутствовать на рынке лишь до середины 2001 года, после чего будут заменены на процессоры на ядре Northwood и разъём Socket 478 . Однако, в связи с проблемами при внедрении 130 нм технологии, лучшим по сравнению с ожидавшимся процентом выхода годных кристаллов процессоров на ядре Willamette, а также необходимостью продажи уже выпущенных процессоров, анонс процессоров на ядре Northwood был отложен до 2002 года, а 27 августа 2001 года были представлены процессоры Pentium 4 в корпусе типа FC-mPGA2 (Socket 478), в основе которых по-прежнему лежало ядро Willamette .

Процессоры Pentium 4 на ядре Willamette работали на тактовой частоте 1,3-2 ГГц с частотой системной шины 400 МГц, напряжение ядра составляло 1,7-1,75 В в зависимости от модели, а максимальное тепловыделение - 100 Вт на частоте 2 ГГц .

Northwood

Intel Pentium 4 1800 на ядре Northwood

14 ноября 2002 года был представлен процессор Pentium 4 3066 МГц, поддерживающий технологию виртуальной многоядерности - Hyper-threading . Этот процессор оказался единственным процессором на ядре Northwood с частотой системной шины 533 МГц, обладавшим поддержкой технологии Hyper-threading. В дальнейшем эту технологию поддерживали все процессоры с частотой системной шины 800 МГц (2,4-3,4 ГГц) .

Характерной особенностью процессоров Pentium 4 на ядре Northwood была невозможность продолжительной работы при повышенном напряжении ядра (повышение напряжения ядра при разгоне является распространённым приёмом, позволяющим повысить стабильность работы на повышенных частотах ). Повышение напряжения ядра до 1,7 В приводило к быстрому выходу процессора из строя, несмотря на то, что температура кристалла при этом оставалась невысокой. Это явление, названное «синдромом внезапной смерти Northwood» (англ. sudden Northwood death syndrome ), серьёзно ограничивало разгон Pentium 4 на ядре Northwood .

Prescott

Pentium 4 2800E на ядре Prescott (Socket 478)

Pentium 4 3400 на ядре Prescott (LGA 775)

Процессоры Pentium 4 на ядре Prescott получили поддержку нового дополнительного набора команд - SSE3 , а также поддержку технологии EM64T (в ранних процессорах поддержка 64-битных расширений была отключена). Кроме того, была оптимизирована технология Hyper-threading (в частности, в набор SSE3 вошли инструкции, предназначенные для синхронизации потоков) .

В результате изменений, внесённых в архитектуру NetBurst, производительность процессоров на ядре Prescott изменилась по сравнению с процессорами на ядре Northwood, имеющими равную частоту, следующим образом: в однопоточных приложениях, использующих инструкции x87 , MMX , SSE и SSE2 , процессоры на ядре Prescott оказывались медленнее, чем предшественники, а в приложениях, использующих многопоточность или чувствительных к объёму кэш-памяти второго уровня, опережали их .

Cedar Mill

Pentium 4 641 на ядре Cedar Mill

Процессоры Pentium 4 на ядре Cedar Mill выпускались до 8 августа 2007 года , когда компания Intel объявила о снятии с производства всех процессоров архитектуры NetBurst.

Отменённые процессоры

Предполагалось, что в конце 2004 - начале 2005 годов на смену ядру Prescott в настольных процессорах Pentium 4 придёт новое ядро Tejas. Процессоры на ядре Tejas должны были выпускаться по 90 нм технологии, работать на частоте от 4,4 ГГц с частотой системной шины 1066 МГц, иметь увеличенный до 24 Кбайт кэш первого уровня и улучшенную поддержку технологии Hyper-threading . В конце 2005 года процессоры на ядре Tejas должны были быть переведены на 65 нм технологию производства и достичь частоты 9,2 ГГц . В перспективе тактовая частота процессоров архитектуры NetBurst должна была превысить отметку в 10 ГГц, однако сроки анонса Tejas постоянно переносились, процессоры на ядре Prescott не смогли достичь частоты 4 ГГц из-за проблем с тепловыделением, в связи с чем в начале 2004 года появилась информация об отмене выпуска процессоров на ядре Tejas , а 7 мая 2004 года компания Intel официально объявила о прекращении работы как над ядром Tejas, так и над перспективными разработками, основанными на архитектуре NetBurst .

Pentium 4 Extreme Edition

Первые процессоры Pentium 4 Extreme Edition (Pentium 4 «EE» или «XE»), предназначенные для энтузиастов , были представлены компанией Intel 3 ноября 2003 года. В их основе лежало ядро Gallatin, использовавшееся в серверных процессорах Xeon и представлявшее собой ядро Northwood ревизии M0 с кэш-памятью третьего уровня объёмом 2 Мбайт . Площадь кристалла таких процессоров составляла 237 мм².

Процессоры Pentium 4 EE на ядре Gallatin работали на частоте 3,2-3,466 ГГц, имели частоту системной шины 1066 МГц для модели, работающей на 3,466 ГГц, и 800 МГц для остальных моделей (3,2 и 3,4 ГГц). Напряжение ядра составляло 1,4-1,55 В, а максимальное тепловыделение - 125,59 Вт на частоте 3,466 ГГц. Изначально процессоры Pentium 4 EE ядре Gallatin выпускались в корпусе типа FC-mPGA2 (Socket 478), а затем - в корпусе типа FC-LGA4 (LGA775).

21 февраля 2005 года компанией Intel был представлен процессор Pentium 4 EE на ядре Prescott 2M. Он выпускался в корпусе типа FC-LGA4, предназначался для установки в системные платы с разъёмом LGA775 и работал на частоте 3,733 ГГц. Частота системной шины составляла 1066 МГц, напряжение питания - 1,4 В, максимальное тепловыделение - 148,16 Вт.

Дальнейшим развитием семейства Extreme Edition стали двухъядерные процессоры Pentium XE .

Pentium 4-M и Mobile Pentium 4

Мобильные процессоры Pentium 4-M представляли собой Pentium 4 на ядре Northwood, имеющие пониженное напряжение питания и тепловыделение, а также поддерживающие энергосберегающую технологию Intel SpeedStep . Максимально допустимая температура корпуса была повышена по сравнению с процессорами для настольных компьютеров и составляла 100 °C (у настольных процессоров на ядре Northwood - от 68 до 75 °C), что было связано с условиями работы в ноутбуке (небольшое воздушное пространство и размеры радиатора, менее сильный воздушный поток).

Все процессоры Pentium 4-M работали с частотой системной шины 400 МГц. Напряжение ядра процессоров Pentium 4-M составляло 1,3 В, максимальное тепловыделение - 48,78 Вт на частоте 2,666 ГГц, типичное - 35 Вт, в режиме пониженного энергопотребления - 13,69 Вт. Процессоры Pentium 4-M работали на частотах от 1,4 до 2,666 ГГц.

Процессоры Mobile Pentium 4 представляли собой Pentium 4 на ядрах Northwood или Prescott и работали на более высоких по сравнению с Pentium 4-M тактовых частотах - от 2,4 до 3,466 ГГц. Некоторые процессоры Mobile Pentium 4 поддерживали технологию Hyper-threading.

Все процессоры Mobile Pentium 4 работали с частотой системной шины 533 МГц. Напряжение ядра составляло 1,325-1,55 В, максимальное тепловыделение - 112 Вт на частоте 3,466 ГГц, типичное - от 59,8 до 88 Вт, в режиме пониженного энергопотребления - от 34,06 до 53,68 Вт.

Положение на рынке

Процессоры Pentium 4 Extreme Edition являлись «имиджевыми » процессорами, а оптовая цена на эти процессоры в момент анонса всегда составляла 999 $ .

Несмотря на то, что в течение года после анонса Pentium 4 основу продаж компании Intel по-прежнему составляли процессоры Pentium III (это было связано с крайне высокой стоимостью систем на базе Pentium 4 в сочетании с памятью типа RDRAM , альтернативы которой не было до выхода набора микросхем Intel 845 осенью 2001 года ), впоследствии благодаря агрессивной рекламной и маркетинговой политике компании Intel (в том числе, предоставление скидок производителям компьютеров и торговым сетям за использование и продажу исключительно продукции Intel, а также выплаты за отказ от использования продукции конкурентов ) в сочетании с неудачной маркетинговой политикой основного конкурента - компании AMD, процессоры Pentium 4 стали популярны среди пользователей . Этому также способствовала более высокая тактовая частота процессоров Pentium 4 (в частности, из-за высокой тактовой частоты процессоров конкурента, а также популярности «мифа о мегагерцах » , компания AMD была вынуждена ввести рейтинг производительности процессоров Athlon XP, нередко вводивший неопытных пользователей в заблуждение ). Тем не менее, компании AMD удалось серьёзно потеснить Intel на рынке микропроцессоров благодаря удачным продуктам - ранним Athlon XP и Athlon 64, превосходившим процессоры Pentium 4 в производительности и имеющим меньшую стоимость. Так, с 2000 по 2001 год компании AMD удалось увеличить свою долю на рынке процессоров архитектуры x86 с 18 % до 22 % (доля Intel при этом сократилась с 82,2 % до 78,7 %), а после решения проблем, возникших у AMD в 2002 году, когда её доля на рынке сократилась до 14 %, с 2003 по 2006 - до 26 % (доля Intel - около 73 %) .

Сравнение с конкурентами

Параллельно с процессорами семейства Pentium 4 существовали следующие x86-процессоры:

  • Intel Pentium III-S (Tualatin). Предназначались для рабочих станций и серверов. Несмотря на меньшую тактовую частоту, по производительности превосходили процессоры Pentium 4 на ядре Willamette в большинстве задач. Кроме того, в отличие от Pentium 4, процессоры Pentium III-S могли работать в двухпроцессорной конфигурации. Также компанией Intel выпускались процессоры Pentium III на ядре Tualatin, отличавшиеся от Pentium III-S меньшим объёмом кэш-памяти второго уровня. Оба этих процессора не получили широкого распространения: они были представлены позже, чем Pentium 4, являвшиеся в то время флагманскими процессорами компании Intel, и стоили значительно дороже, чем Pentium 4, имеющие сравнимую производительность .
  • Intel Celeron (Tualatin). Представляли собой Pentium III с уменьшенной частотой системной шины, предназначались для недорогих систем и в целом уступали процессорам Pentium 4 за счёт меньшей тактовой частоты (старшая модель Celeron работала на частоте 1,4 ГГц, в то время, как младшая модель Pentium 4 - на 1,3 ГГц) и небольшой пропускной способности памяти (в системах на процессорах Celeron обычно использовалась память PC133 SDRAM , а процессоры Pentium 4 чаще всего работали с памятью типа RDRAM или DDR SDRAM) и системной шины (100 МГц против 400 МГц) . Производительность разогнанных Celeron была сравнима с производительностью равночастотных Pentium 4 при более низкой цене .
  • Intel Celeron (Willamette-128 и Northwood-128), Celeron D (Prescott-256 и Cedar Mill-512). Представляли собой Pentium 4 с уменьшенными частотой системной шины и размером кэш-памяти второго уровня, предназначались для недорогих систем и всегда уступали процессорам Pentium 4. В некоторых задачах Celeron на ядре Willamette-128 уступали также и предшественникам (Celeron на ядре Tualatin) со значительно более низкими частотами .
  • Intel Pentium M и Celeron M . Являлись дальнейшим развитием процессоров Pentium III. Предназначались для мобильных компьютеров, обладали низким энергопотреблением и тепловыделением. Pentium M опережал как большинство мобильных Pentium 4 M, так и некоторые настольные процессоры Pentium 4, обладая при этом значительно меньшими тактовой частотой и тепловыделением . Процессор Celeron M имел близкую к Pentium M производительность, незначительно отставая от него.
  • Intel Pentium D (Presler, Smithfield). Двухъядерные процессоры, представлявшие собой два ядра Prescott (процессоры на ядре Smithfield) или Cedar Mill (Presler), находящиеся либо на одном кристалле (Smithfield), либо в одном корпусе (Presler). Опережали равночастотные Pentium 4 в большинстве задач. Однако процессоры Pentium 4 имели большую тактовую частоту, чем Pentium D (старшая модель Pentium D на ядре Smithfield работала на частоте 3,2 ГГц, а старшая модель Pentium 4 - на 3,8 ГГц), что позволяло им опережать двухъядерные процессоры в задачах, не оптимизированных под многопоточность .
  • AMD Athlon (Thunderbird). Конкурировали с процессорами Pentium 4 на ядре Willamette. В задачах, использующих дополнительные наборы инструкций SSE и SSE2 , требующих высокой пропускной способности памяти, а также в приложениях, оптимизированных под архитектуру NetBurst (приложения, работающие с потоковыми данными), процессоры Athlon уступали процессорам Pentium 4, однако в офисных и бизнес-приложениях, задачах трёхмерного моделирования, а также в математических расчётах, процессоры Athlon показывали более высокую производительность .
  • AMD Athlon XP . Конкурировали в основном с процессорами Pentium 4 на ядре Northwood. В названиях моделей этих процессоров фигурировала не тактовая частота, а рейтинг, показывающий производительность процессоров Athlon XP относительно Pentium 4. «Равнорейтинговые» Athlon XP уступали процессорам Pentium 4 в приложениях, оптимизированных под архитектуру NetBurst, требовавших наличие поддержки инструкций SSE2 или высокой пропускной способности памяти, однако значительно опережали их в вычислениях с плавающей запятой и неоптимизированных приложениях. Старшие Pentium 4 опережали конкурента в большинстве приложений .
  • AMD Athlon 64 . Конкурировали в основном с процессорами Pentium 4 на ядре Prescott. Опережали их в ряде задач (например, офисные приложения, научные расчёты или игры) за счёт меньших задержек при работе с памятью (за счёт встроенного контроллера памяти) и более эффективного математического сопроцессора, уступали процессорам Pentium 4 в задачах, оптимизированных под архитектуру NetBurst или имеющих поддержку многопоточности (например, кодирование видео) .
  • AMD Athlon 64 FX . Конкурировали с процессорами Pentium 4 Extreme Edition. Как и в случае с Athlon 64 и Pentium 4, Athlon 64 FX опережали конкурентов за счёт архитектурных особенностей, интегрированного контроллера памяти или более эффективного математического сопроцессора, уступая им в задачах, оптимизированных под архитектуру NetBurst или имеющих поддержку многопоточности .
  • AMD Duron (Morgan и Applebred). Были нацелены на рынок недорогих процессоров и конкурировали с процессорами Celeron, в целом уступая процессорам Pentium 4, однако в некоторых приложениях, которые не были оптимизированы под архитектуру NetBurst и не использовали набор инструкций SSE2, могли опережать Pentium 4, имеющие значительно более высокие тактовые частоты .
  • VIA C3 (Nehemiah) и VIA Eden. Предназначались для компьютеров с низким энергопотреблением и ноутбуков (C3 и Eden-N) и для интегрирования в системные платы (Eden), имели низкую производительность и уступали конкурирующим процессорам.
  • VIA C7 . Также, как и процессоры VIA C3, предназначались для компьютеров с низким энергопотреблением и ноутбуков. Серьёзно уступали конкурентам и могли опережать их только в задачах шифрования (за счёт его аппаратной поддержки) .
  • Transmeta Efficeon . Предназначались для ноутбуков, имели низкое энергопотребление и тепловыделение. Уступали в большинстве задач мобильным процессорам AMD и Intel, опережая мобильные процессоры VIA .

Работавшие на высокой частоте процессоры Pentium 4 отличались большим энергопотреблением и, как следствие, тепловыделением. Максимальная тактовая частота серийных процессоров Pentium 4 составила 3,8 ГГц, при этом типичное тепловыделение превысило 100 Вт , а максимальное - 150 Вт . Однако при этом процессоры Pentium 4 были лучше защищены от перегрева, чем конкурирующие процессоры. Работа Thermal Monitor - технологии термозащиты процессоров Pentium 4 (а также последующих процессоров Intel) - основана на механизме модуляции тактового сигнала (англ. clock modulation ), позволяющем регулировать эффективную частоту работы ядра с помощью введения холостых циклов - периодического отключения подачи тактового сигнала на функциональные блоки процессора («пропуск тактов», «троттлинг »). При достижении порогового значения температуры кристалла, зависящего от модели процессора, автоматически включается механизм модуляции тактового сигнала, эффективная частота снижается (при этом определить её снижение можно либо по замедлению работы системы, либо с помощью специального программного обеспечения, так как фактическая частота остаётся неизменной), а рост температуры замедляется. В том случае, если температура всё же достигает максимально допустимой, происходит отключение системы . Кроме того, поздние процессоры Pentium 4 (начиная с ядра Prescott ревизии E0 ), предназначенные для установки в разъём Socket 775, обладали поддержкой технологии Thermal Monitor 2, позволяющей снижать температуру путём снижения фактической тактовой частоты (с помощью понижения множителя) и напряжения ядра .

Наглядным примером эффективности термозащиты процессоров Pentium 4 стал эксперимент, проведённый в 2001 году Томасом Пабстом. Целью этого эксперимента являлось сравнение эффективности термозащиты процессоров Athlon 1,4 ГГц, Athlon MP 1,2 ГГц, Pentium III 1 ГГц и Pentium 4 2 ГГц на ядре Willamette. После снятия кулеров с работающих процессоров, процессоры Athlon MP и Athlon получили необратимые термические повреждения, а система на Pentium III зависла, в то время как система с процессором Pentium 4 лишь замедлила скорость работы . Несмотря на то, что ситуация с полным отказом системы охлаждения (например, в случае разрушения крепления радиатора), смоделированная в экспериментах, маловероятна, а в случае возникновения приводит к более серьёзным последствиям (например, к разрушению плат расширения или системной платы в результате падения на них радиатора) вне зависимости от модели процессора , результаты эксперимента Томаса Пабста отрицательно повлияли на популярность конкурирующих процессоров AMD, а мнение о их ненадёжности было широко распространено даже после выхода процессоров Athlon 64 , имеющих более эффективную по сравнению с предшественником систему защиты от перегрева. К тому же температуры процессоров Intel в данном эксперименте, равные 29 и 37 по Цельсию, вызывают сомнение - ведь это рабочие температуры процессоров Intel при нулевой загрузке ЦПУ, и при наличии штатной системы охлаждения. Разумеется, при снятом радиаторе они ведут себя по другому: нагреваются до критической температуры, срабатывает тепловая защита и компьютер выключается. А если учесть, что тепловыделение Pentium 4 не меньше, чем у Athlon, то вопросов с дымящимся через считанные секунды AMD и работающим несколько секунд после снятия системы охлаждения Intel не убавляется. Просто в эксперименте Томаса Пабста были показаны в гипертрофированном виде имеющие место: достоинства процессоров Intel и недостатки процессоров AMD, относительно тепловой защиты. Возможно, это была рекламная акция в пользу новых процессоров Intel, особенно учитывая отношение потребителей к первым процессорам Pentium 4 из-за их высокой цены и низкой производительности.

Из-за особенностей архитектуры NetBurst, позволявших процессорам работать на высокой частоте, процессоры Pentium 4 пользовались популярностью среди оверклокеров . Так, например, процессоры на ядре Cedar Mill были способны работать на частотах, превышавших 7 ГГц , с использованием экстремального охлаждения (обычно использовался стакан с жидким азотом) , а младшие процессоры на ядре Northwood со штатной частотой системной шины 100 МГц надёжно работали при частоте системной шины 133 МГц и выше .

Технические характеристики

Willamette Northwood Gallatin Prescott Prescott 2M Cedar Mill
Настольный Настольный Мобильный Настольный Мобильный Настольный
Тактовая частота
Частота ядра, ГГц 1,3-2 1,6-3,4 1,4-3,2 3,2-3,466 2,4-3,8 2,8-3,333 2,8-3,8 3-3,6
Частота FSB , МГц 400 400, 533, 800 400, 533 800, 1066 533, 800, 1066 () 800
Характеристики ядра
Набор инструкций IA-32 , MMX , SSE , SSE2 IA-32 , EM64T (некоторые модели), MMX , SSE , SSE2 , SSE3
Разрядность регистров 32/64 бит (целочисленные), 80 бит (вещественночисленные), 64 бит (MMX), 128 бит (SSE)
Глубина конвейера 20 стадий (без учёта декодера инструкций) 31 стадия (без учёта декодера инструкций)
Разрядность ША 36 бит 40 бит
Разрядность ШД 64 бит
Аппаратная предвыборка данных есть
Количество

Введение

Передначалом сезона летних отпусков оба ведущих производителя процессоров,AMD и Intel, выпустили последние модели процессоров в своих современныхлинейках CPU, нацеленных на использование в высокопроизводительных PC.Сначала сделала последний шаг перед предстоящим качественным скачкомAMD и примерно с месяц назад представила Athlon XP 3200+, который, какпредполагается, станет самым быстрым представителем семейства AthlonXP. Дальнейшие же планы AMD в этом секторе рынка связываются уже спроцессором следующего поколения с x86-64 архитектурой, Athlon 64,который должен появится в сентябре этого года. Intel же выждалнебольшую паузу и представил последний из Penlium 4 на 0.13-микронномядре Northwood только сегодня. В итоге, заключительной моделью в этомсемействе стал Pentium 4 с частотой 3.2 ГГц. Пауза перед выходомследующего процессора для настольных PC, основанного на новомядре Prescott, продлится до четвертого квартала, когда Intel вновьподнимет планку быстродействия своих процессоров для настольныхкомпьютеров благодаря росту тактовой частоты и усовершенствованнойархитектуре.

Следует отметить, что за времяпротивостояния архитектур Athlon и Pentium 4, показала себя болеемасштабируемой архитектура от Intel. За период существования Pentium 4,выпускаемых по различным технологическим процессам, их частота вырослауже более чем вдвое и без проблем достигла величины 3.2 ГГц прииспользовании обычного 0.13-микронного технологического процесса. AMDже, задержавшаяся со своими Athlon XP на отметке 2.2 ГГц, не можетпохвастать на настоящий момент столь же высокими частотами своихпроцессоров. И хотя на одинаковых частотах Athlon XP значительнопревосходит по быстродействию Pentium 4, постоянно увеличивающийсяразрыв в тактовых частотах сделал свое дело: Athlon XP 3200+ с частотой2.2 ГГц назвать полноценным конкурентом Penium 4 3.2 ГГц можно лишь созначительными оговорками.

На графике ниже мы решили показать, как росли частоты процессоров семейств Pentium 4 и Athlon за последние три года:

Каквидим, частота 2.2 ГГц является для AMD непреодолимым барьером, покоренкоторый будет в лучшем случае только лишь во второй половине следующегогода, когда AMD переведет свои производственные мощности наиспользование 90-нанометровой технологии. До этих же пор дажепроцессоры следующего поколения Athlon 64 будут продолжать иметь стольневысокие частоты. Смогут ли они при этом составить достойнуюконкуренцию Prescott – сказать трудно. Однако, похоже, AMD ждут тяжелыепроблемы. Prescott, обладающий увеличенным кешем первого и второгоуровня, усовершенствованной технологией Hyper-Threading и растущимичастотами может стать гораздо более привлекательным предложением,нежели Athlon 64.

Что касается процессоров Pentium4, то их масштабируемости можно только позавидовать. Частоты Pentium 4плавно увеличиваются с самого момента выхода этих процессоров.Небольшая пауза, наблюдающаяся летом-осенью этого года, объясняетсянеобходимостью внедрения новоготехнологического процесса, но она не должна повлиять на расстановку силна процессорном рынке. Включив технологию Hyper-Threading и переведясвои процессоры на использование 800-мегагерцовой шины, Intel добилсяощутимого превосходства старших моделей своих CPU над процессорамиконкурента и теперь может ни о чем не беспокоиться, по крайней мере, доначала массового распространения Athlon 64.

Такжена графике выше мы показали и ближайшие планы компаний AMD и Intel повыпуску новых CPU. Похоже, AMD в ближайшее время не должна питатьникаких иллюзий по поводу своего положения на рынке. Борьба с Intel наравных для нее заканчивается, компаниявозвращается в привычную для себя роль догоняющего. Впрочем,долгосрочные прогнозы строить пока рано, посмотрим, что даст для AMDвыход Athlon 64. Однако, судя по сдержанной реакции разработчиковпрограммного обеспечения на технологию AMD64, никакой революции свыходом следующего поколения процессоров от AMD не произойдет.

Intel Pentium 4 3.2 ГГц

Новыйпроцессор Pentium 4 3.2 ГГц, который Intel анонсировал сегодня, 23июня, с технологической точки зрения ничего особенного собой непредставляет. Это все тот же Northwood, работающий на частоте шины 800МГц и поддерживающий технологию Hyper-Threading. То есть, по сути,процессор полностью идентичен (за исключением тактовой частоты) Pentium4 3.0, который был анонсирован Intel в апреле.

Процессор Pentium 4 3.2 ГГц, как и предшественники, использует ядро степпинга D1

Единственныйфакт, который следует отметить в связи с выходом очередного процессораPentium 4 на ядре Northwood – это вновь возросшее тепловыделение.Теперь типичное тепловыделение Pentium 4 3.2 ГГц составляет порядка 85Вт, а максимальное — ощутимо превышает величину 100 Вт. Именно поэтомуиспользование грамотно спроектированных корпусов является одним изнеобходимых требований при эксплуатации систем на базе Pentium 4 3.2ГГц. Одного вентилятора в корпусе теперь явно недостаточно, кроме того,необходимо следить и за тем, чтобы воздух в районе размещенияпроцессора хорошо вентилировался. Intel также говорит и о том, чтотемпература воздуха, окружающего процессорный радиатор, не должнапревышать 42 градуса.

Ну и еще раз напомним, чтопредставленный Pentium 4 3.2 ГГц – последний CPU от Intel длявысокопроизводительных настольных систем, основанный на 0.13-микроннойтехнологии. Следующий процессор для таких систем будет использовать уженовое ядро Prescott, изготавливаемое по 90-нанометровой технологии.Соответственно, тепловыделение будущих процессоров для настольных PCбудет меньше. Следовательно, Pentium 4 3.2 ГГц так и останетсярекордсменом по тепловыделению.

Официальная ценана Pentium 4 3.2 ГГц составляет $637, а это значит, что данныйпроцессор является самым дорогим CPU для настольных компьютеров насегодняшний день. Более того, Intel рекомендует использовать новинку снедешевыми материнскими платами на базе набора логики i875P. Однако,как мы знаем, данным требованием можно пренебречь: многие более дешевыесистемные платы на базе i865PE обеспечивают аналогичный уровеньпроизводительности благодаря активизации производителями технологии PATи в наборе логики i865PE.

Как мы тестировали

Цельюданного тестирования являлось выяснение того уровня производительности,который может обеспечить новый Pentium 4 3.2 ГГц по сравнению спредшественниками и старшими моделями конкурирующей линейки Athlon XP.Таким образом, в тестировании помимо Pentium 4 3.2 ГГц приняли участиеPetnium 4 3.0 ГГц, Athlon XP 3200+ и Athlon XP 3000+. В качествеплатформы для тестов Pentium 4 мы выбрали материнскую плату на чипсетеi875P (Canterwood) с двухканальной DDR400 памятью, а тесты Athlon XPпроводились при использовании материнской платы на базе наиболеепроизводительного чипсета NVIDIA nForce 400 Ultra.

Состав тестовых систем приведен ниже:

Процессоры

Intel Pentium 4 3.2 ГГц (800 МГц шина)
Intel Pentium 4 3.0 ГГц (800 МГц шина)

AMD Athlon 3200+ (2.2 ГГц, 400 МГц шина)
AMD Athlon 3000+ (2.17 ГГц, 333 МГц шина)

Материнские платы

ASUS P4C800 Deluxe

ASUS A7N8X Deluxe 2.0

512 Мбайт DDR400 SDRAM (2 x 256 Мбайт)

Видеокарта

ATI RADEON 9700 PRO (драйвер Catalyst 3.4)

Жесткий диск

Western Digital Raptor WD360GD

Примечания:

Памятьво всех случаях эксплуатировалась в синхронном режиме с FSB вдвухканальной конфигурации. Использовались наиболее агрессивныетайминги 2-2-2-5. Тестирование выполнялось в операционной системе Windows XP SP1 с установленным пакетом DirectX 9.0a.

Производительность в офисных приложениях и приложениях для создания контента

Впервую очередь по сложившейся традиции мы измерили скорость процессоровв офисных приложениях и приложениях, работающих с цифровых контентом.Для этого мы воспользовались тестовыми пакетами семейства Winstone.

ВBusiness Winstone 2002, включающем в себя типовые офисныебизнес-приложения, на высоте оказываются процессоры семейства AthlonXP, производительность которых ощутимо превосходит скорость процессоровконкурирующего семейства. Данная ситуация достаточно привычна для этоготеста и обуславливается как особенностями архитектуры Athlon XP, так ибольшим объемом кеш-памяти у ядра Barton, суммарная емкость которойблагодаря эксклюзивности L2 достигает 640 Кбайт.

Вкомплексном тесте Multimedia Content Creation Winstone 2003, измеряющемскорость работы тестовых платформ в приложениях для работы с цифровымконтентом, картина несколько иная. Процессоры Pentium 4, имеющиеNetBurst архитектуру и обладающие высокоскоростной шиной с пропускнойспособностью 6.4 Гбайта в секунду оставляют старшие модели Athlon XPдалеко позади.

Производительность при обработке потоковых данных

Большинствоприложений, работающих с потоками данных, как известно, работаетбыстрее на процессорах Pentium 4. Здесь раскрываются все преимуществаNetBurst архитектуры. Поэтому, результат, полученный нами в WinRAR 3.2,не должен никого удивлять. Старшие Pentium 4 значительно обгоняют поскорости сжатия информации топовые Athlon XP.

Аналогичнаяситуация наблюдается и при кодировании звуковых файлов в формат mp3кодеком LAME 3.93. Кстати, данный кодек поддерживает многопоточность,поэтому высокие результаты Pentium 4 здесь можно отнести и на счетподдержки этими CPU технологии Hyper-Threading. В итоге, Pentium 4 3.2обгоняет старший Athlon XP с рейтингом 3200+ почти на 20%.

Вданное тестирование мы включили результаты, полученные при измерениискорости кодирования AVI ролика в формат MPEG-2 одним из лучшихкодеров, Canopus Procoder 1.5. Как это не удивительно, Athlon XP вданном случае показывает слегка более высокую производительность.Впрочем, отнести это, скорее всего, следует на счетвысокопроизводительного блока операций с плавающей точкой,присутствующего в Athlon XP. SSE2 инструкции процессоров Pentium 4 вданном случае, как мы видим, не могут являться столь же сильнойальтернативой. Правда, следует отметить, что разрыв в скорости старшихмоделей Athlon XP и Pentium 4 совсем небольшой.

Кодированиевидео в формат MPEG-4 – еще один пример задачи, где процессоры Pentium4 с технологией Hyper-Threading и 800-мегагерцовой шиной демонстрируетсвои сильные стороны. Превосходство Pentium 4 3.2 над Athlon XP 3200+ вэтом тесте составляет почти 20%.

Аналогичнаяситуация наблюдается и при кодировании видео при помощи Windows MediaEncoder 9: это приложение имеет оптимизацию под набор команд SSE2 иотлично приспособлено для NetBurst архитектуры. Поэтому, совершеннонеудивительно, что вновь верхнюю часть диаграммы оккупировалипроцессоры от Intel.

Производительность в игровых приложениях

После выхода пропатченной версии3Dmark03 результаты Pentium 4 относительно Athlon XP в этом тесте сталинесколько выше. Однако расклад сил это не изменило: Pentium 4лидировали в этом бенчмарке и ранее.

Pentium4 подтверждает свое лидерство и в общем зачете в 3Dmark03. Правда,отрыв здесь небольшой: сказывается тот факт, что 3Dmark03 в первуюочередь – это тест видеоподсистемы.

Послеперехода Pentium 4 на использование 800-мегагерцовой шины, Pentium 4стали обгонять Athlon XP и в более старой версии 3Dmark2001. Причем,отрыв Pentium 4 3.2 ГГц от Athlon XP 3200+ уже достаточно существенен исоставляет 6%.

В Quake3 Pentium 4 традиционно обгоняет Athlon XP, поэтому результат удивления не вызывает.

Аналогичнаякартина наблюдается и в игре Return to Castle Wolfenstein. Этосовершенно логично, поскольку данная игра использует тот же движокQuake3.

Одноиз немногих приложений, где старшей модели Athlon XP удается удержатьлидерство, это – Unreal Tournament 2003. Хочется отметить, что всесовременные игры не имеют поддержки технологии Hyper-Threading, поэтомув играх потенциал новых Pentium 4 пока раскрывается не полностью.

Авот в Serious Sam 2 Athlon XP 3200+ больше лидером не является. Свыходом нового процессора от Intel пальма первенства в этой игрепереходит именно к Pentium 4 3.2 ГГц.

Новаяигра Splinter Cell, хотя и основана на том же движке, что и UnrealTournament 2003, быстрее работает на процессорах от Intel.

Вцелом, остается признать, что быстрейшим процессором для современных 3Dигр на данный момент является Pentium 4 3.2 ГГц, обходящий Athlon XP3200+ в большинстве игровых тестов. Ситуация меняется стремительно. Ещесовсем недавно старшие Athlon XP в игровых тестах нисколько не уступалипроцессорам от Intel.

Производительность при 3D-рендеринге

Поскольку3ds max 5.1, который мы использовали в данном тестировании, хорошооптимизирован под многопоточность, Pentium 4, умеющий исполнять двапотока одновременно благодаря технологии Hyper-Threading, с большимотрывом оказывается лидером. Даже старший Athlon XP 3200+ не можетсоставить ему никакой конкуренции.

Абсолютнотоже самое можно сказать и про скорость рендеринга в Lightwave 7.5.Впрочем, в некоторых сценах, например при рендеринге Sunset, старшиемодели Athlon XP смотрятся не так уж и плохо, однако такие случаиединичны.

Споритьс Pentium 4, выполняющем два потока одновременно, в задачах рендерингадля Athlon XP сложновато. К сожалению, AMD не имеет планов по внедрениютехнологий, подобных Hyper-Threading даже в будущих процессорахсемейства Athlon 64.

Абсолютно аналогичная ситуация наблюдается и в POV-Ray 3.5.

Производительность при научных расчетах

Длятестирования скорости новых CPU от AMD при научных расчетах былиспользован пакет ScienceMark 2.0. Подробности об этом тесте можнополучить на сайте http://www.sciencemark.org/. Этот бенчмарк поддерживает многопоточность, а также все наборы SIMD-инструкций, включая MMX, 3DNow!, SSE и SSE2.

То,что в задачах математического моделирования или криптографии процессорысемейства Athlon XP показывают себя с наилучшей стороны, известнодавно. Здесь мы видим еще одно подтверждение этого факта. Хотя, надосказать, свое былое преимущество Athlon XP начинает терять. Например, втесте Molecular Dinamics на первое место выходит уже новый Pentium 43.2 ГГц.

Кроме теста ScienceMark в этом разделе мырешили протестировать и скорость работы новых процессоров в клиентероссийского проекта распределенных вычислений http://www.md-at-home.ru/start.htm,посвященному расчету динамических свойств олигопептидов (фрагментовбелков). Расчет свойств олигопептидов, возможно, сможет помочь изучениюфундаментальных свойств белков, тем самым, внеся вклад в развитиенауки.

Каквидим, задачи молекулярной динамики новые Pentium 4 решают быстрееAthlon XP. Столь высокого результата Pentium 4 достигают благодарясвоей технологии Hyper-Threading. Сам клиент MD@home, к сожалению,многопоточность не поддерживает, однако запуск двух клиентских программв параллели на системах с процессорами с технологией Hyper-Threadingпозволяет ускорить процесс расчета более чем на 40%.

Проведенноетестирование явно показывает, что на очередном этапе конкурентнойборьбы Intel удалось одержать победу над AMD. Последний процессор наядре Northwood обгоняет по своей производительности старшую и последнююмодель Athlon XP в большинстве тестов. За последнее время Intel смогзначительно увеличить частоты своих CPU, увеличить частоту их шины, атакже внедрить хитрую технологию Hyper-Threading, дающую дополнительныйприрост скорости в ряде задач. AMD же, не имея возможности наращиватьтактовые частоты своих процессоров ввиду технологических иархитектурных сложностей, не смогла адекватно усилить свои CPU. Непоправило положение даже появление нового ядра Barton: последние моделиPentium 4 оказываются явно сильнее старших Athlon XP. В результате,Pentium 4 3.2 ГГц вполне можно считать наиболее производительным CPUдля настольных систем в настоящее время. Такая ситуация продлится поменьшей мере до сентября, когда AMD, наконец, должна будет анонсироватьсвои новые процессоры семейства Athlon 64.

Необходимоотметить и тот факт, что рейтинговая система, используемая в настоящеевремя AMD для маркировки своих процессоров, не может больше являтьсякритерием, по которому Athlon XP можно сопоставлять с Pentium 4.Улучшения, которые произошли с Pentium 4, в числе которых следуетотметить перевод этих CPU на 800-мегагерцовую шину и внедрениетехнологии Hyper-Threading, привели к тому, что Pentium 4 с частотой,равной рейтингу соответствующего Athlon XP, оказывается явно быстрее.

Вобщем, мы с интересом будем ожидать осени, когда и AMD и Intelпредставят свои новые разработки, Prescott и Athlon 64, которые,возможно, смогут обострить конкурентную борьбу между давнимисоперниками на процессорном рынке. Сейчас же AMD оказывается оттесненаIntel в сектор недорогих процессоров где, впрочем, эта компаниячувствует себя превосходно: Celeron по сравнению с Athlon XP –откровенно слабый соперник.



Загрузка...