Интернет- версия проекта MegaPlus.ru

на главную | обратная связь  

Pentium 4 и новое ядро Northwood

В 2001 году Intel выпускает первый процессор из линейки Pentium 4 на ядре Willamette. Вряд ли можно было назвать его выпуск успешным. Уж сколько упреков и насмешек было высказано в адрес нового процессора. Увы, многие нарекания, были целиком справедливыми. Начнем с производительности. Куда это годится, чтобы только что выпущенный процессор нового поколения, работающий на в полтора раза большей частоте, проигрывал в скорости работы процессорам предыдущего поколения? А ведь именно так и обстояли дела -- Pentium 4, стартовавший с отметки 1.4 ГГц, далеко не во всех приложениях мог составить конкуренцию Pentium III, работавшему на частоте 1 ГГц.

Но разве только это обстоятельство, с позволения сказать, ограничивало всеобщую любовь к Pentium 4? Ведь для того, чтобы перейти на этот процессор, пользователю пришлось бы полностью сменить платформу. Единственный чипсет, поддерживающий Pentium 4 - i850 - мог работать только с исключительно дорогой, и как стало ясно чуть позже, малоперспективной памятью Rambus. Однако и это еще не все. Для использования Pentium 4 требовался специальный блок питания (поначалу, тоже недешевый), а иногда и новый корпус.

Не следует, впрочем, забывать, что в Pentium 4 инженеры Intel реализовали новую архитектуру NetBurst, которая имеет целый ряд особенностей и нововведений. Неудивительно поэтому, что поначалу могли возникнуть определенные трудности с адаптацией как программного обеспечения, так и, с позволения сказать, умов пользователей. Вы спросите, при чем тут корпус и память? К сожалению для Intel, на тот момент уж слишком неудачным оказался "расклад".

Описанию архитектуры NetBurst в процессорах Pentium 4, были посвящены многостраничные статьи во многих компьютерных изданиях. В n-ый раз пережевывать одно и то же нет, откровенно говоря, ни желания, ни сил. Интересующиеся с легкостью найдут эту информацию, мы же лишь вкратце перечислим основные отличительные особенности ядра Pentium 4:

  • очень длинный конвейер, насчитывающий 21 стадию
  • необычная архитектура кэш-памяти первого уровня
  • несомненная ориентация на блок мультимедийных инструкций SSE2

Что дает длинный конвейер? В идеале, если он полностью заполнен, то подготовка и обработка данных будет происходить по крайней мере не медленнее, чем при использовании более короткого конвейера. Однако, для этого необходимо, чтобы данные поступали на конвейер без перебоев. А в реальной жизни все же происходят сбои. Процессор, выполняя код программы, как бы заглядывает вперед и пытается угадать, по какой ветке дальше пойдет исполнение. Угадывает, и начинает предварительную подготовку данных, "загружая" их на конвейер (да простят меня профессионалы за подобные высказывания, пытаюсь объяснить на пальцах).

Следует отметить, что Pentium 4 угадывает ветку с большой долей вероятности, однако и он время от времени ошибается. В этом случае, если процессор не угадал, конвейер обнуляется, начинается загрузка новых данных: В течение этого времени код не выполняется, процессор, по сути простаивает, ожидая, пока будут подготовлены новые данные.

Положение могла бы спасти высокая скорость движения и наполнения подобного конвейера - читай, частота. Однако, 1.4 ГГц, на которой работал первый Pentium 4, была явно недостаточна. Сюда бы кэш память большого объема: но и такой не было возможности. Техпроцесс 0.18 мкм не позволил Intel интегрировать на ядро больше 256 Кб кэша второго уровня. Некоторые ухищрения были предприняты с кэш-памятью первого уровня, однако об их эффективности судить тяжело.

В отличие от AMD, которая оборудовала процессоры Athlon/Duron тремя независимыми блоками для вычислений с плавающей точкой (FPU), Intel не стала встраивать в Pentium 4 мощный математический модуль. Вместо этого, ставка была сделана на новый блок мультимедийных инструкций SSE2. Используя эти команды, разработчики могут зачастую отказаться от традиционных FPU-инструкций да еще и извлечь выгоду из одновременной обработки целых массивов данных. Да вот беда - для оптимизации приложений под SSE2 нужно время, которым они, программисты, на момент появления Pentium 4 не располагали. Кроме того, есть еще процессоры других компаний, в которых SSE2 нет. Следовательно, использовать только SSE2 без оглядки на non-Intel системы, нельзя.

Эти, и ряд других факторов, привели к тому, что запуск Pentium 4 оказался не самым удачным. И, следует признать, что Intel сделал все возможное, дабы с честью выйти из той тяжелой ситуации, в которой оказалась компания в начале года. Intel приложил максимум усилий для того, чтобы буквально протолкнуть новый процессор на рынок. Был пущен в ход весь арсенал рекламных и маркетинговых средств. Компьютерные издания и специализированные сайты с ног до головы были обклеены рекламой нового процессора, промо-ролики крутились по телевизору и на Big Board'ах. Вне всякого сомнения, была проведена работа и с ведущими производителями аппаратного обеспечения и, в частности, материнских плат. Многим из них Intel теми или иными способам продемонстрировал преимущества и перспективы новой платформы и убедил обратить свой взор в сторону Pentium 4.

Вдобавок, все это время Intel агрессивно снижал цену на Pentium 4. Очень быстро из "очень дорогого" процессора, Pentium 4 превратился сначала в "доступный", а потом даже в "дешевый" (если говорить о младших моделях). Со временем нормализовались цены на блоки питания, вырос список программного обеспечения, оптимизированного для Pentium 4. Чипсет i845, который хоть и не решал проблем со скоростью (скорее наоборот -- усугублял их), но по крайней мере позволил значительно снизить стоимость систем на базе Pentium 4 за счет отказа от дорогой RDRAM в пользу ставшей поразительно дешевой SDR SDRAM.

Ближе к концу года тучи над Pentium 4 и вовсе прояснились. Ведущие производители наборов системной логики выпустили чипсеты для Pentium 4 с поддержкой DDR SDRAM, а в начале 2002 года сам Intel наконец-то выпустил DDR-решение для своего процессора - Pentium 4. И финальным аккордом послужил запуск нового Pentium 4 на новом ядре Northwood.

Перейдя на новое ядро Northwood, Intel не стал менять или модифицировать коммерческое имя процессора. Он так и остался Pentium 4, без всяких приставок и окончаний. По большому счету, у ядра Northwood есть всего несколько существенных отличий от Willamette: более тонкий техпроцесс: 0.13 мкм против 0.18 мкм как следствие, вдвое увеличенный объем кэш-памяти второго уровня.

Как бы то ни было, но именно заветные 0.13 мкм дают Intel возможность и дальше продолжать интенсивное увеличение частот, так необходимое Pentium 4 и его длинному конвейеру. Не будем забывать и о маркетинговом значении роста частоты - конкуренты вынуждены вводить рейтинги, чтобы хотя бы формально не отставать от Intel. Именно 0.13 мкм и открывает перед Intel широкие перспективы развития платформы Pentium 4, подкрепленные, если так можно выразиться, DDR-аргументами. Впрочем, разговоры о достоинствах и перспективах новых Pentium 4 ничего не стоят без конкретных цифр и фактов.

Для начала посмотрим, какие результаты демонстрирует Pentium 4 Northwood в бизнес-приложениях. Безусловно, мы отдаем себе отчет, что при работе в MS Word скорость процессора после определенного рубежа практически перестает играть роль - с подобного рода задачами одинаково хорошо справляются и Celeron 800, и Pentium 4 2.2 ГГц.

Как видим, Pentium 4 Northwood значительно опережает Pentium 4 Willamette. Оно и не удивительно - помимо прироста частоты значительную лепту в увеличение производительности вносит, безусловно, удвоенный объем кэш-памяти второго уровня.

Аналогичная ситуация наблюдается и в архиваторах и в медиа-компрессоре. Здесь, правда, наличие большего или меньшего кэша играет не столь значительную роль - процессор все время обращается к новым данным. Поэтому, выигрыш в этих тестах большей мерой обусловлен именно разницей в частотах.

Да и в программах 3D-рендеринга прирост налицо. Здесь, конечно же, основная нагрузка ложится именно на процессор, ведь ни жесткий диск, ни видеокарта участие в расчете сцены не принимают. Вот он- чистый прирост производительности.

Наконец, Quake III и 3DMark 2001. С точки зрения игрока разницы между 255 кадрами в секунду и 220 нет. И тем не менее, учитывая увеличивающуюся прожорливость игр, увеличение производительности более чем на 15% не может не радовать.

Процессор Pentium 4 с ядром Northwood уже сейчас обладает отличной производительностью. И, несомненно, имеет очень неплохой запас по частоте - с новым 0.13 мкм техпроцессом Intel сможет еще долго наращивать частоту.

Михаил Пинкус