Следует напомнить, что предшественники микроархитектуры Core, процессоры Pentium M, обладали чрезвычайно интересной технологией micro-ops fusion, направленной на снижение "накладных расходов" при выполнении некоторых x86 команд. Суть технологии micro-ops fusion чрезвычайно проста. В случае если x86 команда распадается на зависимые друг от друга микроинструкции, декодер осуществляет их привязку друг к другу. Такие последовательности микроинструкций, "склеенные" технологией micro-ops fusion для исполнения процессором в определённом порядке, представляются процессором на всех этапах, кроме собственно исполнения, одной командой. Это позволяет избежать ненужных простоев процессора в случае, если связанные микроинструкции оказываются оторванными друг от друга в результате работы алгоритмов внеочередного выполнения.

В дополнение к весьма удачной технологии micro-ops fusion, микроархитектура Core получила технологию macrofusion. Данная технология направлена на увеличение числа исполняемых за такт команд и заключается в том, что ряд пар связанных между собой последовательных x86 инструкций, таких как, например, сравнение со следующим за ним условным переходом, представляются внутри процессора одной микроинструкцией. Такая микроинструкция рассматривается планировщиком и выполняется на исполнительных устройствах как одна команда. Таким путём достигается как увеличение темпа исполнения кода, так и некоторая экономия энергии.

Таким образом, по данным Intel, в общем случае удаётся снизить нагрузку операций до 15% и сократить число микроопераций до 10%. Как видно на иллюстрации ниже, модули префетча (предварительной выборки) подготавливают ряд x86 команд, при этом до пяти из них могут одновременно обрабатываться четырьмя блоками декодирования. В случае возможности слияния двух команд (Macro-Fusion), появляется фактическая возможность параллельной обработки пяти инструкций за такт (единовременно может образовываться не более одной макрокоманды).

Отдельным направлением, по которому выполнялось совершенствование микроархитектуры Core, стала переработка блоков исполнения SIMD инструкций (SSE, SSE2, SSE3). Современное программное обеспечение, например, для обработки изображений, видео и звука, шифрования, научной и финансовой деятельности, достаточно широко использует наборы команд SSE, которые позволяют работать со 128-битовыми операндами различного характера (векторами и целочисленными либо вещественночисленными данными повышенной точности).

Именно этот факт заставил инженеров Intel задуматься об ускорении работы SSE блоков процессора, тем более что до недавнего времени процессоры Intel исполняли одну SSE-инструкцию, работающую с 128-битными операндами, лишь за два такта. Один такт тратился на обработку старших 64 бит, второй такт – на обработку младших. Новая же микроархитектура Core позволила ускорить работу с SSE инструкциями в два раза.

Блоки SSE в процессорах полностью 128-битовые, что даёт возможность увеличить количество данных, обрабатываемых процессором за такт. И особенно в тех задачах, которые используют SIMD инструкции наиболее активно, а это, в первую очередь, различного рода мультимедиа-приложения.

Помимо увеличения скорости работы блоков исполнения SIMD инструкций, Intel в очередной раз провёл ревизию системы команд SSE. Результатом стало то, что уже ставший привычным набор инструкций SSE3 был вновь дополнен восемью новыми командами. Вообще говоря, указанное расширение набора команд SSE3 задумывалось ещё при внедрении процессоров с кодовым именем Tejas, но в силу их отмены соответствующая модификация нашла своё место в микроархитектуре Core.

Поскольку микроархитектура Core изначально проектировалась в двухъядерном варианте, разработчики получили возможность оптимизировать отдельные функциональные блоки процессоров с учётом их этой особенности. Так, в отличие от предыдущих CPU для настольных компьютеров, процессоры с микроархитектурой Core получили разделяемый между вычислительными ядрами L2 кеш. Алгоритмы работы этой кеш-памяти во многом подобны тем механизмам, которые реализованы в настоящее время в двухъядерных мобильных процессорах Intel Core Duo.

Плюсов такого подхода к реализации кеш-памяти видится несколько. Во-первых, у процессора появляется возможность гибко регулировать размеры областей кеша, используемых каждым из ядер. Иными словами, доступ ко всему объёму L2 кеша может получить любое из ядер процессора с микроархитектурой Core. Это, в частности, значит и то, что когда одно из ядер бездействует, второе получает в своё полное распоряжение весь объём кеш-памяти. Если же одновременно работают два процессорных ядра, то кеш делится между ними пропорционально, в зависимости от частоты обращений каждого ядра к оперативной памяти. Более того, если оба ядра работают синхронно с одними и теми же данными, то хранятся они в общем L2 кеше только однократно. То есть, разделяемый интеллектуальный L2 кеш процессоров с микроархитектурой Core гораздо более эффективен и, даже можно сказать, более вместителен, чем два отдельных кеша, разделённых между ядрами.

НЕ нашли? Не то? Что вы ищете?

Разделяемая кеш-память может оказаться полезной двухъядерным процессорам и в некоторых других случаях. Например, в технологии Core Multiplexing Technology, обеспечивающей механизм динамического отключения второго ядра, в зависимости от характера нагрузки на процессор. Очевидно, что в этом случае единый на два ядра кеш второго уровня решил массу проблем с технической реализацией этой технологии.

Второй значительный плюс объединённой кеш-памяти второго уровня заключается в том, что благодаря такой его организации значительно снижается нагрузка на оперативную память системы и на процессорную шину. Дело в том, что в этом случае перед системой не стоит задача контроля и обеспечения когерентности кеш-памяти различных ядер. В системах с двухъядерными процессорами с раздельными кешами, в случае, если оба ядра работают с одними и теми же данными, эти данные дублируются в кеш-памяти каждого из ядер. Таким образом, возникает необходимость в контроле их актуальности. Перед тем, как извлечь такие данные из L2 кеша для обработки, каждое процессорное ядро должно проверить, не изменило ли эти данные другое ядро. И если это так, то требуется обновление содержимого кеш-памяти, которое в системах на базе процессоров с микроархитектурой NetBurst выполняется через системную шину и оперативную память. Общий же на два ядра кеш позволяет полностью отказаться от этого неэффективного алгоритма.

Кроме того, посредством управляющей логики, предусмотренной в процессорах с микроархитектурой Core, стал возможным более простой обмен данными и между кеш-памятью первого уровня каждого из ядер через общий L2 кеш, что в итоге даёт возможность гораздо более результативного взаимодействия ядер при совместной работе над одной задачей.

Технологии, объединенные под этим собирательным названием, направлены на уменьшение задержек, которые могут возникнуть при доступе процессора к обрабатываемым данным. Очевидно, что для этой цели как нельзя лучше подходит предварительная выборка данных из памяти в обладающие гораздо более низкой латентностью L1 и L2 кеши процессора. Надо сказать, что алгоритмы предварительной выборки данных эксплуатируются в процессорах Intel достаточно давно. Однако с выходом микроархитектуры Core соответствующий функциональный узел был усовершенствован.

Микроархитектура Core предполагает реализацию в процессоре шести независимых блоков предварительной выборки данных. Два блока нагружаются задачей предварительной выборки данных из памяти в общий L2 кеш, ещё по два блока работают с кешами первого уровня каждого из ядер CPU. Каждый из этих блоков независимо друг от друга отслеживает закономерные обращения (потоковые, либо с постоянным шагом внутри массива) исполнительных устройств к данным. Базируясь на собранной статистике, блоки предварительной выборки стремятся подгружать данные из памяти в процессорный кеш ещё до того, как к ним последует обращение.

Также, L1 кеш каждого из ядер процессоров, построенных на базе Intel Core Microarchitecture, имеет по одному блоку предварительной выборки инструкций, работающий по аналогичному принципу.

Кроме улучшенной предварительной выборки данных, Intel Smart Access предполагает ещё одну интересную технологию, названную memory disambiguation (устранение противоречий в памяти). Данная технология направлена на повышение эффективности работы алгоритмов внеочередного исполнения инструкций, осуществляющих чтение и запись данных в памяти. Дело в том, что в современных процессорах, осуществляющих внеочередное исполнение команд, не допускается выполнение команды чтения до того, как не будут завершены все инструкции сохранения данных. Объясняется это тем, что планировщик заранее не обладает информацией о зависимости загружаемых и сохраняемых данных.

Однако достаточно часто последовательные инструкции сохранения и загрузки данных из памяти не имеют между собой никакой взаимной зависимости. Поэтому, отсутствие возможности изменения порядка их выполнения зачастую снижает загрузку исполнительных устройств и эффективность работы CPU в целом. Для решения этой проблемы и предусматривается новая технология memory disambiguation. Она предусматривает специальные алгоритмы, позволяющие с достаточно высокой вероятностью устанавливать зависимость последовательных команд сохранения и загрузки данных, и даёт возможность, таким образом, применять внеочередное выполнение инструкций к этим командам.

Таким образом, при условии правильной работы алгоритмов memory disambiguation процессор получает возможность более эффективного использования собственных исполнительных устройств. В случаях же ошибок в определении зависимых инструкций загрузки и сохранения данных, которые, согласно информации разработчиков, случаются достаточно редко, технология memory disambiguation детектирует возникший конфликт, перезагружает корректные данные и инициирует повторное исполнение "ошибочно" выполненной ветви кода.

Совместное использование предварительной выборки данных и технологии memory disambiguation повышает эффективность работы процессора с памятью не только за счёт минимизации возможных простоев исполнительных устройств, но и благодаря более эффективному использованию пропускной способности шины и снижению латентностей при обращениях к памяти.

Так как при разработке новой микроархитектуры Core инженеры стремились к оптимизации параметра "производительность на ватт", а также из-за того, что данная микроархитектура используется и в основе процессоров для ноутбуков, разработчики Intel сразу предусмотрели набор технологий, направленных на снижение энергопотребления и тепловыделения. Безусловно, процессоры получили в своё распоряжение хорошо зарекомендовавшие себя технологии семейства Demand Based Switching (в первую очередь, Enhanced Intel SpeedStep и Enhanced Halt State). Но речь в данном случае идёт не о них.

Процессоры, основанные на микроархитектуре Core, получили возможность интерактивного отключения тех собственных подсистем, которые не используются в данный момент. Причём речь в данном случае идёт не о ядрах целиком. Декомпозиция процессора на отдельные функциональные узлы выполнена на гораздо более низком уровне. Каждое из процессорных ядер поделено на большое количество блоков и внутренних шин, питание которыми управляется раздельно посредством специализированных дополнительных логических схем. Главной особенностью этих схем, входящих в Intel Intelligent Power Capability, является то, что их работа не влечёт за собой увеличение времени отклика процессора на внешние воздействия, вызванное необходимостью приводить отключенные блоки в функциональное состояние.

Следует отметить, что возможность деактивации различных блоков CPU во время его работы заставило разработчиков пересмотреть подход к измерению температуры процессора. Процессоры с микроархитектурой Core снабжаются несколькими температурными датчиками, расположенными на ядре в тех местах, которые предрасположены к сильному нагреву.

Для обработки показаний этих многочисленных датчиков процессор содержит специальную схему, определяющую максимальную температуру. Именно эта температура и рапортуется процессором пользователю и системам аппаратного мониторинга.

Каждая из этих технологий по отдельности способна значительным образом повысить эффективность процессора, а все вместе они значительная сила для установления новых стандартов производительности в сочетании с экономным энергопотреблением.

Таким образом, новая микроархитектура Intel Core задействовала все плюсы, уже реализованные в первых поколениях мобильных процессоров Intel Pentium M, взяла всё самое лучшее из наработок архитектуры Intel NetBurst, и, в дополнение, обогатилась самыми свежими инновационными идеями разработчиков.

Penryn построены на базе усовершенствованной микроархитектуры Intel Core. Основным их отличием стал переход на 45-нм техпроцесс и некоторые архитектурные новшества, вследствие чего повысилась энергоэффективность, расширился частотный потенциал, увеличилось количество выполняемых команд за такт и прочее.

Усовершенствования, которые принес переход на новый техпроцесс, интересно рассмотреть с позиций количественного сравнения. Например, четырехъядерные процессоры Penryn включают около 820 млн. транзисторов, которые разместились на двух кристаллах площадью 107 мм2. Для сравнения, современные четырехъядерные процессоры Intel Kentsfield имеют 582 млн. транзисторов, при этом площади кристаллов четырехъядерных процессоров, выпускающихся по 65-нм нормам, составляют 143 мм2.

Новшества, которые принесло следующее поколение процессоров, можно рассматривать по отношению к пяти современным технологиям Intel: Wide Dynamic Execution, Advanced Smart Cache, Smart Memory Access, Advanced Digital Media Boost, Intelligent Power Capability.

Механизм Wide Dynamic Execution обеспечивает выполнение большего числа команд за один тактовый цикл, что увеличивает производительность и помогает добиться повышения энергоэффективности. В рамках этой технологии компания Intel представил усовершенствованный более быстрый блок деления, основанный на базе методики radix-16, а также улучшенную технологию виртуализации Enhanced Intel Virtualization Technology. Инновационная архитектура на базе radix-16 позволяет существенно уменьшить задержки при выполнении целочисленных операций деления, а также операций деления с плавающей запятой.

Технология Advanced Smart Cache нацелена на обеспечение более высокой производительности и эффективности кэш-памяти. В процессорах семейства Penryn компания Intel решила увеличить объем кэша. Так, двухъядерные процессоры оснащаются кэшем L2 емкостью до 6 Мб, а отдельные четырехъядерные модели обзавелись 12-Мб кэш-памятью. Частотные характеристики преодолели планку 3 ГГц.

В рамках технологии Smart Memory Access говорится об увеличении пропускной способности шины. Подтверждилась информация об освоении шины FSB 1600 МГц. Шина FSB 1600 МГц появилась в некоторых моделях процессоров для серверов и рабочих станций.

Технология Advanced Digital Media Boost применяется для ускорения обработки видео, изображения и речевых потоков. Для повышения производительности при обработке медиаданных Intel решила добавить к архитектуре ISA набор расширений SSE4 (Streaming SIMD Extensions 4), который стал доступным для большинства массовых секторов рынка ПК с появлением 45-нм процессоров. Этот новый набор команд включает множество инновационных инструкций (их насчитывается около 50), которые условно можно разделить на две группы:

Примитивы векторизации для компиляторов и ускорители мультимедийных приложений;

Ускорители обработки строк и текстовой информации.

Пожалуй, на SSE4 остановимся детальнее, поскольку технология является одним из ключевых нововведений. Для начала опишем приложения, которые затронуло это усовершенствование. Улучшения коснулись графики, кодирования и обработки видео, создания трёхмерных изображений, игр, Web-серверов, серверов приложений. Как утверждает Intel, увеличилась производительность приложений с высокой интенсивностью вычислений – анализа хранилищ данных, СУБД, сложных алгоритмов поиска и сопоставления, алгоритмов сжатия звука, видео, изображений и данных, алгоритмов синтаксического анализа и анализа логических состояний, а также многих других.

По словам Intel, SSE4 – самое масштабное и значительное расширение архитектуры Intel ISA со времени появления SSE2. Набор команд SSE4 содержит несколько примитивов векторизации для компиляторов, обеспечивающих дальнейшее увеличение производительности и эффективности мультимедийных приложений. Имеются также и новые инновационные инструкции для обработки строк.

Еще одним усовершенствованием является механизм перестановок – Super Shuffle Engine. Новый блок умеет выполнять перестановки значений сразу во всем 128-разрядном регистре за один такт. Это существенно повышает производительность при обработке операций, связанных с перестановкой (упаковка, распаковка, сдвиг упакованных значений, вставка). В среднем наблюдается двукратное увеличение производительности.

Интересные новшества касаются уменьшения уровня потребления мощности и увеличения показателя «производительность на ватт». В связи с этим Intel представила две новые технологии: Deep Power Down Technology и Enhanced Dynamic Acceleration Technology.

Технология Deep Power Down Technology внедрена, в первую очередь, в процессоры для мобильных платформ (Mobile Penryn). Для понижения энергопотребления в режиме бездействия добавлено еще одно особое состояние процессора, именуемое как Deep Power Down Technology State, или C6. В этом режиме предусмотрено отключение ядер, при этом также полностью отключается кэш-память. Это позволяет существенно понизить напряжение ядра и потребляемой мощности, что, в свою очередь, увеличивает время работы батареи.

Интересным нововведением является технология Enhanced Dynamic Acceleration Technology (EDAT). Её идея состоит в следующем. Для простоты возьмём случай с двухъядерным процессором. Поскольку в однопоточных приложениях от многоядерности толку мало, основную роль здесь играет производительность отдельно взятого ядра. Поэтому Intel предусмотрела увеличение частоты работающего ядра (non-idle core), в то время как второе (idle core) находится в одном из состояний бездействия (C3-C6) и его тепловыделение резко сокращается. Эту разницу использует работающее ядро и повышает свою частоту до достижения процессором граничного уровня TDP.

Теперь об уровне TDP 45-нм процессоров. Двухъядерные Penryn для настольных ПК попадут в энергетический класс 65 Вт, а для их четырехъядерных родственников предусмотрены тепловые пакеты 95 и 130 Вт. В серверном сегменте для двухъядерных Intel Xeon уровни TDP составят 40, 65 и 80 Вт, а для четырехъядерных – 50, 80 и 120 Вт.

Для маркировки Penryn в качестве 4-й цифры индекса используется 8 и 9 (серии 8000 и 9000).

У МП Penryn используются новые технологии:

Deep Power Down, снижающая энергопотребление путем уменьшения токов утечки транзисторов в моменты их простоя,

усовершенствованная Dynamic Acceleration Technology, повышающая произво­дительность однопоточных приложений путем отключения простаивающих ядер и повышения тактовой частоты работающего ядра

усовершенствованная Intel Virtualization Technology, уменьшающая время переключения виртуальных машин.

МП семейства Penryn поддерживают расширенный набор команд Intel Streaming SIMD Extension 4 (SSE4), а также кэш-память L2 большего объема:

двухъядерные до 6 Мбайт,

а четырехядерные до 12 Мбайт.

Согласно внутренним тестам Intel, в игровых приложениях наблюдается 20-ти процентный прирост производительности новых чипов, а в операциях с декодированием видео (при условии использования SSE4) – более 40% прирост. Если сравнивать серверный процессор Penryn с частотой более 3 ГГц и Xeon X5355, 2,66 ГГц, FSB 1333 МГц, прирост в приложениях, интенсивно использующих операции с плавающей запятой и чувствительных к пропускной способности, составляет около 45%.

После наладки массового производства чипов Penryn, Intel представил процессоры Nehalem с новой одноименной микроархитектурой – на смену Intel Core. Примерно через два-три года после анонса 45-нм процессоров – ориентировочно, ближе к , Intel надеется представить новый, более прецизионный 32-нм техпроцесс. Пока эти планы довольно туманны: даже переход на 45 нм сопровождался большими трудностями и потребовал задействования совершенно новых материалов (high-k диэлектрики и металлические затворы). В рамках 32 нм техпроцесса будут представлены процессоры с рабочим названием Westmere, ранее известные как Nehalem-C, с той же микроархитектурой Nehalem.

Через два года после появления Nehalem на смену придёт микроархитектура Gesher. О ней пока очень мало сведений. Известно лишь, что первые процессоры Gesher будут выпускаться по 32-нм техпроцессу. На этом прогнозы относительно развития процессоров заканчиваются.

Примеры процессров с микроархитектурой Intel Core

Core 2

Это потомок микроархитектуры Intel P6, на которой, начиная с процессора Pentium Pro, построено большинство микропроцессоров Intel, исключая процессоры с архитектурой NetBurst.

Введя новый бренд, от названий Pentium и Celeron Intel не отказалась, в 2007 году переведя их также на микроархитектуру Core, и на данный момент доступны процессоры Pentium Dual-Core (не путать с Pentium D) и Core Celeron (400-я серия). Но теперь воссоединились мобильные и настольные серии продуктов (разделившиеся на Pentium M и Pentium 4 в 2003 году).

Первые процессоры Core 2 официально представлены 27 июля 2006 года. Также как и их предшедственники, процессоры Intel Core, они делятся на модели Solo (одноядерные), Duo (двухъядерные), Quad (четырёхъядерные) и Extreme (двух - или четырёхъядерные с повышенной частотой и разблокированным множителем). Процессоры получили следующие кодовые названия — «Conroe» (двухъядерные процессоры для настольного сегмента), «Merom» (для портативных ПК), «Kentsfield» (четырёхъядерный Conroe) и «Penryn» (Merom, выполненный по 45 нанометровому техпроцессу). Хотя процессоры «Woodcrest» также основаны на архитектуре Core, они выпускаются под маркой Xeon.[1]. С декабря 2006 года все процессоры Core 2 Duo производятся на 300-миллиметровых листах на заводе Fab 12 в Аризоне, США и на заводе Fab 24-2 в County Kildare, Ирландия.

В отличие от процессоров архитектуры NetBurst (Pentium 4 и Pentium D), в архитектуре Core 2 ставка делается не на повышение тактовой частоты, а на улучшение других параметров процессоров, таких как кэш, эффективность и количество ядер. Рассеиваемая мощность этих процессоров значительно ниже, чем у настольной линейки Pentium. С параметром TDP, равным 65 Вт, процессор Core 2 имеет наименьшую рассеиваемую мощность из всех доступных в продаже настольных чипов, в том числе на ядрах Prescott (в системе кодовых имён Intel) с TDP, равным 130 Вт, и на ядрах San Diego’s (в системе кодовых имён AMD) с TDP, равным 89 Вт.

Особенностями процессоров Intel Core 2 являются EM64T (поддержка архитектуры EM64T), технология поддержки виртуальных x86 машин Vanderpool (en), NX-бит и набор инструкций SSSE3. Кроме того, впервые реализованы следующие технологии: LaGrande Technology, усовершенствованная технология, SpeedStep (EIST) и Active Management Technology (iAMT2).

Процессорные ядра

Conroe

Intel Core 2 Duo E6600 «Conroe»

Первые процессорные ядра Intel Core 2 Duo с кодовыми именами Conroe и Allendale были представлены 27 июля 2006 года. Эти процессоры созданы с использованием 65 нм техпроцесса и предназначены для настольных систем, заменяя линейки Pentium 4 и Pentium D. Intel заявляет, что Conroe обеспечивает на 40 % большую производительность при меньшем на 40 % энергопотреблении по сравнению с Pentium D. Все Conroe процессоры имеют 4 Мб L2-кэша, однако, у процессоров E6300 и E6400 половина L2-кэша отключена, поэтому для использования им доступно только 2 Мб.

Младшие модели Conroe E6ГГц) и E6ГГц), традиционно имеют урезанный кэш второго уровня (L2) и, зачастую, являются полноценными процессорами, не прошедшими контроль качества для старших моделей. На время запуска Intel установила стоимость для процессоров Core 2 Duo E6300 и E6400 соответственно $183 USD и $224 USD за штуку в партиях от 1000 штук. Процессоры Conroe отличаются высоким разгонным потенциалом — процессор E6300 способен достичь тактовой частоты в 3 ГГц при использовании хорошей материнской платы, поддерживающей высокие частоты системной шины. Согласно обзорам, разница в производительности между 2 Мб и 4 Мб кэша второго уровня составляет 0-9 % в основных приложениях, и 0-16 % в играх. Нередко, пользователям удаётся достичь производительности топовых моделей семейства. Однако, низкий множитель на младших процессорах требует наличия материнской платы, поддерживающей высокие скорости системной шины.

Высокопроизводительные процессоры Conroe получили названия E6600 и E6700 Core 2 Duo, с тактовой частотой соответственно — 2,4 ГГц и 2,67 ГГц. Семейство имеет частоту системной шины 1066 МГц, 4 MB общего L2-кэша, и 65-ваттный TDP. Сравнение с топовыми процессорами AMD показывает, что процессоры от Intel показывают значительно лучшую производительность.[4] Результаты разгонов показывают, что E6700 и E6600 стабильно работают на частоте 4 ГГц с воздушным охлаждением и 6.1 ГГц при охлаждении жидким азотом, несмотря на заблокированный множитель.[5] Во многом подобные результаты стали возможны благодаря настраиваемому множителю, который может принимать значения от x6 до x9. Также, использование 65 нм техпроцесса уменьшило тепловыделение процессоров, вследствие чего, стал возможен разгон и без использования дорогих систем охлаждения. Однако, последние изменения над процессором E6600 (считающийся самым популярным и приятным для разгона) могут «свести на нет» эти преимущества — процессоры последней серии с маркировкой L640 (производятся в Малайзии с 1 января 2007 года по сей день) выделяют больше тепла, чем модели из предыдущих партий. Поэтому, уже при частоте в 3.2 ГГц возникают трудности с обеспечением стабильной работы системы.[5]

Процессоры E6320 (1,86 ГГц) и E6420 (2,13 ГГц) были выпущены 22 апреля 2007 года. Отличительной особенностью данных моделей является полноценный кэш L2, размером в 4 Мб.

Conroe XE

Топовая линейка Core 2 Extreme была официально представлена 29 июля 2006 года. Однако некоторые продавцы представили данный процессор ещё 13 июля, хотя и за высокую цену. Менее мощные модели E6x00 Core 2 Duo были представлены одновременно с моделью X6800, которая сейчас доступна в ограниченном количестве. Она построена на ядре Conroe XE и заменила такие процессоры как Pentium 4 Extreme Edition и двухъядерный Pentium Extreme Edition. Core 2 Extreme имеет тактовую частоту 2,93 ГГц и 1066 МГц FSB, хотя сначала ожидалось 3,33 ГГц и 1333 МГц, соответственно. TDP этого семейства составляет 75—80 ватт. При максимальной нагрузке X6800 не греется выше 45 °C, а с включённой технологией SpeedStep средняя температура в простое составляет 25 °C.[6]

Также как и настольные Core 2 Duo, он имеет 4 Мб общего L2-кэша. Это значит, что главное отличие от обычных Core 2 Duo —— тактовая частота и разблокированный множитель, позволяющий симулировать любой E6x00 с 4 Мб L2-кэша. Это даёт ему лучшие возможности для разгона с помощью поднятия множителя до 14X. Все предыдущие Intel Extreme Editions имели уникальные особенности, такие как, повышенная FSB, больше L2-кэша, или добавленный L3-кэш.

Тестирование в игровых и мультимедийных приложениях показывает, что X6800 имеет на 40 % выше производительность, чем ведущие процессоры от AMD. X6800 может быть разогнан до 3.6 ГГц с обычным боксовым кулером без повышения напряжения, до 4,1 ГГц с хорошим воздушным кулером и повышением напряжения, и выше 5,5 ГГц с помощью жидкого азота.[7]

Allendale

Intel Core 2 Duo E6300 «Allendale»

Allendale — это кодовое имя для процессоров Conroe с урезанным до 2 Мб L2-кэшем и с 800 МГц FSB. Есть некоторые предположения считать новые процессоры E6300 и E6400 относящимися к семейству Allendale, однако, Intel утверждает, что эти процессоры продолжают называться «Conroe».

Подтверждение этого факта можно обнаружить в различных частотах FSB серий E6000 (Conroe) и E4000 (Allendale) (4х266 МГц у E6000 и 4х200 МГц у E4000). Также семейство E4000 лишилось технологии поддержки аппаратной виртуализации Intel VT.

Производимые сейчас Core 2 Duo E4300, выпущенные 21 января 2007 года, несомненно основываются на ядре Allendale. Из-за уменьшения кэша второго уровня до 2 Мб появилась возможность производить больше процессоров на одной подложке. Процессоры Allendale с ещё вдвое уменьшенным кэшем L2 вышли в середине мая под маркой Pentium Dual-Core (часто называется Pentium E).

Merom

Merom — первая мобильная версия Core 2, выпущенная 27 июля 2006 года (хотя, без привлечения всеобщего внимания Merom начал поступать к производителям ПК ещё в середине июля вместе с Conroe

Merom — премьер-линейка мобильных процессоров Intel с преимущественно теми же функциональными возможностями как у Conroe, но с большим вниманием к низкому энергопотреблению, чтобы достичь более длительной работы ноутбука на одном заряде аккумулятора. Intel заявил, что Merom обеспечит на 20 % бо́льшую производительность при том же энергопотреблении, как у основанных на ядре Yonah процессорах Core Duo. Merom — первый мобильный процессор Intel, расширенный до 64-битных инструкций (EM64T).

Conroe-L

Intel предлагает дешевую одноядерную версию Conroe, с кодовым названием «Conroe-L», начиная со второго квартала 2007, согласно статье на DailyTech. Новые процессоры Conroe-L не будут придерживаться терминологии Core. Вместо этого Intel планирует «оживить» бренды Pentium и Celeron для продуктов, основанных на Conroe-L

Conroe, Conroe XE и Allendale

Conroe, Conroe XE и Allendale используют сокет LGA775; однако не каждая материнская плата совместима с этими процессорами. Поддерживаемые чипсеты — это Intel: P31, P35, P45, 945P/PL/G, 965, 955X, 975X, P/G/Q965, Q963, 946GZ/PL (обратите внимание, что 865PE поддерживает 800 MHz FSB QDR, тогда как процессор использует 1066 MHz FSB QDR); ATI Radeon Xpress 200, RD600 и RS600; NVidia nForce 4 SLI Intel Edition и nForce 570/590 Intel Edition; VIA PT880/PT880 Ultra, PT890, PM880 и PM890.

Даже, если материнская плата основана на требуемом чипсете, она может не поддерживать Conroe. Это происходит, потому что любые процессоры, основанные на Conroe, требуют более новый модуль регуляции напряжения (VRM), VRM 11, так как по сравнению с ЦПУ предыдущего поколения (Pentium 4/D) Conroe потребляет значительно меньше энергии. Если плата имеет и поддерживаемый чипсет, и VRM 11, необходима последняя версия BIOS для распознавания Conroe.

При приобретении комплектующих, в частности, материнских плат, необходимо убедиться в совместимости её с Core Duo 2, возможность поддержки процессора может отличаться даже в рамках одной модели плат (разная ревизия).

Penryn

Новая микроархитектура, являющаяся модернизированной архитектурой Intel Core, кодовое имя Penryn, дебютировала, будучи первой архитектурой производимой по 45 нанометровому технологическому процессу изготовления, использующий металлические затворы и диэлектрики High-k, который также будет использован в микроархитектуре Nehalem. На основе новой микроархитектуры появятся такие дизайны ядер как Wolfdale и Yorkfield. Сообщения о выходе Penryn появились в 2007 году.

Wolfdale

Core 2 Duo E8400 на ядре Wolfdale

Wolfdale — это преемник двухъядерного процессора Conroe, созданный по 45 нанометровому процессу и основанный на микроархитектуре Penryn. Процессоры Intel Core 2 Duo серий Е7ххх и Е8ххх основаны именно на этом дизайне ядер. Процессоры Pentium Dual-Core серий Е5ххх и Е6ххх построены на дизайне ядер Wolfdale-2М и имеют 2Мб L2 кеша.

Yorkfield

Yorkfield — это преемник четырёхъядерного Kentsfield. Создан по 45 нанометровому процессу и так же как и Kentsfield, представляет по сути два размещенных в одном сокете корпуса Wolfdale(45 нанометровый потомок Conroe). Yorkfield располагает 6 или 12 МБ L2 разделённой кэш-памяти, по 3 или 6 МБ на каждую пару ядер соответственно. Скорости шины (подключение к северному мосту) до 1333 МГц или более (1600 Мгц в некоторых редакциях Extreme Edition), как и для большинства процессоров скорость ограничена полосой пропускания шины на материнской плате. Процессоры Yorkfield выпускаются под именами: Intel Core 2 Quad (Q9300, Q9450, Q9550, Q9650) и Intel Core 2 Extreme (QX9650, QX9770)

Nehalem

Новая процессорная микроархитектура созданная на основе микроархитектуры Intel Core, но имеющая множество отличий от своего предшественника, такие как интерфейс QuickPath Interconnect (QPI) или Direct Media Interface (DMI) в бюджетных решениях, первый позволяет повысить пропускную способность до 25Гб/сек против 12,5Гб/сек у Intel Core, поддержка модернизированной технологии Hyper-Threading, носящей название Simulation Multi-Threading (SMT), позволяющая задействовать два потока на одно ядро, интегрированный контроллер оперативной памяти стандарта DDR3 SDRAM или даже полностью интегрированный северный мост набора системной логики в более поздних решениях, поддержка технологии Turbo Boost, позволяющая повысить тактовую частоту на пять пунктов множителя одного, наиболее загруженного ядра и т. д. Первые процессоры основанные на этой микроархитектуре, имеющие дизайн ядер Bloomfield вышли в открытую продажу 17 ноября 2008 года.

Bloomfield

Первый дизайн ядер на основе микроархитектуры нового поколения Nehalem. Так как он является флагманским, в нём осуществлены все нововведения новой микроархитектуры. Дизайн Bloomfield обладает четырьмя физическими ядрами и находится на одной кремниевой подложке изготовленной с соблюдением норм 45-нм. Он уступает дизайну Yorkfield по количеству транзисторов, 731 млн против 820 млн, но несмотря на это у него больше площадь, 263 кв. мм против 214 кв. мм. Поддержка технологии Simulation Multi-Threading обеспечивает до 8 потоков одновременно. Так же особенностью дизайна можно назвать технологию Turbo Boost. Системная шина QuickPath Interconnect использующаяся для связи с северным мостом имеет два стандарта 4.8ГТ/с и 6.4ГТ/с и пропускную способностьМбайт/с иМбайт/с соответственно. В нём используется впервые, за всю историю процессоростроения, поддержка трехканальной оперативной памяти стандарта DDR3 SDRAM. Интеграция контроллера памяти — переходное решение от традиционно отдельного северного моста до его полной интеграции начиная с решения Lynnfield. Для него требуется разъем LGA1366 и набор системной логики Intel X58. Процессоры под торговой маркой Intel Core i7 вышли в продажу в конце 2008 года.

Lynnfield

Более экономичная и упрощенная версия дизайна Bloomfield, в которой удалены такие характеристики, как трехканальный контроллер оперативной памяти, системная шина QuickPath Interconnect и поддержка Simulation Multi-Threading в бюджетных моделях. Вместо этого в процессор интегрирован двухканальный контроллер памяти с поддержкой DDR3 1333МГц и системная шина Direct Media Interface, однако её пропускная способность остается в пределах 2 ГБ/с, что очень мало по сравнению с 25 ГБ/с, которые обеспечивает шина QPI в случае использования Bloomfield. Но несмотря на это, процессор не испытывает проблем с быстродействием, за счет интегрированных контроллеров PCI Express 2.0 и оперативной памяти. Этот дизайн не имеет связи с северным мостом, так как в наборе системной логики P55 Express фактически отсутствует северный мост. Ведь северный мост представляет собой сочетание контроллеров оперативной памяти, PCI Express 2.0 и интерфейса с процессором, но все это находится непосредственно в самом дизайне ядер, а скорости 2 ГБ/с хватает для полноценной связи с южным мостом. Благодаря интеграции северного моста в дизайн ядер уровень производительности повышается, и старшие модели по производительности близки к младшим моделям Bloomfield. Благодаря некоторым доработкам техпроцесса уровень энергопотребления не будет превышать отметку 95 Вт. Этот дизайн также обладает четырьмя ядрами на одной подложке, 8Мб общего кеша третьего уровня и поддержкой SMT в дорогих моделях. Для него требуется разъем LGA1156. Первые продукты на основе этого дизайна — Intel Core i5 750 с частотой 2667МГц, Intel Core i7 860 и 870 с частотами 2800МГц и 2933МГц соответственно, вышли в открытую продажу 8 сентября 2009 года.

Intel-проведет ребрендинг своих продуктов 18 июня 2009 г

В «Интел» отмечают, что сейчас для процессоров и аппаратных платформ компании используется слишком много различных торговых марок, что сбивает с толку потребителей и зачастую вызывает путаницу. Введение новой системы классификации продуктов облегчит покупателям выбор нужных комплектующих или ПК, а также позволит точнее разграничить аппаратные решения на классы.

Ключевым брендом «Интел» станет Core. На сегодня существует множество вариантов этой торговой марки, вроде Core 2 Duo, Core 2 Quad и Core 2 Extreme. С течением времени корпорация намерена отказаться от этих производных, заменив их тремя основными брендами: Core i3, Core i5 и Core i7. Процессоры с маркировкой Core i3 будут относиться к начальному уровню, чипы Core i5 — к средней ценовой категории, а решения Core i7 — к наиболее передовым продуктам.

Для чипов, ориентированных на недорогие компьютеры, «Интел» сохранит марку Celeron, а для базовых решений — бренд Pentium. Кроме того, останется марка Atom, под которой выпускаются процессоры для нетбуков и мобильных интернет-устройств.

Компьютеры для бизнес-применения будут маркироваться либо Core i7 vPro, либо Core i5 vPro. А вот от бренда Centrino применительно к аппаратной платформе, включающей центральный процессор и набор логики, собираются отказаться. Начиная с 2010 года марка Centrino будет использоваться для обозначения беспроводных решений Wi-Fi и WiMAX.

Теперь исполнение платформы двухкорпусное – процессор плюс контроллер ввода-вывода. Процессоры Intel Core, основанные на микроархитектуре Nehalem, позволяют создавать ноутбуки в корпусах тоньше 2,5 см с достаточной мощностью и длительным временем автономной работы.

Новые Intel Core i7 и Core i5 используя технологии Intel TurboBoost и Intel Hyper-Threading, адаптируются к работе, управляя производительностью по запросам программ. Intel Hyper-Threading позволяет каждому из ядер обрабатывать по два потока данных одновременно. Это еще ощутимее увеличивает производительность при разумном расходования энергии – компоненты процессора не потребляют электричества в моменты простоя.

Судя по этим планам, Intel придерживается прежней стратегии смены микроархитектур и перехода на новый техпроцесс каждые два года. Удастся ли лидеру процессорной индустрии удерживать такие высокие темпы развития, сказать сложно. В Intel такую стратегию выпуска продукции называет “tick-tock” (“тик-так”). Каждый “тик” отражает новый этап развития полупроводниковых производственных технологий и усовершенствования в области микроархитектуры (например, Penryn). Каждый “так” соответствует созданию новой микроархитектуры (например, Nehalem)

Ядра

Процессоры

Микроархитектура

Тех

процесс

Начало

выпуска

Cedar Mill,

Dempsey, Presler,

Yonah

Intel Core,

Pentium 4,

Pentium D,

Xeon

Intel P6,

NetBurst

65 нм

январь 2006

 

Allendale,

Clovertown,

Conroe, Kentsfield,

Merom, Tigerton,

Woodcrest

Intel Core 2,

Xeon

Микроархитектура Intel Core

(не путать с процессорами Intel Core!)

июль

2006

 

Dunnington,

Harpertown, Penryn,

Wolfdale, Yorkfield

45 нм

январь 2008

 

Beckton, Bloomfield,

Clarksfield, Gainestown,

Lynnfield

Intel Core i5,

Intel Core i7,

Xeon

Intel Nehalem

ноябрь 2008

 

Arrandale, Clarkdale,

Gulftown

Intel Core i3,

Intel Core i5,

Intel Core i7,

Intel Core i9,

Xeon

Westmere (усовершенствованная Nehalem)

32 нм

конец 2009 [3]

 

Intel Sandy Bridge

начало 2011 [4]

 

Ivy Bridge (усовершенствованная Sandy Bridge)

22 нм

2011

 

Intel Haswell

2012

 

Сейчас компания выпуска­ет 32-нм процессоры (кодовое на­звание чипов — Westmere). Процессоры Intel Westmere поддерживают техноло­гии Intel Turbo Boost и Hyper-Threading, а также новый на­бор команд для ускоренного шифрования и дешифровки посредством алгоритма Advanced Encryption Standard (AES). Технология Intel Turbo Boost динамически повышает тактовую частоту процессора максимум на 75% от базовой в случае необходимости, удов­летворяя потребности прило­жений и пользователей, не представляя угрозы теплового разрушения устройства (пере­грева). Технология Hyper-Threading позволяет видеть од­но физическое ядро процессо­ра как два логических и, таким образом, выполнять большее число вычислительных про­цессов одновременно. Для ре­ализации этой технологии не­обходимо, чтобы ее поддержи­вал не только процессор, но и чипсет, и ОС. Наконец, про­цессоры Westmere впервые в продуктовой линейке Intel бу­дут обладать интегрирован­ным графическим ядром, ко­торое будет размещено на том же куске кремния, что и вы­числительные ядра централь­ного процессора.

После перехода на 32-нм технологию компания Intel представит новую микроархи­тектуру — Sandy Bridge, сле­дуя принципу развития "тик-так" (первый год — новый тех­процесс, второй год — новая архитектура и так далее). Ар­хитектура Sandy Bridge также подразумевает размещение графического ядра на том же кристалле, что и вычислитель­ные ядра центрального про­цессора.

Предыдущее поколение, микроархитектура Westmere в исполнении Arrandale и Clarkdale для мобильных и настольных систем,  представляет собой конструкцию из двух кристаллов - 32-нм процессорного ядра и дополнительного 45-нм «сопроцессора» с графическим ядром и контроллером памяти на борту, размещённых на единой подложке и производящих обмен данными посредством шины QPI. По сути, на этом этапе инженеры Intel, используя преимущественно предыдущие наработки, создали этакую интегрированную гибридную микросхему.

Микропроцессоры под кодовым названием Sandy Bridge будут основаны на новой "умной" микроархитектуре, современной 32-нанометровой технологии производства с использованием транзисторов с металлическим затвором и диэлектриков Hi-K второго поколения. Новое семейство процессоров будет включать "кольцевую" архитектуру, которая позволяет интегрировать графический контроллер и использовать кэш команд и данных совместно с ядрами процессора, увеличивая скорость работы графической подсистемы и системы в целом при сохранении эффективных значений энергопотребления.

Процессоры Intel Core второго поколения также будут включать улучшенную версию технологии Intel Turbo Boost. Она будет автоматически перераспределять нагрузку на ядра процессора и графические ресурсы в зависимости от запущенных приложений, мгновенно увеличивая производительность при необходимости.

Встроенный в процессоры Intel новый графический контроллер обеспечит увеличенную производительность и новые возможности при просмотре HD-видео, в 3D-играх, при одновременном запуске нескольких приложений в режиме многозадачности, воспроизведении мультимедийных файлов и общении в социальных сетях. Процессоры 2011 года также будут поддерживать набор команд Advanced Vector Extensions (AVX), который обеспечивает повышенную производительность и более широкую функциональность, а также улучшенные возможности для управления данными, их перемещения и сортировки. Новый 256-разрядный набор команд ускорит работу приложений с интенсивной обработкой цифр с плавающей запятой, к которым относятся приложения для редактирования фотографий, создания цифрового контента и другие.

Самыми быстрыми процессорами Sandy Bridge, выход которых намечен на начало 2011 года, станут Core i7-2600 и Core i5-2500. Их основные характеристики можно увидеть в таблицах.

Мы заметим, что данные модели CPU получат самое производительное видеоядро Intel HD Graphics 200 с частотой 850 МГц. При помощи технологии Turbo Boost GPU могут разгоняться с 850 до 1350 МГц, количество исполнительных блоков у Intel HD Graphics 200 равно 12.

Остальные процессоры обзаведутся более медленным видеочипом Intel HD Graphics 100. Его частота также равна 850 МГц, но разгон упирается в отметку 1100 МГц (1250 МГц у Core i5-2500T), а число исполнительных блоков уменьшено с 12 до 6.

Закончить нашу новость хотелось бы словами о суффиксах, которые фигурируют в названиях моделей процессоров Sandy Bridge. Они придуманы для того, чтобы пользователи имели представление о значении TDP той или иной модели, а также о её разгонном потенциале. Итак, суффикс K говорит о том, что данный CPU имеет незаблокированный множитель, S – TDP равен 65 Вт, T – TDP равен 35 или 45 Вт.

Процессоры Sandy Bridge: изучаем характеристики

Будущие процессоры

Larrabee

Кодовое название Larrabee (Intel Larrabee) объединяет семейство находящихся в стадии разработки сопроцессоров с упором на графических задачах. Для пользователей компьютеров на базе данного решения результатом станут исключительные визуальные эффекты, говорится в прессрелизе компании. Появление первого решения на базе Larrabee запланировано на 2010 год. Первоначально Larrabee появится на отдельных графических платах, но со временем архитектура будет интегрирована в центральный процессор наряду с массой других технологий.

Чип создаётся как новое, ранее не встречавшееся решение, которое заменит собой линейку графических процессоров Intel GMA. Чип Intel Larrabee проектируется как сочетание центрального и графического процессоров, наподобие AMD Fusion. Видеокарты, основанные на чипах Larrabee, будут конкурировать с решениями nVidia GeForce и AMD Radeon (ранее ATI Radeon) от компаний nVidia и AMD соответственно.

Larrabee также будет конкурировать на рынках GPGPU и высокопроизводительных вычислений.

Фактически, в отличие от большинства продуктов Intel, у Larrabee нет специального назначения. Он будет фигурировать

·  на рынке процессоров,

·  на рынке GPGPU и даже

·  на рынке дискретных графических акселераторов (это вызвано тем, что Intel планирует снова занять устойчивою позицию на рынке видеокарт).

Процессор Intel Larrabee будет обладать тридцатью двумя х86 совместимыми ядрами, что приведет к огромному увеличению площади кристалла. Ядра будут действовать по прогрессивной схеме Multiple Instructions Multiple Data, хотя они были созданы на основе устаревшей архитектуры Intel P5, которая применялась в процессорах Intel Pentium. Intel Larrabee по производительности на уровне NVIDIA Fermi (GF100), у которого 512 унифицированных суперскалярных процессоров. Процессор Larrabee будет производиться с соблюдением норм 32-нм технологического процесса изготовления, но несмотря на это его площадь будет около 600 мм², а энергопотребление — около 300 Вт из-за большого количества блоков, наличие которых требует архитектура х86. Выход продукта был намечен на середину 2010 года.

Intel планирует получить инженерные образцы Larrabee в конце 2008 года, а первые продукты на базе этого чипа предположительно должны выйти в конце 2009 или начале 2010 года.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4