Микропроцессорная память (кэш) – предназначена для кратковременного хранения информации, участвующей в вычислениях в ближайшие такты работы процессора. Имеет небольшой объём (до нескольких Мб), но очень высокое быстродействие (время доступа измеряется нс).

Интерфейсная часть микропроцессора – предназначена для связи и согласования МП с системной шиной ПК, а также для формирования полных адресов операндов и команд.

Конвейерная архитектура

Конвейерная архитектура (pipelining) была введена в центральный процессор с целью повышения быстродействия. Обычно для выполнения каждой команды требуется осуществить некоторое количество однотипных операций, например: выборка команды из ОЗУ, дешифрация команды, адресация операнда в ОЗУ, выборка операнда из ОЗУ, выполнение команды, запись результата в ОЗУ. Каждую из этих операций сопоставляют одной ступени конвейера.

После освобождения k-й ступени конвейера она сразу приступает к работе над следующей командой. Если предположить, что каждая ступень конвейера тратит единицу времени на свою работу, то выполнение команды на конвейере длиной в n ступеней займёт n единиц времени, однако в самом оптимистичном случае результат выполнения каждой следующей команды будет получаться через каждую единицу времени.

Действительно, при отсутствии конвейера выполнение команды займёт n единиц времени (так как для выполнения команды по прежнему необходимо выполнять выборку, дешифрацию и т. д.), и для исполнения m команд понадобится единиц времени; при использовании конвейера (в самом оптимистичном случае) для выполнения m команд понадобится всего лишь n + m единиц времени.

НЕ нашли? Не то? Что вы ищете?

Факторы, снижающие эффективность конвейера:

1.  простой конвейера, когда некоторые ступени не используются (напр., адресация и выборка операнда из ОЗУ не нужны, если команда работает с регистрами);

2.  ожидание: если следующая команда использует результат предыдущей, то последняя не может начать выполняться до выполнения первой (это преодолевается при использовании внеочередного выполнения команд, out-of-order execution);

3.  очистка конвейера при попадании в него команды перехода (эту проблему удаётся сгладить, используя предсказание переходов).

Некоторые современные процессоры имеют более 30 ступеней в конвейере, что увеличивает производительность процессора, однако приводит к большому времени простоя (например, в случае ошибки в предсказании условного перехода.)

Суперскалярная архитектура

Способность выполнения нескольких машинных инструкций за один такт процессора. Появление этой технологии привело к существенному увеличению производительности.

CISC-процессоры

Complex Instruction Set Computing — вычисления со сложным набором команд. Процессорная архитектура, основанная на усложнённом наборе команд. Типичными представителями CISC является семейство микропроцессоров Intel x86 (хотя уже много лет эти процессоры являются CISC только по внешней системе команд). Философия проектирования процессоров, которая характеризуется следующим набором свойств:

·  Нефиксированным значением длины команды.

·  Исполнение операций, таких как загрузка в память, арифметические действия кодируется в одной инструкции.

·  Небольшим числом регистров, каждый из которых выполняет строго определенную функцию.

Типичными представителями являются процессоры на основе x86 команд (исключая современные Intel Pentium 4, Pentium D, Core, AMD Athlon, Phenom которые являются гибридными).

Наиболее распространённая архитектура современных настольных, серверных и мобильных процессоров построена по архитектуре Intel x86 (или х86-64 в случае 64-разрядных процессоров). Формально, все х86-процессоры являлись CISC-процессорами, однако новые процессоры, начиная с Intel486DX, являются CISC-процессорами с RISC-ядром. Они непосредственно перед исполнением преобразуют CISC-инструкции процессоров x86 в более простой набор внутренних инструкций RISC.
В микропроцессор встраивается аппартный транслятор, превращающий команды x86 в команды внутреннего RISC-процессора. При этом одна команда x86 может порождать до 4 RISC-команд. Исполнение команд происходит на суперскалярном конвейере одновременно по несколько штук.
Это потребовалось для увеличения скорости обработки CISC-команд, так как известно, что любой CISC-процессор уступает RISC-процессорам по количеству выполняемых операций в секунду. В итоге, такой подход и позволил поднять производительность CPU.

RISC-процессоры

Reduced Instruction Set Computing (technology) — вычисления с сокращённым набором команд. Архитектура процессоров, построенная на основе сокращённого набора команд. Характеризуется наличием команд фиксированной длины, большого количества регистров, операций типа регистр-регистр, а также отсутствием косвенной адресации. Концепция RISC разработана Джоном Коком (John Cocke) из IBM Research, название придумано Дэвидом Паттерсоном (David Patterson).

Это философия проектирования процессоров, которая во главу ставит следующий принцип: более компактные и простые инструкции выполняются быстрее. Простая архитектура позволяет как удешевить процессор, так и поднять тактовую частоту. Многие ранние RISC-процессоры даже не имели команд умножения и деления.

Идея создания RISC процессоров пришла после того как в 1970-х годах ученые из IBM обнаружили, что многие из функциональных особенностей традиционных ЦПУ игнорировались программистами. Отчасти это был побочный эффект сложности компиляторов. В то время компиляторы могли использовать лишь часть из набора команд процессора. Следующее открытие заключалось в том, что, поскольку некоторые сложные операции использовались редко, они как правило были медленнее, чем те же действия, выполняемые набором простых команд. Это происходило из-за того что создатели процессоров тратили гораздо меньше времени на улучшение сложных команд, чем на улучшение простых.

Первые RISС-процессоры были разработаны в начале 1980-х годов в Стэнфордском и Калифорнийском университетах США. Они выполняли небольшой (50 − 100) набор команд, тогда как обычные CISC (Сomplex Instruction Set computer) выполняли 100—200.

Характерные особенности RISC-процессоров:

·  Фиксированная длина машинных инструкций (например, 32 бита) и простой формат команды.

·  Одна инструкция выполняет только одну операцию с памятью — чтение или запись. Операции вида «прочитать-изменить-записать» отсутствуют.

·  Большое количество регистров общего назначения (32 и более).

Наиболее широко используемые в настольных компьютерах процессоры архитектуры x86 ранее являлись CISC-процессорами, однако новые процессоры, начиная с Intel486DX, являются CISC-процессорами с RISC-ядром. Они непосредственно перед исполнением преобразуют CISC-инструкции процессоров x86 в более простой набор внутренних инструкций RISC.

MISC-процессоры

Minimum Instruction Set Computing — вычисления с минимальным набором команд. Дальнейшее развитие идей команды Чака Мура, который полагает, что принцип простоты, изначальный для RISC процессоров, слишком быстро отошёл на задний план. В пылу борьбы за максимальное быстродействие, RISC догнал и перегнал многие CISC процессоры по сложности. Архитектура MISC строится на стековой вычислительной модели с ограниченным числом команд (примерно 20-30 команд). Увеличение разрядности процессоров привело к идее укладки нескольких команд в одно большое слово. Это позволило использовать возросшую производительность компьютера и его возможность обрабатывать одновременно несколько потоков данных. Кроме этого MISC использует стековую модель вычислительного устройства и основные команды работы со стеком Forth языка. MISC принцип может лежать в основе микропрограммы выполнения Java и Net программ, хотя по количеству используемых команд они нарушают принцип MISC

Кэширование

Кэширование — это использование дополнительной быстродействующей памяти (кэш-памяти) для хранения копий блоков информации из основной (оперативной) памяти, вероятность обращения к которым в ближайшее время велика.

Различают кэши 1-, 2- и 3-го уровней. Кэш 1-го уровня имеет наименьшую латентность (время доступа) но малый размер, кроме того кэши первого уровня часто делаются многопортовыми. Так процессоры AMD K8 умели производить 64 бит запись+64 бит чтение либо два 64-бит чтения за такт, процессоры Intel Core могут производить 128 бит запись+128 бит чтение за такт. Кэш 2-го уровня обычно имеет значительно большие латентности доступа, но его можно сделать значительно больше по размеру. Кэш 3-го уровня самый большой по объёму и довольно медленный, но всё же он гораздо быстрее, чем оперативная память.

Параллельная архитектура

Архитектура фон Неймана обладает тем недостатком, что она последовательная. Какой бы огромный массив данных ни требовалось обработать, каждый его байт должен будет пройти через центральный процессор, даже если над всеми байтами требуется провести одну и ту же операцию. Этот эффект называется узким горлышком фон Неймана.

Для преодоления этого недостатка предлагались и предлагаются архитектуры процессоров, которые называются параллельными. Параллельные процессоры используются в суперкомпьютерах.

Возможными вариантами параллельной архитектуры могут служить (по классификации Флинна):

·  SISD — один поток команд, один поток данных;

·  SIMD — один поток команд, много потоков данных;

·  MISD — много потоков команд, один поток данных;

·  MIMD — много потоков команд, много потоков данных.

Многоядерные процессоры Intel серии Core. Сравнение с Pentium D. Энергопотребление технологии Centrino. Core Duo и Core 2 Duo.

Многоядерные процессоры

Содержат несколько процессорных ядер в одном корпусе (на одном или нескольких кристаллах).

Процессоры, предназначенные для работы одной копии операционной системы на нескольких ядрах представляют собой высокоинтегрированную реализацию системы «Мультипроцессор».

На данный момент массово доступны процессоры с двумя ядрами, в частности Intel Core 2 Duo на ядре Conroe и Athlon64X2 на базе микроархитектуры K8. В ноябре 2006 года вышел первый четырёхъядерный процессор Intel Core 2 Quad на ядре Kentsfield, представляющий собой сборку из двух кристаллов Conroe в одном корпусе.

10 сентября 2007 года были выпущены в продажу нативные (в виде одного кристалла) четырёхьядерные процессоры для серверов AMD Quad-Core Opteron, имевшие в процессе разработки кодовое название AMD Opteron Barсelona. 19 ноября 2007 вышел в продажу четырёхьядерный процессор для домашних компьютеров AMD Quad-Core Phenom. Эти процесоры реализуют новую микроархитектуру K8L (K10).

27 Сентября 2006 Intel продемонстрировала прототип 80-ядерного процессора. Предполагается, что массовое производство подобных процессоров станет возможно не раньше перехода на 32-нанометровый техпроцесс, а это в свою очередь ожидается к 2010 году.

Centrino Duo

Если для настольных компьютеров двуядерные процессоры были доступны уже достаточно давно, то на ноутбуках эти достижения современных технологий до сих пор места не находили. Тому были объективные причины, главная из которых – недопустимо высокие энергопотребление и тепловыделение существовавших ранее образцов.

Новый процессор: ядро Yonah

Внешне новинка не особенно отличается от привычного Pentium M. Новый процессор содержит 151,6 млн. транзисторов (предшественник, Pentium M на ядре Dothan, содержит около 140 млн.), площадь кристалла составляет 90,3 мм 2 против 83,6 мм 2 у Dothan. На глаз эта разница практически незаметна, в том числе потому, что кристалл развёрнут на 90 градусов.

Новый Core Duo от старого Pentium M на глаз можно отличить разве что по развёрнутому на 90 градусов кристаллу

Несмотря на то, что процессор имеет те же 478 ножек, что и Pentium M, электрически сокеты несовместимы. А чтобы подчеркнуть эту разницу, процессоры сделаны несовместимыми и механически – для этого производитель изменил положение ключа (отсутствующей ножки). Так что у пользователя при всём желании не получится сжечь процессор, установив его в неподходящую материнскую плату.

Количество ножек у Core и Pentium M одинаковое, но процессорные сокеты несовместимы как электрически, так и механически

Процессор Core изготавливается по новому технологическому процессу 65 нм, собственно, отсюда и столь незначительное отличие площади кристалла.

Архитектура

Самое интересное, что специалистам компании Intel удалось сделать этот CPU не только «тихим» и «холодным», но и превосходящим настольные двуядерные решения по части архитектуры. Взгляните на диаграммы сегодняшних двуядерных решений Intel и AMD, предназначенных для десктопов – Pentium D и Athlon 64 X2:

Доступ к кэш-памяти второго уровня в процессорах Pentium D и Athlon 64 X 2 реализован одинаково и не лучшим образом

При всей несхожести архитектур ядер, оба процессора имеют одну общую черту – одинаково реализованную двуядерность: каждое ядро имеет собственный кэш второго уровня (до 2048 Кбайт на каждое ядро у Pentium D 9xx и до 1024 Кбайт у Athlon 64 X2), а для связи ядер используется внутренняя шина (в случае Pentium D передача данных между ядрами возможна и через FSB). Разумеется, решение не самое удобное в том случае, когда одному ядру надо получить данные, содержащиеся в кэше другого ядра – ведь нередко ядра работают над одной и той же задачей, просто выполняя разные её части. Отсюда неминуемые задержки в доступе к информации, а также такие неприятности, как простой одного из ядер по той причине, что его кэш полностью заполнен данными, которые всё ещё нужны второму ядру.

Логичное решение этой проблемы – использование общей кэш-памяти. И именно таким образом работает Core Duo.

Core Duo обладает более прогрессивной архитектурой, нежели его настольные «коллеги».

Core (Yonah)

Pentium M (Dothan)

Количество ядер

1 (Solo) или 2 (Duo)

1

Тактовые частоты

МГц

МГц

Частота FSB

667 МГц (166 x4)

533 МГц (133x4)

Кэш L1 уровня (д)

32 Кбайт

32 Кбайт

Кэш второго уровня

2048 Кбайт

2048 Кбайт

Наборы инструкций

MMX, SSE, SSE2, SSE3

MMX, SSE, SSE2

Enhanced SpeedStep

Есть

Есть

Частота при низкой нагрузке

1000 МГц

800 МГц

Execute Disabled Bit

Есть

Есть

Перечислим наиболее важные отличия (не считая двуядерности, которую мы уже обсудили):

·  Тактовые частоты пока не выросли и даже наоборот ­– слегка поуменьшились. Конечно, через некоторое время будут представлены новые модели процессоров, сначала с тактовой частотой 2,33 ГГц, а потом, возможно, и 2,5 ГГц. А там уже и до следующей версии Centrino недалеко...

·  По сравнению с Pentium M, частота FSB выросла на 133 МГц и составила 667 МГц – практически 666. Интересно, что этой «дьявольской» частоты FSB при очередном изменении модельного ряда Pentium 4 аккуратно избежали, сразу перейдя на 800 МГц. Наверняка маркетологи Intel решили не нервировать покупателей ::)

·  Наконец-то добавилась поддержка последнего, третьего набора инструкций SIMD Streaming Instructions. Напомним, SSE представляет собой расширение стандартных инструкций x86, предназначенное для повышения скорости обработки мультимедийных данных. SSE3 добавляет к функциональности более ранних наборов SSE и SSE2 дополнительные 13 новых инструкций, разработанных для увеличения скорости в играх и мультимедиа-приложениях.

·  Вместе с шиной FSB выросла тактовая частота процессора в режиме минимального потребления энергии. Эта частота задается фиксированным коэффициентом 6, не зависящим от номинальной частоты процессора. Таким образом, Core работает на 1000 МГц, тогда как Pentium M работал на частоте 800 МГц (600 МГц для ядра Banias).

Как видим, производители сделали неплохой «бонус» к двуядерности. Все эти нововведения позволяют с уверенностью полагать, что производительность нового процессора будет выше, чем у предшественника, даже в задачах, никоим образом не использующих многопоточность. Впрочем, на второе ядро всегда можно «скинуть» как минимум какие-нибудь фоновые процессы, так что двуядерность, как ни крути, штука беспроигрышная. В итоге – новый, более производительный CPU с передовой архитектурой, поддержкой новых технологий и неплохими скоростными характеристиками. Но это только одна сторона «медали Centrino», теперь же мы перейдём ко второй – пожалуй, более примечательной стороне...

Энергопотребление

Самое важное достижении технологии Centrino – низкое энергопотребление. И в новой версии платформы ему уделено не меньшее (если не большее) внимание. Естественно, Core поддерживает технологию Enhanced SpeedStep, позволяющую «на лету» изменять тактовую частоту процессора и напряжение на ядре в зависимости от необходимой на данный момент производительности. Но это ещё далеко не всё – в новом процессоре реализован и ряд других, не менее интересных и полезных энергосберегающих технологий, таких, например, как Dynamic Power Coordination. Суть этой технологии в том, что ядра могут независимо друг от друга менять энергопотребление в зависимости от текущей нагрузки на процессор. В том числе, возможна ситуация, когда одно ядро работает, а другое находится в состоянии Deep Sleep, в котором потребление энергии близко к минимальному.

Так работает Dynamic Power Coordination – ядра могут менять состояния независимо друг от друга

Фактически, получается, что второе ядро вовсе не означает двухкратного увеличения энергопотребления и тепловыделения, ведь оно работает только тогда, когда это действительно нужно. Компания Intel называет это красивой и ёмкой фразой Dual-Core Performance on Demand – «производительность двуядерного процессора по требованию». Получается очень удобно: с одной стороны, в случае необходимости процессор может потреблять мало энергии, работая в «одноядерном режиме», а с другой стороны, способен мгновенно перейти в режим высокой производительности, задействовав второе ядро.

Теперь перейдем к еще одной важной технологии, позволяющей увеличить время работы от аккумулятора. Если вы посмотрите на фото процессора, то увидите, что кэш занимает примерно 35-40% площади ядра. Естественно, и энергии он потребляет немало. Поэтому одной из задач инженеров Intel стала минимизация потребления этой части процессора. И с этой задачей они успешно справились, разработав технологию Dynamic Cache Sizing – «динамическое изменение размера кэш-памяти». Работает эта технология просто – отключает простаивающие блоки кэш-памяти.

И даже более того, если информация, содержащаяся в кэше, в течение какого-то времени не используется, то она переносится в оперативную память, а блоки кэша опять-таки отключаются. Учитывая, что объём кэша у ядра Yonah достаточно велик – целых 2 Мбайта – полностью он будет использоваться не так уж часто, особенно при невысокой нагрузке на систему, как это обычно и бывает при работе от батареи. Стало быть, с помощью данной технологии сэкономить можно немало.

Кэша ровно столько, сколько необходимо в данный момент. Все лишнее – выключить

Вплоть до того, что можно полностью отключить кэш, «сбросив» данные в память, и перевести процессор в режим Enhanced Deeper Sleep, в котором потребляется совсем уж мизерное количество энергии.

Охлаждение двуядерного процессора – дело более тонкое, чем охлаждение обычного одноядерного. Поэтому для более надёжного контроля и оптимального режима охлаждения в Yonah используются аж три термосенсонсора!

В новом процессоре имеется целых три термодатчика

Сенсоры имеются на обоих ядрах, кроме того, предусмотрен третий, общий датчик, который призван обеспечивать устойчивость от ошибок и legacy-совместимость.

Как видите, компания Intel провела грандиозную работу по обеспечению минимального энергопотребления и тепловыделения, а также масимально эффективного и безопасного охлаждения.

Как результат, TDP для стандартных двуядерных процессоров Core составляет 31 Вт, а для остальных версий – и того меньше. Полезно будет привести сравнение с процессором Pentium M на ядре Dothan.

Процессор

TDP

Core Duo T

31 Вт

Pentium M

27 Вт

Core Solo T

27 Вт

Core Duo LV

15 Вт

Pentium M LV

14 Вт

Core Duo ULV

9 Вт?

Pentium M ULV

7 Вт

Core 2 Duo

 

Процессоры Core 2, основанны на принципиально иной по сравнению с Pentium 4 архитектуре.

 

Архитектура

Процессоры на ядре Conroe, официально называемые Intel Core 2 Duo, как несложно догадаться, являются дальнейшим развитием архитектуры Core. В свою очередь, процессор Core является изрядно переработанной версией не менее удачного процессора Pentium M, который был основой платформы Intel Centrino. Несколько менее очевиден тот факт, что сам Pentium M был мало связан с бывшим тогда на коне Pentium 4, а представлял собой продолжение Pentium III, адаптированное под актуальные потребности, – с широкой шиной, поддержкой новых наборов инструкций и направленностью на минимальное энергопотребление. Таким образом, можно построить следующий эволюционный ряд:

 

Pentium Pro

 

Pentium II

 

Pentium III

 

Pentium M

 

Core

 

Core 2

 

Итак, архитектура NetBurst, на которой были основаны процессоры Pentium 4, проведя на рынке без малого 6 лет (для сравнения: Pentium, Pentium II и Pentium III существовали на рынке в сумме чуть более 7 лет), теперь получила отставку. В чём-то она была хороша, в чём-то не очень, но то, что теперь с ней можно попрощаться если не навсегда, то как минимум надолго, – это точно.

Intel Core 2 – процессор двухъядерный. Поэтому в первую очередь следует отметить кардинально изменившуюся по сравнению с Pentium D идеологию. Теперь вместо двух практически самостоятельных процессоров в одном сокете, со всеми вытекающими отсюда недостатками, мы имеем полноценный двухъядерный процессор: в Core 2 Duo, как и в первом Core Duo, используется общий кэш второго уровня, к которому оба ядра имеют равноправный доступ.

 

 



 

В Core 2 Duo реализованы следующие технологии:

Технология Intel Wide Dynamic Execution – повышает производительность и эффективность работы процессора, позволяя каждому ядру исполнять до четырех инструкций за такт с использованием эффективного 14-этапного конвейера

Технология Intel Smart Memory Access – повышает производительность системы путем снижения задержек при доступе к памяти и таким образом оптимизирует использование доступной пропускной способности, благодаря чему процессор получает данные тогда, когда они требуются

Технология Intel Advanced Smart Cache – общая кэш-память 2-го уровня сокращает энергопотребление, сводя к минимуму объём «трафика» в подсистеме памяти, и повышает производительность системы, обеспечивая одному из ядер доступ ко всей кэш-памяти при простое другого ядра

Технология Intel Advanced Digital Media Boost – удваивает скорость выполнения команд, часто используемых в мультимедийных и графических приложениях

Технология Intel 64 Technology – обеспечивает поддержку 64-разрядных вычислений, предоставляя, например, процессору доступ к большему объёму памяти

Поддержка SSE4 - расширение стандартных инструкций x86, предназначенное для повышения скорости обработки мультимедийных данных

Использование техпроцесса 65 нм (в отличии от AMD)

Поддержка технологии Intel Enhanced SpeedStep – динамическое изменение тактовой частоты процессора в зависимости от текущих потребностей в вычислительной мощности

Технология Ultra Fine Grained Power Control – возможность выключения тех блоков процессора, которые в данный момент не используются

Технология cнижения разрядности шины

Наиболее важно здесь следующее: увеличение скорости исполнения инструкций, оптимизация работы с памятью, введение поддержки 64-разрядных вычислений и, наконец, нового набора инструкций SSE4.

Как результат – большая эффективность даже при равной тактовой частоте. А учитывая, что перед настольными процессорами не стоит задача обеспечить минимальное энергопотребление и, следовательно, можно использовать более высокие частоты, чем те, на которых работают мобильные процессоры, несложно догадаться, что Core 2 на ядре Conroe заметно превосходит по производительности Core на ядре Yonah.

Энергопотребление.

Использование техпроцесса 65 нм. Конечно, это не в новинку для процессоров Intel, но выгодно отличает Core 2 от конкурирующих AMD Athlon.

Поддержка технологии Intel Enhanced SpeedStep – динамическое изменение тактовой частоты процессора в зависимости от текущих потребностей в вычислительной мощности.

Технология Ultra Fine Grained Power Control – возможность выключения тех блоков процессора, которые в данный момент не используются. Можете себе представить, сколько экономит энергии эта функция при сравнительно небольших нагрузках – офисной работе или просмотре DVD-фильмов, например.

Снижение разрядности шины. Опять-таки в «лёгких» режимах львиная доля пропускной способности шин не используется, поэтому разрядность их можно снизить без ущерба для текущих потребностей в производительности.

В результате получился самый «холодный» двухъядерный процессор из тех, что используются в настольных компьютерах.

 

(http://www. *****/online/processors/s26528/)

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7