Л. А. ЩИГОРЕВ
Научный руководитель – И. И. ШАГУРИН, д. т.н., профессор
Национальный исследовательский ядерный университет «МИФИ»,
«Модуль»
МЕТОДЫ ПОВЫШЕНИЯ СБОЕ -
И ОТКАЗОУСТОЙЧИВОСТИ ЭЛЕМЕНТОВ ВСТРОЕННОЙ СТАТИЧЕСКОЙ ОПЕРАТИВНОЙ ПАМЯТИ
Рассмотрены комбинации классических методов повышения сбое - и отказоустойчивости элементов встроенной статической оперативной памяти таких как: контроль четности, коды обнаружения и коррекции ошибок, резервирование отдельных элементов памяти. Даны оценки аппаратурных затрат, накладываемых применением данных способов повышения сбое - и отказоустойчивости.
При проектировании электронных систем одной из важнейших проблем является обеспечение надежности и достоверности хранения и передачи информации (команд, адресов, данных). Современные микросхемы изготавливаются с помощью суб-100нм кремниевых технологий. Ячейки памяти, реализованные с помощью этих технологий, имеют повышенную чувствительность к воздействию таких внешних факторов, как попадание тяжелых заряженных частиц (ТЗЧ), которые вызывают возникновение сбоев и отказов [1]. Поэтому при разработке и применении таких микросхем необходимо использовать эффективные методы повышения их сбое - и отказоустойчивости. Использование таких методов как аппаратное резервирование, применение кодов обнаружение и коррекции ошибок, перемежение данных достаточно подробно описаны в технической литературе [2-3].
Широко известный метод троирования с мажоритированием требует значительных дополнительных аппаратурных затрат – увеличения объема памяти в 3 раза, что ограничивает возможности его применения. Более экономичным по аппаратурным затратам является метод резервирования отдельных элементов запоминающих устройств (например, колонок и/или строк) в размещаемой на кристалле матрице памяти.
Аппаратурные затраты на реализацию этого метода зависят от количества резервных элементов (например, резервных столбцов в банке памяти) и от площади, занимаемой блоком самовосстановления, который обычно составляет единицы процентов от площади блока памяти. Этот способ позволяет повысить отказоустойчивость блоков памяти, но не обеспечивает защиту от возникающих сбоев.
Для защиты от сбоев можно использовать методы помехоустойчивого кодирования, которые позволяют выявить и скорректировать ошибки, возникающие в передаваемой и хранящейся информации вследствие сбоев или отказов, ценой введения дополнительных контрольных разрядов. Наиболее простой метод контроля по четности позволяет определить возникновение одиночной ошибки с помощью одного контрольного бита. В современной цифровой технике обычно реализуется побайтный контроль четности. В связи с этим необходимо разделять длинные информационные слова на банки, хранящие 8-битные слова. Для коррекции одиночной ошибки в зависимости от разрядности информационного слова требуется четыре и более проверочных разрядов. Введение бита четности в каждое слово, хранящееся в отдельном банке, позволяет обнаружить одиночную ошибку при выполнении операций записи/чтения в/из ОЗУ.
Разделение длинных информационных слов на короткие позволяет пропорционально увеличить число количество корректируемых одиночных ошибок и число резервных элементов, используемых для вновь образованного банка.
Для эффективного решения задачи повышения сбое - и отказоустойчивости предлагается использовать комбинации следующих методов:
- аппаратное резервирование элементов (столбцов) запоминающих устройств;
- кода Хэмминга [4], корректирующий одиночную ошибку;
- побайтовый контроль четности;
- перемежение данных;
Проведенное исследование показало, что применение комбинированных методов позволяет повысить сбое - и отказоустойчивость встроенных блоков статических ОЗУ ценой увеличения в 1,5 – 2,0 площади, занимаемой на кристалле матрицей ячеек памяти.
Список литературы
Радиационные эффекты в интегральных схемах высокой степени интеграции, М.: НИЯУ МИФИ, 2010. 148 с. адиационно-стойкие интегральные схемы. Надежность в космосе и на земле // Электроника: Наука, Технология, Бизнес. 2007, №5. С. 72-77. , , «Методы обеспечения стойкости микросхем к одиночным событиям при проектировании радиационно-стойких микросхем» // V Всероссийская научно-техническая конференция “Проблемы разработки перспективных микро - и наноэлектронных систем (МЭС)”. Сб. трудов. М.: ИППМ РАН, 2012. С. 634-637. Hamming R. W. Error Detecting and Correcting Codes – Bell Syst. Tech. J., 1950, vol. 29, pp. 147-160.


