Таблица 1.

4

8

16

32

64

128

4, 4

9792

39168

156672

626688

2506752

10027008

8, 8

31872

127488

509952

2039808

8159232

32636928

16, 16

112192

448768

1795072

7180288

28721152

114884608

32, 32

416384

1665536

6662144

26648576

106594304

426377216


В табл. 2 содержатся результаты сравнительной оценки гибкости разработанных аппаратных средств. В качестве характеристик гибкости выбраны инвариантность к конфигурации барьерных групп, масштабируемость координирующей среды и расширяемость на случай d-мерной матрицы. Из табл. 2 видно, что по совокупности характеристик гибкости предложенный подход превосходит лучшие известные аналоги (методы, отмеченные символом *, относятся к подклассу гибридных).

Таблица 2.

Наименование метода или решения

Инвариантность к конфигурации барьерных групп

Масштабируемость

Расширяемость на случай d-мерной матрицы

Древовидная барьерная сеть CM-5

Не обеспечивается (допускаются только барьерные группы мощностью степени двойки).

Плохая (при добавлении новых процессоров в систему нужна полная перестройка барьерной среды).

Плохая. Плохо согласуется с матричной топологией.

Распределенный аппаратный барьер Delgado-Kofuji

Не обеспечивается (барьерные группы должны размещаться в прямоугольных сплошных областях матрицы).

Средняя (жесткое ограничение на число параллельно выполняемых барьеров).

Средняя. Применим только к двумерным матрицам.

MDBS-сеть

Частичная (синхронизируемые процессы должны быть размещены в соседних процессорах).

Хорошая (ограничено число барьеров в системе).

Средняя. Применима только к двумерным матрицам.

Метод многоадресных пакетов Panda*

Полная.

Средняя (длина сообщения сильно зависит от мощности барьерных групп).

Хорошая. Нет ограничений.

Барьерное дерево BTM*

Полная.

Хорошая (ограничено число барьерных регистров).

Средняя. Применимо только к двумерным матрицам.

Синхронизатор DVBSS

Полная.

Средняя (наличие физических обратных связей между угловыми модулями матрицы усложняет расширение системы).

Хорошая. Нет ограничений.

Предлагаемый подход

Полная.

Хорошая (ограничено число физических слоев координирующей среды).

Хорошая. Нет ограничений.


Четвертый раздел посвящен исследованию функционирования разработанной ячейки виртуально-многослойной координирующей среды в составе ОММК с целью оценки среднего времени, затрачиваемого на один барьерный эпизод (среднего времени синхронизации).

НЕ нашли? Не то? Что вы ищете?

Оценка среднего времени синхронизации выполнялась на основе имитационного моделирования. Моделирование проводилось только для двумерного ОММК, поскольку реализация СБИС-систем более высокой размерности на данном этапе затруднительна. Исследования осуществлялись в предположении, что , а количество синхронизируемых и активизируемых ветвей для каждого барьера одинаково. Число синхронизируемых / активизируемых ветвей при этом выбиралось из диапазона от 2 до , а их распределение между модулями мультикомпьютера варьировалось равновероятно. Время распространения значений индикаторных функций через ячейку, а также моменты завершения ветвей множеств определялись согласно усеченному нормальному распределению. Каждое значение величины рассчитывалось путем усреднения по 500 итерациям, что обеспечило достаточную точность с учетом методической погрешности имитационного моделирования.

Моделирование позволило подтвердить, что среднее время синхронизации слабо зависит от разрядности координирующей среды n, поскольку физические слои практически не оказывают влияния друг на друга. График зависимости величины от глубины виртуализации координирующей среды p приведен на рис. 7. Зависимость соответствует мультикомпьютеру с организацией 8?8 и получена в предположении, что задержка одного ЭВ составляет в среднем 1 нс, а время обмена данными между процессорным модулем и ячейкой не превышает 150 нс (определено экспериментально).

Анализ этой зависимости показывает, что она с достоверностью прогнозирования не менее 0,98 близка к линейной. Таким образом, для всех практически достижимых значений p среднее время синхронизации не превышает 20-30 мкс. В то же время при малых значениях p (9 и меньше) оно не превосходит 10 мкс. Указанные значения соизмеримы с оценками времени синхронизации, полученными при аналогичных допущениях для известных аппаратных и гибридных методов барьерной синхронизации.

На рис. 8 представлены графики зависимости среднего времени синхронизации от числа модулей в составе мультикомпьютера N, полученные при различных значениях p. Из рис. 8 следует, что для максимально возможных на текущий момент конфигураций ОММК (10?10 – система TILE-Gx100) значения не превышают 20?25 мкс при любых практически обоснованных значениях p.

В заключении сформулированы основные результаты и выводы диссертации.

В приложениях приведен листинг программного модуля имитационного моделирования, а также представлены акты о внедрении результатов диссертации на предприятиях и в учебный процесс.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ РАБОТЫ

Диссертационная работа посвящена решению научно-технической задачи, заключающейся в разработке метода и аппаратных средств барьерной синхронизации для однокристальных матричных мультикомпьютеров, позволяющих исключить ограничения на конфигурацию барьерных групп и максимальное число барьеров в выполняемых программах при заданных ограничениях на среднее время барьерной синхронизации, существенная для создания СБИС-систем с гибкой высокоскоростной подсистемой барьерной синхронизации.

В ходе решения этой задачи получены следующие основные результаты:

Создан аппаратно-ориентированный метод распределенной барьерной синхронизации для однокристальных матричных мультикомпьютеров, отличающийся параллельно-конвейерной организацией распространения значений двоичных индикаторных функций барьеров в многослойной координирующей среде, на каждый канал (одноразрядный слой) которой отображено несколько виртуальных каналов, в каждом из которых может выполняться синхронизация нескольких попарно непараллельных барьеров. Доказано, что разработанный метод барьерной синхронизации инвариантен к конфигурации барьерных групп и в частности, к их мощности и размещению в ОММК, применим в случаях динамического порождения и уничтожения параллельных процессов, регламентируемых стандартом параллельного программирования MPI 3.0, а также позволяет исключить требования к числу попарно параллельных барьеров в выполняемых программах. Разработана структурно-функциональная организация узлового устройства (ячейки) барьерной синхронизации в составе координирующей среды матричного мультикомпьютера, отличающаяся использованием логической конфигурации отдельного канала (слоя) с двумя инвертирующими цепями обратной связи в двух угловых ячейках среды, имеющих соответственно минимальные и максимальные координаты во всех измерениях, содержащая новые блоки коммутации виртуальных каналов, отображения барьеров на виртуальные каналы, конвейерного переключения виртуальных каналов и позволяющая реализовать синхронизацию произвольных барьерных групп, в том числе формируемых динамически в ходе выполнения параллельной программы, а также в условиях динамического порождения и уничтожения параллельных процессов. Выполнена аналитическая оценка аппаратной сложности разработанной ячейки и координирующей среды на ее основе, которая позволила установить, что в большинстве практически значимых случаев координирующая среда в целом содержит не более 2 млн. эквивалентных вентилей и следовательно, может быть полностью реализована на одной микросхеме (и следовательно, интегрирована в ОММК на этапе производства). Установлено, что предложенный подход и разработанные аппаратные средства барьерной синхронизации по совокупности основных характеристик гибкости (зависимость от конфигурации барьерных групп, масштабируемость координирующей среды и расширяемость на случай d-мерной матрицы) превосходят лучшие известные аналоги и соответствуют требованиям действующих стандартов параллельного программирования мультикомпьютеров (в частности, MPI 3.0). Выполнено имитационное моделирование функционирования разработанной ячейки в составе координирующей среды мультикомпьютера, в результате которого были получены экспериментальные зависимости среднего времени синхронизации от глубины виртуализации координирующей среды и числа процессоров в составе ОММК. Полученные зависимости позволили установить, что при всех практически достижимых и обоснованных на текущий момент значениях варьируемых параметров среднее время синхронизации соответствует имеющимся ограничениям (20?30 мкс) и не превышает значения аналогичного показателя известных аппаратных методов барьерной синхронизации.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

Статьи по перечню ведущих рецензируемых научных журналов и изданий

Зотов, реализация барьерной синхронизации в матричных мультикомпьютерах [Текст] / , , // Информационно-измерительные и управляющие системы. 2013. №8. С. 41-45. Бредихин, Р. В. Об организации встроенного аппаратного взаимоконтроля в логических мультиконтроллерах [Текст] / , Ньян Лин, // Изв. Вузов. Приборостроение. 2013. Т.56, №6. С. 44-49. Зотов, организации встроенного аппаратного межмодульного взаимоконтроля в матричных логических мультиконтроллерах [Текст] / , , Ньян Лин // Известия ЮЗГУ. Серия «Управление, вычислительная техника, информатика. Медицинское приборостроение». 2013. №1. С. 202-208. Зотов, -ориентированные методы управления межпроцессорной координацией в параллельных системах с распределенной памятью [Текст] / , , Ньян Лин // Известия ЮЗГУ. Серия «Управление, вычислительная техника, информатика. Медицинское приборостроение». 2013. №1. С. 43-48. Бредихин, процедура циклической барьерной синхронизации для однокристальных матричных мультикомпьютеров [Текст] / , // Известия ЮЗГУ. Серия Управление, вычислительная техника, информатика. Медицинское приборостроение. №2, часть 1, 2012. С. 48-54.

Статья в международном рецензируемом научном издании

Bredikhin, R. V. A distributed parallel pipelined hardware-level barrier synchronization method for mesh-connected multicomputers / Igor V. Zotov, Ruslan V. Bredikhin, Evgeni A. Titenko // International Review on Computers and Software (I. RE. CO. S.), Vol.8, No 9, September 2013. PP. 2254-2261.

Материалы конференций

Бредихин, координирующая среда матричного мультиконтроллера с многослойными виртуальными каналами [Текст] / , , // Материалы докладов I Региональной научно-технической конференции «Информационные системы и технологии», 16-19 октября 2012 г., Курск: ЮЗГУ. С. 197-199. Макаров, ячейки координирующей среды мультиконтроллера с интегрированными средствами аппаратного контроля модулей [Текст] / , , // Материалы докладов I Региональной научно-технической конференции «Информационные системы и технологии», 16-19 октября 2012 г., Курск: ЮЗГУ. С. 56-59. Бредихин, барьерной синхронизации в матричных мультикомпьютерах на основе виртуально-многослойной конвейерной координирующей среды [Текст] / , , // Материалы Международной научно-технической конференции «Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации», Курск, 18-20 мая 2013 г. – Курск: ЮЗГУ, 2013. C. 232-235

Свидетельство о государственной регистрации программы для ЭВМ

Свидетельство об официальной регистрации программы для ЭВМ № 000 / и др. заявл. 14.02.2011; рег. 06.04.2011.

Подписано в печать 17.10.2014 г. Формат 60?84 1/16.

Печ. л. 1,0. Тираж 100 экз. Заказ _________.

Юго-Западный государственный университет.

Издательско-полиграфический центр

Юго-Западного государственного университета.

305040, 4.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6