Оригинальная статья/Original article | ||||
УДК 004.75 | ||||
DOI: http://doi. org/10.20914/2310-1202-2016-3-1-6 | ||||
Определение оптимального числа дополнительных слоёв передаваемых данных схемы сокрытия сетевой латентности | ||||
|
| |||
1 | ФГУП ВНИИА, г. Москва, 101000, Сущевская ул., д. 22, Россия | |||
Реферат. Работа посвящена повышению производительности многоузлового счёта структурированных сеток, за счёт оптимизации использования схемы сокрытия латентности B+2R. В ходе работы получена зависимость, позволяющая рассчитать воздействие параметров вычислительного комплекса и параметров задачи на оптимальное число передаваемых слоёв данных. Для подтверждения полученной зависимости был проведён эксперимент, результаты которого согласуются с прогнозируемыми значениями. Применение стратегии сокрытия латентности позволяет сократить время счёта. Существенное влияние на наличие минимума зависимости времени счёта от R оказывает время счёта ячейки, латентность сети и размер локальной сетки. | ||||
Ключевые слова: Схемы сокрытия сетевой латентности, B+2R, структурированные сетки | ||||
Optimal additional data layers amount determining for interconnect latency hiding scheme | ||||
|
| |||
1 | FSUE VNIIA, Moscow, Suschevskaya str. 22, Russia | |||
Summary. This article describes increasing multinode calculations performance on structural grids by latency hiding B+2R schema optimization. We gained correlation between supercomputer, and job, parameters and optimal number of additional data layers. Real application experiment have been made and its results consist with predictions. Latency hiding schema usage allows to decrease computational time. The main impact on existence of minimum of dependency between calculation time and R is made by cell calculation time, interconnect latency and internode grid size. | ||||
Keywords: Interconnect latency hiding schemes, B+2R, structured grids | ||||
овиков, втушенко Определение оптимального числа дополнительных слоёв передаваемых данных схемы сокрытия сетевой латентности Alexei B. Novikov, Georgii I. Evtushenko Введите здесь название статьи на английском языке |
Введение
Одним из ключевых компонентов эффективности массивно-параллельных вычислений является организация обмена данными между вычислительными узлами. При передаче данных существенные временные задержки могут приходиться на сетевую латентность. Таким образом возникает необходимость в использовании схем сокрытия латентности передачи данных для повышения эффективности массивно-параллельных вычислений.
Для оценки времени передачи данных нами использовалась модель, предложенная Хокни:
(1)
Где
- время передачи
бит данных с пропускной способностью сети
[бит/с].
В данной работе рассматривается простейший случай декомпозиции структурированной сетки по процессам:

Где
- количество ячеек по измерению
на
-ом процессе,.
- ко5-личество ячеек по заданному измерению в базовой сетке,
- номер
-го процесса по заданному измерению в сетке процессов. Таким образом, количество ячеек на одном процессе выражается как:
![]()
И должно выполняться соотношение:
В отсутствие наложения счёта и передачи данных, время счёта можно представить суммой времени обмена данными и непосредственно вычислений.
(2)
Где количество граничных ячеек на
-ом процессе для двумерного случая без использования стратегии B+2R выражается как:
![]()
Очевидно, что время счёта
является функцией от числа ячеек, подвергающихся счёту на
-ом процессе
, а время передачи данных – функцией от количества ячеек и объема памяти, занимаемой ими.
Рассмотрим случай использования стратегии B+2R. Под R будем понимать количество слоёв ячеек соседних процессов.
(3)
Коэффициент два характеризует необходимость как приёма, так и пересылки данных. Функция, определяющая количество ячеек, передаваемых как R слоёв ячеек от соседа, будет определена как показано в уравнении 4 для двумерного случая.
(4)
(5)
(6)
Взяв производную уравнения 5, мы получаем выражение 6, приравняв которое нулю, получаем кубическое уравнение, решением которого является оптимальное для данного вычислительного комплекса и данной задачи R. Стоит отметить, что решение необходимо выбирать, следуя нескольким ограничениям. С одной стороны, R должно быть положительным вещественным числом. При определённых конфигурациях МВК может оказаться, что уравнение 6 не имеет решений в области вещественных чисел, это соответствует случаю, когда небольшая латентность сети позволяет пересылать данные существенно быстрее, чем считается ячейка.
(7)
(8)
![]()
![]()
(9)
![]()
В выражении 8 представлена зависимость времени счёта от числа слоёв передаваемых соседями данных. Приравнивая производную выражения 8 нулю, мы находим минимум искомой функции. Выражение хорошо согласуется с результатами экспериментов. Для эксперимента использовалась конфигурация из 20 машин. Решатель содержал уравнение переноса для трёхмерного случая.

Рисунок 1. Зависимость времени счёта от R
Figure 1. Dependence of calculation time on R
График производной зависимости времени счёта от числа слоёв передаваемых данных показывает пересечение близко к 5 (половина сетки) слоям для данной конфигурации запуска, что соответствует полученному в экспериментах минимуму. Среднеквадратичное отклонение запусков эксперимента составляет
секунды.

Рисунок 2. Производная зависимости времени счёта от R
Figure 2. Derivative of dependence of calculation time on R
Заключение
В работе представлен метод определения оптимального числа передаваемых слоёв данных для схемы сокрытия задержек. На наличие минимума функции времени счёта от числа слоёв существенно влияет латентность сети передачи данных, время счёта одной ячейки и количество соседей у данного процесса.
Литература
Brandon G. A. Kalyan S. dip K. S. Efficient Simulation of Agent-Based Modoels on Multi-GPU and Multi-Core Clusters. Proceedings of SIMUTools 2010 March 15–19References
Brandon G. A. Kalyan S. dip K. S. Efficient Simulation of Agent-Based Modoels on Multi-GPU and Multi-Core Clusters. Proceedings of SIMUTools 2010 March 15–19СВЕДЕНИЯ ОБ АВТОРАХ | INFORMATION ABOUT AUTHORS |
втушенко аспирант, младший научный сотрудник лаборатории высокопроизводительных вычислений, Федеральное государственное унитарное предприятие Всероссийский научно-исследовательский институт автоматики имени , г. Москва, 101000, Сущевская ул., д. 22, Россия, evtushenko. *****@***com овиков заместитель начальника научно-исследовательского отдела-начальник научно-исследовательской лаборатории, Федеральное государственное унитарное предприятие Всероссийский научно-исследовательский институт автоматики имени , г. Москва, 101000, Сущевская ул., д. 22, Россия, a. *****@***ru | Georgii I. Evtushenko junior research fellow, FSUE VNIIA, Moscow, Suschevskaya str. 22, Russia, evtushenko. *****@***com Alexei B. Novikov deputy head of the research department, research laboratory chief, FSUE VNIIA, Moscow, Suschevskaya str. 22, Russia, a. *****@***ru |
КРИТЕРИЙ АВТОРСТВА | CONTRIBUTION |
втушенко предложил методику определения оптимального количества слоёв передаваемых данных, отвечал за написание исходных кодов овиков предложил методику проведения эксперимента, отвечал за написание исходных кодов | Georgii I. Evtushenko proposed a method of the optimal amount of additional data layers, writes the source codes Alexei B. Novikov proposed a scheme of the experiment and writes the source codes |
КОНФЛИКТ ИНТЕРЕСОВ | CONFLICT OF INTEREST |
Авторы заявляют об отсутствии конфликта интересов. | The authors declare no conflict of interest. |
ПОСТУПИЛА 13.04.2016 | RECEIVED 4.13.2016 |
ПРИНЯТА В ПЕЧАТЬ 18.05.2016 | ACCEPTED 5.18.2016 |


