Основні наукові та практичні результати роботи полягають у наступному.

1. Доведено, що жоден з етапів обробки, в класичному розумінні, не включає в собі функції динамічного балансування навантаження, відсутність якого навантаження призводить до нерівномірного завантаження ядер при розв’язанні деяких задач, і, як наслідок, до неефективного використання ресурсів паралельних комп’ютерних систем.

2. Запропоновано математичну модель паралельних обчислювальних процесів, яка на відміну від відомих моделей враховує особливості організації пам’яті процесора, способи і характеристики доступу до загального ресурсу, способи синхронізації процесів обміну даними між елементами системи, що дозволяє виявити можливі шляхи підвищення ефективності паралельних обчислень.

3. Запропоновано візуально орієнтованій метод збору статистики про виконання паралельних процесів довільної програми, що використовує інтерфейс передачи повідомлень в розподіленій комп’ютерній системі кластерного типу який на відміну від відомих методів враховує можливість перегляду та аналізу даних про виконання програми в динамічному режимі, що дозволяє згенерувати віртуальну топологію MPI з мінімізацією її вартості для забезпечення ефективного виконання програми та виявлення можливих шляхів підвищення ефективності паралельних обчислень.

4. Запропоновано метод динамічного балансування навантаження за рахунок використання моделі високорівневої передачі повідомлень, що у порівнянні з існуючими підходами дозволяє описувати задачі, які підлягають балансуванню, за допомогою високорівневих абстракцій, що потенційно дозволяє знаходити більш ефективні рішення.

НЕ нашли? Не то? Что вы ищете?

5. Запропоновано підходи до балансування навантаження, які на відміну від існуючих, виконують динамічне формування графу підзадач, що дозволяє більш рівномірно розподіляти підзадачі між вузлами обчислювальної системи за рахунок адаптування зернистості.

6. Одержано метод визначення часу початку передачі даних, який на відміну від існуючих методів, враховує непрямий вплив обсягів зайнятої на вузлах пам’яті на ефективність обчислень, що дозволяє зменшити пікові обсяги використаної пам’яті та збільшити ефективність.

7. Дістало подальший розвиток метод відкладених обчислень, що у порівнянні з традиційними підходами враховує можливість перевпорядкування доступу, балансування навантаження та можливість відміни частини обчислень, завдяки чому не виконується повторна (транзитна) передача даних, яка не буде використана певним вузлом безпосередньо.

8. Спрощено процес розробки паралельних програм, оскільки користувач реалізує алгоритми обробки даних, застосовуючи абстракцію в термінах його проблемної області, використовуючи стандартний стиль програмування в будь-якому програмному середовищі, яке дозволяє створювати паралельні динамічні бібліотеки і забезпечувати налагодження програмних модулів.

9. Розроблено засоби, що покращують характеристики паралельних програм за допомогою аналізу статистики передачі даних між різними процесами на етапі тестових і трасувальних запусків паралельної програми, генеруючи при цьому віртуальну топологію з мінімізацією вартості, що забезпечує ефективне виконання цих програм.

СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ

1. Hennessy, John puter architecture: a quantitative approach / John L Hennessy, David A Patterson. – Amsterdam, Noord-Hooland, Netherlands: Elsevier, 2011. – 824 p.

2. Recent trends in the marketplace of high performance computing / Eri­ch Strohmaier, Jack J. Dongarra, Hans W. Meuer, Horst D. Simon // Parallel Computing. - 2005. – Vol. 31, no. 3-4. – P. 261-273.

3. Flynn, M. J. Very high-speed computing systems / M. J. Flynn. – 1966. – dec. –Vol. 54, no. 12. – P. 1901-1909.

4. An Evaluation of Vectorizing Compilers / S. Maleki, Yaoqing Gao, M. J. Garzaran [et al.] // Parallel Architectures and Compilation Techniques (PACT), 2011 International Conference on. – Los Alamitos, CA, USA: IEEE Computer Society, 2011. – oct. – P. 372 -382.

5. An Updated Set of Basic Linear Algebra Subprograms (BLAS) / L. S. Blackford, J. Demmel, J. Dongarra [et al.] // ACM Transactions on Mathematical Software. - 2001. - Vol. 28. - P. 135-151.

6. The Nanoelectronic Road Ahead: Despite Challenges, Silicon Offers 20 More Years of Semiconductor Progress [Электронный ресурс]. – Режим доступа: http://gtresearchnews. gatech. edu/newsrelease/FUTURECHIP. html. – Последнее обращение: 01.04.2013. – Название с экрана.

7. Multi-core processors – the next evolution in computing [Електроний peсурс].– Режим доступа: http://www. /us-en/assets/content_ type/white_papers_and_tech_docs/Multi-Core_Processing_33211A. pdf. – Останнє звернення: 01.04.2013. – Назва з екрану.

tter, H. The Free Lunch Is Over: A Fundamental Turn Toward Concurrency in Software / tter // Dr. Dobb's Journal. –2005. – Vol. 30, no. 3.

9. From a few cores to many: a tera-scale computing research overvi­ew [Electronic resource]. – Access mode: http://download. / research/platform/ terascale/terascale_overview_paper. pdf. – Last access: 01.04.2013. – Title from the screen.

10. Система пространственного распределения заданий в распределённых вычислительных системах / , , ­цкий, // Вісник НТУУ «КПІ». Інформатика, управління та обчислювальна техніка. – 2012. – № 56. – С. 170.

11. Tanenbaum, Andrew S. Distributed Systems: Principles and Paradigms (2nd Edition) / Andrew S. Tanenbaum, Maarten van Steen. – Upper Saddle River, NJ, USA: Prentice-Hall, Inc., 2006.

12. Tanenbaum, Andrew S. Modern Operating Systems / Andrew S. Tanenbaum. – 3rd edition. – Upper Saddle River, NJ, USA: Prentice Hall Press, 2007.

n. – OpenSPARC T2 Core Microarchitecture Specification, A edition, 2007. – Dec.

14. Cybenko, G. Dynamic load balancing for distributed memory multiprocessors / G. Cybenko // J. Parallel put. 1989. – Oct. – Vol. 7, no. 2. – P. 279-301.

15. Farina, Fabio. Grid and HPC Dynamic Load Balancing with Lattice Boltzmann Models / Fabio Farina, Gianpiero Cattaneo, Alberto Dennunzio // On the Move to Meaningful Internet Systems 2006: CoopIS, DOA, GADA, and ODBASE / Robert Meersman, Zahir Tari. – [S. 1.]: Springer Berlin Heidelberg, 2006. – Vol. 4276 of Lecture Notes in Computer Science. – P. 1152­-1162. – URL: http://dx. doi. org/10.1007/11914952_6.

16. Performance Development | TOP500 Supercomputer Sites [Electronic resource].– Access mode: http://top500.org/statistics/perfdevel/.– Last access: 28.02.2013. – Title from the screen.

17. Parallel Programmer Productivity: A Case Study of Novice Parallel Programmers / Lorin Hochstein, Jeff Carver, Forrest Shull [et al] // Proceedings of the 2005 ACM/IEEE conference on Supercomputing. – SC '05. – Washington, DC, USA: IEEE Computer Society, 2005, - P. 35.

18. Симоненко вычислительных процессов в ЭВМ, ком­плексах, сетях и системах / – К.: ВЕК, 1997. – 304 с.

19. Hoare, C. A. R. Monitors: an operating system structuring concept / C. A. R. Hoare // Commun. ACM. – 1974. – oct. – Vol. 17, no. 10,- P. 549 557.

20. The Java Language Specification / James Gosling, Bill Joy, Guy Steele [et al.]; Oracle America, Inc. – Java SE 7 Edition edition. – California, USA: [s. ï.], 2012. – February.

21. Sharing Is the Root of All Contention [Electronic resource].– Access mode: http://www. /architecture-and-design/sharing-is-the-root-of-all-contention/214100002?pgno=l. – Last access: 28.02.2013. – Title from the screen.

22. Callahan, David. Static analysis of low-level synchronization / David Callahan, Jaspal Sublok // SIGPLAN Not.- 1988. – nov. – Vol. 24, no. 1. – P. 100-111.

23. Jeremiassen, Tor E. Static analysis of barrier synchronization in explicitly parallel programs / Tor E Jeremiassen, Susan J Eggers [et al.] // IFIP Transactions. – 1994. – Vol. 50. – P. 171-180.

24. Clang Language Extensions – Clang 3.3 documentation [Electronic resource]. – Accessmode: http://clang. llvm.0rg/d0cs/LanguageExtensi0ns. html#thread-safety-annotation-checking – Last access: 28.02.2013.– Title from the screen.

25. Dynamic race detection with LLVM compiler / Konstantin Serebryany, Alexander Potapenko, Timur Iskhodzhanov, Dmitriy Vyukov // Proceedings of the Second international conference on Runtime verification. – RV'll. – Berlin, Heidelberg : Springer-Verlag, 2012. – P. 110-114.

26. Halpern, Pablo. Document N3409, Strict Fork-Join Parallelism.– ISO/IEC Standard Group for Information Technology / Programming Languages / C++.–2012.

27. Cilk User's Guide / Intel. - Hillsboro, OR, USA: Intel Press, 2012.

28. Board, OpеnMP Architecture Review. OpenMP Application Program Interface Version 3.1 / OpenMP Architecture Review Board. – [S. 1. : s. n.], 2011.

29. ISO/IEC. C++ 2011 Standard Document 14882:2011.- ISO/IEC Standard Group for Information Technology / Programming Languages / C++. – 2011.

30. Languages and Compilers for Parallel Computing / Eduard Ayguade, Alejandro Duran, Jay Hoeflinger [et al.] / Vikram Adve, Maria Jesus Garzarän, Paul Petersen. – Berlin, Heidelberg : Springer-Verlag, 2008. – P. 63-77.

31. Intel Thread Building Blocks Documentation [Electronic resource]. – Access mode: http://threadingbuildingblocks.org/documentation. php. – Last access: 08.05.2012. – Title from the screen.

32. Herlihy, Maurice. Transactional memory: architectural support for lock-free data structures / Maurice Herlihy, J. Eliot B. Moss // SIGARCH Comput. Archil News. - 1993. - may. - Vol. 21, no. 2. - P. 289-300.

33. Rajwar, Ravi. Transactional lock-free execution of lock-based programs / Ravi Rajwar, James R. Goodman // SIGOPS Oper. Syst. Rev. – 2002. – oct. – Vol. 36, no. 5. - P. 5-17.

34. Evaluation of Blue Gene/Q hardware support for transactional memories / Amy Wang, Matthew Gaudet, Peng Wu [et al.] // Proceedings of the 21st international conference on Parallel architectures and compilation techni­ques. – PACT '12. – New York, NY, USA: ACM, 2012. - P. 127-136.

35. Transactional Synchronization in Haswell [Electronic resource].– Access mode: http://software. /en-us/blogs/2012/02/07/transactional-synchronization-in-haswell. Last access: 28.02.2013. – Title from the screen.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53