Раздел 3. Развёртывание основного управляющего GRID-сервера на базе ПО Globus Toolkit / gLite

В соответствии с техническим заданием для комплексного обеспечения работ по созданию сети океанологического и геофизического мониторинга Дальневосточных морей России будет развернута специальная GRID-инфраструктура, которая позволит интегрировать и предоставлять участникам НИР все необходимые территориально распределенные телекоммуникационные, информационные, аналитические и вычислительные ресурсы. Концепция GRID предполагает, что доступ к ресурсам предоставляется участникам «виртуальных организаций» (ВО), специально создаваемых из территориально разнесенных специалистов для согласованного решения ими тех или иных научных задач. Как отмечалось в предыдущем отчете по НИР, в работах будет задействовано большое число специалистов из различных отраслей знания, ими будут решаться различные частные океанологические и геофизические задачи, поэтому логично предположить необходимость создания и поддержки работы нескольких таких виртуальных организаций. Хотя в рамках концепции GRID предполагается, что владельцами разделяемых ресурсов, как правило, являются сами потенциальные участники ВО, в нашем случае целесообразно развертывание базовой инфраструктуры GRID-ресурсов с облегченными правами доступа к ним участников настоящей НИР. Создаваемая GRID инфраструктура должна включать: 1 – системы автоматизации типовых экспериментальных установок для наблюдения параметров состояния природной среды; 2 – телекоммуникационные каналы доставки данных удаленных экспериментов с моря на берег; 3 – систему береговых GRID-центров приема и временного хранения данных; 4 – телекоммуникационную сеть для доставки данных с береговых центров в основные БД GRID-инфраструктуры; 5 – единую инфраструктуру хранилищ данных в институтах ДВО РАН, ДВГУ и других образовательных учреждениях, управляемую GRID-сервисами; 6 – базу аналитических приложений, используемых участниками НИР для обработки данных и задач моделирования; 7 – средства выскопроизводительной вычислительной поддержки для решения особо сложных аналитических задач на базе суперкомпьютерных комплексов и систем распределенных вычислений.

НЕ нашли? Не то? Что вы ищете?

Для поддержки функционирования виртуальных организаций, порождающих запросы на предоставление ресурсов, во всех узлах GRID-сети должно функционировать единое ПО «промежуточного уровня». Авторы концепции GRID – Ян Фостер и Карл Кессельман сначала предложили всем использовать инструментальный пакет Globus Toolkit, разработанный под их руководством. Это не устроило ряд авторитетных научных групп, разрабатывавших собственные программные средства интеграции вычислительных и информационных ресурсов для своих задач. Тогда Фостером и Кессельманом была предложена идея разработать открытую архитектуру стандартизированных GRID-служб - OGSA (Open Grid Services Architecture), а всем разработчикам рекомендовать использовать любое программное обеспечение, поддерживающее эти службы. При этом почти сразу же был выпущена новая версия пакета Globus Toolkit – 3.0, полностью основанная на архитектуре OGSA. Другие известные разработчики программных средств управления территориально разнесенными информационно-вычислительными ресурсами адаптировали свои программные пакеты, организовав в них поддержку GRID-служб, входящих в OGSA. В настоящее время для проектирования и поддержки GRID-систем используются различные пакеты, в частности Globus Toolkit 4.0, gLitе, AliEen, NorduGrid и ряд других.

Нами для организации управления вышеперечисленными распределенными GRID-ресурсами сети океанологического и геофизического мониторинга предполагается использовать пакеты Globus Toolkit 4.0 и gLitе. О первом пакете достаточно подробно говорилось в нашем отчете по первому этапу НИР. Ниже, основываясь на материалах сайта российского GRID-сообщества [www. *****], дадим некоторые пояснения к пакету gLite, который является основным средством разработки GRID-приложений в рамках паневропейского GRID-проекта EGEE (Enabling Grids for E-sciencE), объединившего ресурсы 330 научных организаций из 50 стран Европейского Союза, США, Индии, Китая, России и Украины.

В проекте EGEE было решено, что лучше всего двигаться вперед, используя двухфазный подход. Исходно EGEE использовал «промежуточное» программное обеспечение (ППО) своего предшественника - проекта EDG (Еuropean Data Grid). Это ППО затем было развито в пакет LCG, и именно LCG работал в инфраструктуре EGEE на ранней стадии проекта. Параллельно в EGEE были выполнены работы по модернизации большей части исходного пакета и был создан новый продукт – gLite, который сейчас устанавливается в инфраструктуру и имеет статус пред-производственного сервиса. Пакет gLite является полным решением для GRID, включая как базовые низкоуровневые программы, так и ряд служб высокого уровня. gLite распространяется на благоприятных для бизнеса условиях лицензии открытого кода. В нем интегрированы как компоненты из лучших на настоящий момент проектов ППО, таких, как Condor и Globus Toolkit, так и компоненты, разработанные для проекта LCG. gLite является одним из лучших базово- инструментальных средств, совместимых с такими планировщиками, как PBS, Condor и LSF. gLite разработан с учетом свойств интероперабельности и содержит базовые службы, облегчающие построение приложений GRID для любых прикладных областей.

В разработке данного программного обеспечения принимают участие различные академические и промышленные исследовательские центры, объединенные в отдельные группы в соответствии с видом деятельности: Управление данными (Data Management), Управление заданиями (Workload Management), Информация и Мониторинг (Information and Monitoring), Учет использования ресурсов (Accounting), Вычислительный элемент (Computing Element), Протоколирование (Logging and Bookkeeping), Безопасность и Сетевой мониторинг (Security and Network Monitoring), Подготовка к работе (Provisioning). Разработка и установка gLite поддерживается также программой EGEE по распределенной т-инфраструктуре (тренировочной инфраструктуре). Эта программа предоставляет по интернету онлайновую документацию, учебные фильмы, организует дистанционные семинары. Обучение можно также пройти на специальном тестовом стенде GILDA, который имеет даже собственный Сертификационный центр (CA). Здесь пользователи и системные администраторы могут проверить все аспекты развертывания и эксплуатации gLite.

Службы gLite соответствуют требованиям SOA (Service Oriented Architecture). Из этого следует, что при необходимости данный продукт можно легко связать с другими GRID-службами, а также, что будет существенно облегчен переход на новые стандарты GRID, такие, например, как WSRF (Web Service Resource Framework) (стандарт OASIS) и OGSA (Open Grid Service Architecture) (предложение Global Grid Forum).

Пакет gLite спроектирован как модульная система, позволяющая пользователям развертывать различные службы в соответствии с их нуждами, а не быть вынужденными использовать всю систему целиком. Предполагается, что это позволит каждому пользователю приспособить систему к его конкретной ситуации.

Базируясь на опыте разработки промежуточных продуктов EDG и LCG, gLite обладает новыми особенностями во всех частях программного пакета. В частности, он гораздо лучше реализует безопасность, имеет лучшие интерфейсы для управления данными и запуска заданий, обладает переработанной информационной системой и многими другими усовершенствованиями, делающими gLite легким и эффективным в использовании. gLite уже развернут на некоторых тестовых и предпроизводственных GRIDах. Сейчас осуществляется установка gLite в общую инфраструктуру EGEE в статусе предпроизводственного сервиса.

Учитывая вышесказанное было решено наряду с ранее апробированными пакетами Globus Toolkit и G-Condor (см. предыдущий отчет по НИР, разделы 3, 5) осуществить установку и провести первичное тестирование возможностей ППО gLite.

Для организации основного GRID-сервера настоящей НИР был приобретен и установлен в серверном помещении ТОИ ДВО РАН компьютер Xeon E5405 Quad Core (4-х ядерный процессор, частота 2 ГГц, оперативная память 2 Гб, дисковый массив общим объемом 3 Тб).

На компьютере был установлен и настроен управляющий Грид-сервер под управлением операционной системы Ubuntu Server 8.0. На сервер было установлен ПО Globus Toolkit 4.2.1, включающее базовые службы Grid Security Infrastructure (GSI), GridFTP, Replica Location Service (RLS), Grid Resource Allocation and Management (GRAM).

Дополнительно на компьютере был настроен виртуальный сервер с операционной системой Scientific Linux 5.3 x86_64, на котором было установлено программное обеспечение gLite 3.2 в составе следующих компонентов:

• glite-BDII (Berkeley Database Information Index)

• glite-LFC_mysql (LCG File Catalogue)

• glite-SE_dpm_mysql (Storage Element)

• glite-TORQUE_client

• glite-UI (User Interface)

• glite-VOBOX (Virtual Organization)

• glite-WN (Worker Node)

Начато изучение возможностей всех установленных компонентов для организации целостной системы предоставления участникам НИР территориально распределенных информационных, аналитических и вычислительных ресурсов в режиме виртуальных организаций.

На сервере видеомониторинга под управлением Microsoft Windows Server 2008 настроено ПО Server, установлены сертификаты и настроены права для доступа к ресурсам данных. На ряде удаленных компьютеров установлено ПО Client, позволяющее вести обмен данными в соответствии с технологиями GRID.

На отдельном сервере под управлением Microsoft Windows Server 2003 установлено ПО Condor 7.3.2, настроенное в режимы сервера и менеджера задач, а также механизм Condor-G для предоставления вычислительных ресурсов серверу под управлением Globus Toolkit. На двадцати компьютерах сотрудников отдела Информационных технологий и отдела Физики геосфер, а также на 10 компьютерах учебного класса ТОИ ДВО РАН, находящихся под управлением различных версий операционных систем Microsoft Windows и Linux, установлено ПО Condor 7.3.2 в качестве клиента для предоставления вычислительных ресурсов для выполнения задач. Общее количество компьютеров - 30, общее количество вычислительных узлов –компьютеров имеют двухядерные процессоры).

Отметим, что вышеприведенное ПО является т. н. промежуточными программным обеспечением - middleware. Для организации интерфейса конечных пользователей с GRID-ресурсами применяются два подхода. Для «продвинутых» пользователей в ППО как правило предлагаются средства с ограниченными интерфейсными возможностями (например, некоторый командный язык, или небольшие оконные приложения), но более гибкие в управлении всеми возможностями ППО. Для «обычных» пользователей, какими в основном являются исполнители настоящей НИР, на основе ППО разрабатывают портальные настройки, существенным образом облегчающие процедуры получения доступа к GRID-ресурсам. В нашем случае предполагается реализовать оба подхода. На рис.1 демонстрируется работа пользователя из ТОИ с GRID-FTP источниками данных, расположенными на МЭС м. Шульца, посредством оконного приложения, предоставляемого клиентской программой .

Рис. 1. Работа с территориально удаленными GridFTP источниками данных с помощью оконного приложения программы

При втором подходе интерфейс участников НИР с ресурсами создаваемой GRID-инфраструктуры будет реализован с помощью океанологической информационно-аналитической системы (ОИАС) ДВО РАН, разработанной в отделе Информационных технологий Тихоокеанского океанологического института. Это тем боле оправданно, что многие участники проекта имеют навыки работы в среде ОИАС.

Фактически ОИАС реализована в форме Web-ГИС проекта. Она предоставляет пользователям посредством стандартного Web-интерфейса доступ к широкой совокупности типов океанологических данных, средствам совместной картографической и общенаучной визуализации данных, библиотеке средств аналитической обработки данных, к высокопроизводительным вычислительным ресурсам корпоративной сети ДВО РАН. На рис. 2 приведена типовая конфигурация окна картографического отображения при работе с ОИАС зарегистрированных пользователей. В данном случае размер базового картографического окна был увеличен пользователем до 640 x 640 пикселов, в области формирования запросов на выборку данных видны дополнительные тематические слои данных. В картографическом окне отображены: среднеиюньское распределение температуры поверхности воды в регионе; местоположение выполненных в научных рейсах ТОИ ДВО РАН гидрологических станций с данными по вертикальному распределению температуры и солености воды; карта разломов фундамента в Охотском море; маршруты тайфунов, прошедших в регионе в 2002 году.

Как уже упоминалось, ОИАС относится к классу Web-ГИС систем. В последние годы такие системы активно разрабатываются у нас в стране и мире. В начале 2000-х годов международным консорциумом OGC была предложена технология взаимодействия территориально разнесенных Wеb-ГИС проектов, основанная на использовании трех базовых обменных сервисов – WMS (Web Map Service), WFC (Web Feature Service), WCS (Web Coverage Service). Использование этих сервисов позволяет, например, при составлении пользователем многослойного покрытия для некоторого географического района наряду со слоями основной ГИС накладывать информационные слои удаленных Web-ГИС систем. В ОИАС ДВО РАН поддерживаются два сервиса OGC технологии - WMS и WFS. Проведены тестовые эксперименты по организации OGC-взаимодействия с несколькими внешними ГИС-проектами, подтвердившие способность ОИАС участвовать в интеграционных проектах, основанных на применении данной технологии.

Система аналитической поддержки ОИАС включает набор программных средств, реализующих классические и сравнительно новые алгоритмы обработки данных, а также несколько программ моделирования океанических процессов. Часть программ реализована на базе технологий Active-X и Javа, они автоматически вызываются для обработки некоторых типов данных ОИАС. Другие программы представляют собой стандартные Desktop-приложения и должны быть предварительно скачаны из ОИАС самим пользователем.

Рис. 2. Типовая конфигурация окна картографического отображения при работе с ОИАС

В ОИАС действует специальная система распределения прав доступа пользователей к данным, программным и вычислительным ресурсам, призванная привлечь к участию в проекте ОИАС вместе со своими ресурсами большее число специалистов и научных групп. Пользователи, не прошедшие регистрацию, имеют доступ к очень ограниченному подмножеству ресурсов. После прохождения регистрации пользователю назначается одна из четырех базовых «политик доступа».

Политика 1 – предназначена для внешних по отношению к сети ДВО РАН интернет-пользователей, предоставляет доступ только к «открытым» данным.

Политика 2 – предназначена для сотрудников «дружественных» по отношению к ДВО РАН организаций, список таковых устанавливается администратором ОИАС по согласованию с ведущими специалистами, об изменениях в списке информируются владельцы данных (сейчас это институты РАН и вузы Владивостока).

Политика 3 – для сотрудников институтов ДВО РАН.

Политика 4 – для сотрудников ТОИ ДВО РАН.

В каждый момент времени пользователь может проверить «профиль» своей персональной политики. Последний представляет собой список всех информационных слоев ОИАС с указанием уровня доступа к слою на различных уровнях абстракции данных (считывание данных, редактирование данных, просмотр картографических проекций с максимальным разрешением, просмотр Preview-образов), а также электронные адреса владельца данных (см. рис.3).

Рис. 3. Окно просмотра пользователем персонального профиля «политики доступа»

При желании получить расширенный доступ к некоторым данным пользователь может напрямую электронным письмом обратиться к владельцам данных. Для последних в ОИАС реализован специальный интерфейс, позволяющий просматривать статистику обращений к персональным данным и возможность редактирования уровня доступа к ним для зарегистрированных в системе пользователей. Таким образом, базовый профиль персональной политики пользователя со временем может трансформироваться, причем, как правило, в сторону увеличения прав доступа. В отношении программных средств аналитической поддержки ОИАС, придаваемых различным видам данных, реализуется подобная же система разграничения прав доступа.

Специалисты, желающие представить в ОИАС свои информационные или аналитические ресурсы, сопровождают их описанием назначения, описанием условий использования и контактной информацией для личного согласования условий доступа. Кроме этого указывается номер базовой политики, которая должна применяться по отношению к размещаемому ресурсу. Таким образом, условия доступа полностью регламентируются владельцами размещаемых ресурсов, а программное обеспечение ОИАС гарантирует соблюдение установленных правил доступа.

Следует отметить, что ОИАС фактически реализует многие функции управления распределенными ресурсами, присущие GRID-системам. Однако она не является GRID-сиcтемой в строгом смысле, прежде всего, потому, что в ней используются не стандартизированные GRID-сервисы, а специально разрабатываемые нами программные средства. Поэтому на повестке дня стоит вопрос о постепенной адаптации ПО ОИАС к стандартам технологии GRID. Это важно, прежде всего, для обеспечения совместимости ОИАС с отечественными и зарубежными GRID-системами, которые получают все большее распространение в последние годы. Настоящая НИР является удачным поводом начать практические работы по реализации GRID-поддержки в океанологической информационно-аналитической системе Дальневосточного отделения Российской академии наук.

Для этого в ОИАС выделена отдельная подсистема «Мониторинг залива Петра Великого» (см. рис. 4). В этой подсистеме будут целенаправленно собираться и предоставляться участникам настоящей НИР все виды данных удаленных научных экспериментов, выполняемых исполнителями НИР. При этом для организации сбора данных всех удаленных экспериментов, для предоставления оперативного доступа к данным, для обработки данных на высокопроизводительных вычислительных комплексах целенаправленно будут применяться технологии GRID. В настоящее время в этой подсистеме представлены :

·  данные лазерно-интерференционного измерителя микродеформаций земной коры, установленного на Морской экспериментальной станции ДВО РАН «м. Шульца»;

·  данные измерений магнитного и электрического полей Земли, проводимых в ряде стационарных пунктов на территориях Приморского и Хабаровского краев;

·  данные с метеостанций, установленных в ряде географических точек на побережье и островах залива Петра Великого;

·  данные широкополосной сейсмической станции, установленной специалистами Камчатского отделения геофизической службы РАН на МЭС «м. Шульца»;

·  данные гидроакустических и гидрологических экспериментов, выполняемых на акваториях вблизи МЭС м. Шульца научными отрядами ТОИ ДВО РАН;

·  данные видеомониторинга акваторий, осуществляемого в ряде географических точек, в частности на МЭС о. Попова, на МЭС м. Шульца, с крыши здания ТОИ.

Рис. 4. Подсистема «Мониторинг залива Петра Великого» в составе ОИАС

Для первичного приема данных вышеперечисленных экспериментов в составе береговых узлов связи магистральной компьютерной сети Залива Петра Великого организуются локальные GRID-FTP сервера и запускаются сервисы GRID-репликации, осуществляющие, в частности, по заранее настроенному расписанию пересылку вновь поступивших данных в GRID-FTP сервер, развернутый на базе основного GRID-сервера. Такая схема передачи данных очень удобна, например, при работе с подсистемой видеомониторинга. Вследствие нестабильной работы радиоканалов связи магистральной сети залива при использовании стандартной технологии пересылки видеоданных по Интернет каналам возможны перерывы связи, при которых видеоданные пропадают, либо существенным образом искажаются. Это не позволяет реализовать надежные вычислительные методики оценивания количественных параметров состояния морской поверхности на основе анализа видеоизображений и видеозаписей. Пересылка в отложенном режиме с помощью надежных GRID-сервисов позволяет получать максимально качественные видеоданные. Отметим также дополнительные преимущества, обеспечиваемые применением технологии GRID. Политика репликации данных может быть настроена таким образом, что данные на удаленных GRID-FTP серверах не будут удаляться после пересылки в основной GRID-сервер, а сохраняться некоторое время. Это даст возможность при обслуживании запроса на предоставление видеоданных от пользователя, находящегося в экспедиции на МЭС, обнаружить копии (реплики) этих данных на самой МЭС и оперативно предоставить их пользователю.

В настоящее время проводится отладка взаимодействии программного обеспечения ОИАС с базовыми GRID-сервисами, настроенными на основном GRID-сервере и удаленных серверах. Предполагается, что сама ОИАС будет выступать клиентом GRID-сервисов. Для ОИАС будет зарезервировано несколько сертификатов безопасности, регламентирующих условия доступа к GRID-ресурсам, создаваемым в рамках настоящей НИР. Участники НИР, зарегистрированные в ОИАС, будут входить в систему с различными паролями. В зависимости от введенного пароля ОИАС будет активизировать соответствующий сертификат GRID-безопасности, после чего пользователь получит доступ к необходимой совокупности GRID-ресурсов. Фактически на этом этапе реализуется концепция виртуальных организаций: все пользователи ОИАС, работающие с одним сертификатом безопасности, являются участниками одной виртуальной организации. Потенциально один участник НИР может быть участником нескольких виртуальных организаций, работающих над сравнительно самостоятельными частными задачами настоящей НИР. При реализации обслуживания таких пользователей, будут использоваться не обычные сервисы ОИАС, а вызываться соответствующие GRID-сервисы, поддерживаемые ППО Globus Toolkit, Condor и gLite.

Раздел 5. Подключение основных элементов GRID инфраструктуры ДВГУ к управляющему GRID серверу, развёрнутому в ДВО РАН на базе ПО Globus Toolkit / gLite.

Как отмечалось в отчете по предыдущему этапу, GRID инфраструктура базового сегмента ДВГУ будет включать: 1 - рабочие места преподавателей и студентов ДВГУ в учебных корпусах, ведущих исследовательскую деятельность в рамках настоящей НИР, либо использующие ее результаты для научных и образовательных целей; 2 - локальный сегмент базы аналитических приложений, разрабатываемых специалистами ДВГУ – участниками настоящей НИР; 3 - систему поддержки распределенных вычислений на базе вычислительных ресурсов компьютерных классов ИФИТ ДВГУ.

На начальном этапе рассматривался вопрос об организации в ДВГУ базового GRID-сервера, аналогичного серверу, развернутому в ТОИ ДВО РАН. Однако, учитывая, что к настоящему времени ДВГУ и ТОИ находятся в одной научно-образовательной сети г. Владивостока и фактически соединены очень быстродействующими оптоволоконными каналами, от идеи дублирования функций сервера ТОИ было решено отказаться. На 5 рабочих компьютерах преподавателей кафедры физики Земли и планет, а также на 20 компьютерах двух учебных дисплейных классов были развернуты необходимые GRID-компоненты пакетов Globus Toolkit и Condor подобно тому, как это было сделано в ТОИ ДВО РАН. В результате участники НИР из ДВГУ получили возможность доступа с рабочих и учебных компьютеров к GRID-ресурсам НИР (GRID-хранилищам данных и распределенным вычислительным ресурсам) с помощью простых клиентских сервисов типа описанного в разделе 3 настоящего отчета компонента . Кроме этого в ИФИТ ДВГУ фактически была реализована система распределенных вычислений на базе ПО Condor совокупной мощностью в 25 процессоров. Как и в ТОИ ДВО РАН помимо прямого доступа к ресурсам GRID участники НИР из ДВГУ могут получить с помощью океанологической информационно-аналитической системы. ДВО РАН (см. раздел 3 настоящего отчета). Все исполнители НИР из ДВГУ фактически являются участниками одной виртуальной организации, они получают один специально настроенный сертификат безопасности, обеспечивающий доступ к некоторой совокупности массивов экспериментальных данных, накапливаемых в подсистеме «Мониторинг залива Петра Великого».

Для практической отладки технологий использования распределенных GRID-ресурсов с рабочих мест, расположенных в ДВГУ, специально начата реализация ряда ресурсоемких задач, актуальных для выполнения настоящей НИР. Рассмотрим для примера реализацию задачи анализа долговременных записей сигналов микродеформации земной коры, фиксируемых на МЭС м. Шульца лазерными деформографами, с использованием развернутой в ИФИТ ДВГУ Condor-системы распределенных вычислений.

При анализе данных с лазерно-интерференционных измерителей фона микросейсмических колебаний земной коры, представляющих собой оцифрованные записи многоканальных сигналов объемом до нескольких сот Гигабайт, могут возникать задачи, при решении которых целесообразно использовать технологии высокопроизводительных вычислений. Как правило, эти задачи предполагают манипулирование большими объемами данных, пересылка которых в удаленные суперкомпьютерные центры нецелесообразна по соображениям дороговизны, более предпочтительным выглядит вариант с использованием технологии распределенных вычислений. В рамках этой технологии предполагается, что большая задача может быть разделена на некоторое число относительно независимых малых подзадач, которые могут быть решены на «простаивающих» компьютерах локальной сети учреждения. Технологии распределенных вычислений в настоящее время широко распространены в научных и учебных учреждениях за рубежом, в учреждения России в силу разных причин они распространены в меньшей степени. Как отмечалось выше, развернутая в ДВГУ на базе 25 рабочих и учебных компьютеров система Condor является примером системы поддержки распределенных вычислений.

Рассмотрим пример использования Condor-сети для поддержки одной важной задачи, возникающей при работе с данными сейсмоакустических экспериментов. Это задача анализа долговременных колебаний в записях сейсмоакустических сигналов. В настоящее время при регистрации сигнала деформации Земной коры данные записываются в файлы длительностью от нескольких минут до 12 часов. При этом в соответствии с общими ограничениями процедуры спектрального оценивания по данным 12-часовой записи не могут быть оценены вклады в общую энергию сигнала частотных компонент с периодами более 12 часов. Для того чтобы исследовать, например, влияние на фон сейсмических колебаний приливных 12- и 24-часовых колебаний, а также, возможно, еще более низкочастотных колебательных механизмов, необходимо «сшивать» последовательно проведенные кратковременные записи в записи длительностью до нескольких единиц и десятков суток. Процедура «сшивки» усугубляется рядом обстоятельств. Во-первых, в данных могут присутствовать артефакты – выбросы и скачки уровня, которые должны быть нейтрализованы перед сшивкой. Во-вторых, между двумя последовательными записями могут быть пропущенные временные интервалы длительностью до нескольких минут. В-третьих, объемы сшиваемых файлов потенциально могут достигать нескольких сот гигабайт, что затрудняет их последующую обработку.

Для нейтрализации этих обстоятельств каждый файл подвергается предварительной обработке. Для компенсации выбросов разработан алгоритм, основанный на анализе экстремальных точек и статистик сигнала в трех скользящих буферах – буфере запаздывания, буфере неопределенности и буфере опережения. В случае идентификации зоны выброса буфер неопределенности, содержащий выброс, заполняется модельными значениями. При заполнении используются либо линейные экстраполяции буферов запаздывания и опережения в зону неопределенности, либо псевдослучайные экстраполяции на основе авторегрессионных моделей сигналов в буферах опережения и запаздывания. Конкретные параметры процедуры компенсации выбросов передаются программе в командной строке. Отметим, что при соответствующей настройке программа может корректировать не только сами выбросы, но и примыкающие непосредственно к ним участки сигнала, часто имеющие характерные особенности, обусловленные не природой физического процесса, а постепенным выходом системы регистрации в рабочий режим после сбоя. Подобная процедура используется и для компенсации случайных сбросов уровня в записях сейсмоакустических сигналов. Задача заполнения пропущенных фрагментов между файлами решается следующим образом. В программу передается информация о времени окончания предыдущей записи, времени начала следующей записи, и типе алгоритма экстраполяции текущей записи «назад» и «вперед». После устранения локальных артефактов текущей записи программа проводит экстраполяции записи одним из трех алгоритмов: постоянным значением, линейной экстраполяцией «хвостов» записей, авторегрессионной экстраполяцией «хвостов» записей. Впоследствии, при сшивке каждой пары смежных записей, экстраполированные участки конца первой записи и начала второй суммируются с весами, постепенно перераспределяющимися по мере перехода от начальной точки сшивки к конечной. Проблема большого объема результирующего файла решается применением процедуры децимации (прореживания) сшиваемых записей сейсмоакустического сигнала. Как правило, целью процедуры сшивки является исследование низкочастотных колебаний спектра, поэтому высокочастотной частью сигнала в данном случае можно пожертвовать. Перед процедурой децимации записи в заданное число раз M для предотвращения эффекта наложения частот программа проводит низкочастотную фильтрацию с частотой среза , где - частота дискретизации.

В совокупности все применяемые к типовой 12-часовой записи операции предварительной обработки могут занимать время от нескольких десятков секунд до нескольких минут, а совокупное время подготовки многодневной записи может потребовать нескольких часов при выполнении вычислений на одном компьютере. При этом полученный результат может не удовлетворить пользователя, который попытается повторить расчеты с другими параметрами настройки всех алгоритмов. Для ускорения процедуры «сшивки» многодневных файлов в ОИАС нами была реализована ее поддержка технологией распределенных вычислений на базе системы Condor. При этом порядок работы пользователя следующий.

1. Задание интересующего пользователя временного интервала и параметров работы системы сейсмоакустической регистрации (см. рис. 1).

2. Получение информации о записях, удовлетворяющих запросу, с указанием величин временных интервалов между смежными записями (см. рис. 2).

3. Указание параметров настройки всех алгоритмов предобработки записей (см. рис. 3).

4. Запуск процедуры «сшивки» на выполнение в Condor-сети ИФИТ ДВГУ.

5. Получение по указанному пользователем адресу электронной почты ссылки на файл с результатами сшивки, получение результатов, анализ, возможно, повторные расчеты.

Для примера на рис. 4,а приведена осциллограмма сформированной по описанной выше методике 41-дневной записи микродеформаций Земной коры на м. Шульца (начало – 14 ноября 2002 г., окончание - 25 декабря 2002 г.). Анализ низкочастотных компонент сигнала проведен с помощью вейвлетограммы Морле (см. рис. 4,б). Как оказалось, сигналы с «приливными » периодичностями 12 и 24 час присутствуют в сигнале, но их амплитуда существенно меньше выявленных в результате вейвлет-анализа сверхнизкочастотных периодичностей – 1.5 суток, 3.7 суток, 10 суток, 14.5 суток. Еще одна особенность записи – существенная частотная модуляция приливных 24 часовых колебаний, и факт практически полного пропадания 12 часовых колебаний в некоторые периоды.

Рис. 1. Фильтр для выбора данных для последующей сшивки

Рис. 2. Просмотр данных, отобранных для сшивки

Рис. 3. Настройка параметров сшивки

а)

б)

Рис. 4. Анализ 41-дневной записи лазерного деформографа на МЭС м. Шульца: а – осциллограмма сигнала; б – вейвлетограмма Морле.

Вставка в реферат (можно сократить, что-то взять для введения)

В разделе 3 описываются работы по развертыванию в ТОИ ДВО РАН основного GRID-сервера, обеспечивающего управление всеми распределенными информационными, аналитическими и вычислительными ресурсами с использованием стандартизированных GRID-сервисов. Для этого на достаточно мощном компьютере в серверном помещении института были установлены два комплекта т. н. промежуточного программного обеспечения - Globus Toolkit и gLite, которые на сегодняшний день являются основными средствами разработки GRID-приложений. Начато тестировании обоих пакетов, по его итогам в конечном итоге будет принято решение о выборе в качестве основного средства поддержки GRID-сервисов одного из этих пакетов или, возможно, о их совместном использовании. Обсуждаются вопросы реализации взаимодействия с GRID-ресурсами конечных пользователей. Подробно описывается планируемая к реализации базовая технология предоставления GRID-ресурсов участникам настоящей НИР посредством интерфейса океанологической информационно-аналитической системы ДВО РАН.

В разделе 5 описываются работы по организации доступа к GRID-ресурсам настоящей НИР с рабочих мест преподавателей и студентов в основном здании ИФИТ ДВГУ. Для этого в совокупности на 25 рабочих станциях в ИФИТ были установлены необходимые программные компоненты пакетов Globus Toolkit, Condor и gLite, зарегистрирован сертификат безопасности представителя ДВГУ, с помощью которого прописаны права доступа к некоторым информационным и вычислительным ресурсам, которые будут создаваться в рамках настоящей НИР. В порядке отладки технологии использования развернутой в ИФИТ Condor-системы поддержки распределенных вычислений была организована поддержка вычислительно трудоемкой процедуры сшивки регистрируемых лазерными деформографами кратковременных фрагментов сигналов микродеформации Земной коры в многодневные записи с целью последующего анализа сверхнизкочастотных колебаний деформационного поля Земли.