ПРИЛОЖЕНИЕ V:
Анализ практических примеров по системам обмена информацией – обмен гетерогенной информацией между различными источниками
The original report has been provided to the beneficiary in English and Russian. Any discrepancy will be solved wИТh reference to the English version.
Оригинал отчета предоставлен бенефициару на английском и русском языках. Любые разногласия должны разрешаться через обращение к английской версии.
Содержание
Введение…………………………………………………………………….…..3 Проблема разработки: Интеграция гетерогенных данных…………32.1 Проблема и общие пути решения ………………………………..4
2.2 Система на практике: Мультимедийная база данных
для Института Проблем труда………………………………………4
2.2.1 Осуществленная разработка….………………………………….7
2.2.2 Результаты реализации разработки………………………….. ..7
2.3 Последствия для Северо-Западного Проекта ………………….8
Проблема разработки: Обмен данными между источниками………83.1 Проблема и некоторые возможные решения………………………9
3.2 Система на практике: обмен финансовыми данными в
секторе здравоохранения ……………………………………………….9
3.3 Последствия для Северо-Западного Проекта ….……………..…11
ВВЕДЕНИЕ
Обмен информацией может оказаться очень сложной задачей в зависимости от конкретных требований и общих условий среды, в которой он происходит. Количество источников данных, структура обмениваемой информации, поток информации между точками доступа к данным, а также количество и знания персонала могут способствовать усложнению работы с информацией. Это может привести к получению недостоверных данных, непригодных для получения адекватной информации.
Система обмена информацией (ОИ Система) должна справляться со всеми этими трудностями и обеспечивать надежность получаемых данных. Таким образом, по сравнению с типичной системой баз данных, система ОИ должна не только отражать определенный набор данных, но и интегрировать информацию, получаемую из различных источников, которая, как правило, имеет разные форматы и разные типы данных.
Кроме этих высоких требований логического уровня, система ОИ должна быть также стойкой к техническим проблемам, способной закрывать пробелы в технологии, которые могут возникнуть между рабочими точками доступа к данным. Такие пробелы, обычно, возникают в связи с неадекватным оборудованием или ненадежной связью для передачи данных, например такой, как поврежденные телефонные линии или сети.
Данный документ рассматривает основные проблемы интеграции разнородных данных и обмена информацией между удаленными источниками и концентрируется на возможных решениях наиболее типичных проблем обмена информацией. Таким образом, он анализирует главные проблемы, с которыми придется столкнуться в ходе реализации Северо-Западного Проекта тиражирования опыта реформы здравоохранения в части Информационных технологий (ИТ): интеграция неравномерно структурированных данных о проектах, трансформация этих данных в приемлемую информацию и ее дальнейшее распространение на отдаленные регионы.
Данный документ иллюстрирует вышеупомянутые проблемы на примере анализа двух конкретных примеров, один из них – Институт Проблем труда при Техническом Университете Дармштадта, Германия, другой – Финансовая база данных Министерства здравоохранения, Монголия.
2. ПРОБЛЕМА РАЗРАБОТКИ: ИНТЕГРАЦИЯ ГЕТЕРОГЕННЫХ ДАННЫХ
Гетерогенные данные представляют собой типичную проблему для систем ИТ, которые предназначены для работы с модемами, поскольку, с одной стороны, пользователям системы требуется большое количество информации для принятия обоснованных решений, а с другой стороны, такая информация зачастую имеет очень сложные параметры и исходит из различных сфер. Интеграция гетерогенных данных в одну систему является условием для того, чтобы информационная система могла помогать пользователям в их повседневной работе.
2.1 Проблема и общие пути решения
Обычно, данные характеризуются многообразием типов. Это усложняет интеграцию данных в единую систему. Такое разнообразие сложно описать и структурировать. Зачастую, информационные системы решают эти проблемы через сохранение данных в одной системе, не связывая их. В этом случае, сведения интегрируются физически, а не логически. В результате, конечным пользователям приходится сталкиваться с проблемами при поиске необходимой информации. Зачастую, для получения необходимой информации им приходится вести поиск в различных базах данных. Это и неудобно и медленно, и может привести к неэффективному использованию системы. Возможно, что пользователь вообще не сможет собрать нужную информацию. В этом случае, система становится бесполезной, а исходная, главная цель разработки логической интеграции данных остается не достигнутой.
Для решения таких проблем и достижения эффективной интеграции данных, система должна быть сориентирована на те элементы, которые являются общими для всех данных. Например, для интеграции данных о книгах и компьютерных дисках в единую систему, можно разработать базу данных носителей. В такой базе название определенного носителя является указателем, под которым внесена запись, независимо от того, книга это, или CD.
При отсутствии общих элементов для всех данных, разработчик системы должен постараться создать дополнительные элементы, которые сделают логическую интеграцию возможной. В следующем разделе будет описан пример такой разработки.
2.2 Система на практике: Мультимедийная база данных Института проблем труда
Институт Проблем труда Технического Университета Драмштадта является одни из крупнейших институтов Германии, работающих в области эргономики и промышленной медицины.
В нормальном режиме работы институт собирает огромное количество данных. Они включают:
Данные о научных экспериментах.
Технические протоколы
Письменные отчеты
Иллюстрации (фотографии, слайды, рентгенограммы)
Рисунки, планы и карты
Аудио и видеозаписи
Данные о публикациях
Данные о научных статьях и диссертациях, разработанных в институте
Книги и периодические издания
Студенческая библиотека
Научные труды
Данные об оборудовании
Мебель
Техническое оборудование (компьютеры, лаб. оборудование)
Система обслуживания
Инвентарная система
Планирование ресурсов
Бронирование помещений и лабораторий
График осуществления внутренних и внешних проектов
Организации, физические лица, адреса
Профессора, ассистенты, студенты, выпускники, участники семинаров
Другие институты, компании
Лица, с которыми поддерживаются контакты
Адреса
Для улучшения управления и администрирования этими данными в институте было принято решение о внедрении информационной системы, которую можно было бы использовать по всему институту. Такая система называется Мультимедийная база данных Института Проблем труда. Она интегрирует всю информацию, имеющуюся в институте, и делает ее доступной для каждом рабочем месте. Более того, она помогает избежать невостребованности, а значит, и неадекватности данных, которая обычно является прямым последствием их невостребованности.
Осуществление этой программы позволило институту получать информацию, которая прежде была не доступна. Несколько примеров:
Структура персонала
Система моделирует структуру всего персонала, работающего в институте. Например, научный работник является ассистентом одного их профессоров, одновременно работая с семинарскими группами и отдельными студентами. Студенты могут являться членами учебных групп, и одновременно, проводить эксперименты, необходимые для их диссертаций. Другие студенты могут выступать в качестве участников в тех же экспериментах.
Система позволяет вести поиск имен всех студентов, которыми, в течение последних шести месяцев, руководил определенный ассистент, и которые работали над своей диссертацией после участия в эксперименте. Такая информация интересна для института, т. к. позволяет узнать, оказывает ли участие в экспериментах положительное влияние на решение студентов о работе над диссертацией в стенах института. Эта информационная система дает возможность менеджерам получить ясное представление об определенной ситуации, которое можно использовать, как основу для поиска и принятия решений.
Интеграция носителей
Система хранит все носители, имеющиеся в институте, непосредственно в модуле базы данных, или делает ссылку на носители, имеющиеся в хранилище, например, в кладовой рентгеновских снимков. Пользователь может проводить поиск данных о любой конкретной сфере и получит список имеющихся документов, независимо от типа носителя. Такой список будет содержать статьи, книги из библиотеки, картины, слайды, рентгеновские снимки, протоколы экспериментов, диссертации, проекты, а также имена студентов, работающих в данной области, и адреса внешних экспертов. Затем пользователь может начать оценку полученных материалов, которая позволит избежать двойной работы и получить хорошие результаты за более короткий промежуток времени.
Научная библиотека
Через введение в систему сведений о носителях и книгах, а также личных данных о студентах появилась возможность создания библиотечной базы данных. Система может отслеживать взятые в библиотеке книги и автоматически рассылать уведомления о просрочке по адресам студентов.
Планирование распределения лабораторных помещений.
Данные о лабораторных помещениях, о текущих семинарах, проводимых экспериментах и ответственных за них научных работниках, позволяют осуществлять интегрированное планирование ресурсов лабораторных помещений. Таким путем можно более эффективно планировать занятость лабораторий, что приводит к получению более быстрых результатов и снижению затрат.
Таким образом, Система сохраняет:
но интегрирует эти данные, делая их легко доступными. Тем самым система помогает:
В результате, достигается серьезный положительный эффект в отношении конечных результатов, затрат и экономии времени. |
2.2.1 Осуществленная разработка
Основным вопросом на стадии разработки мультимедийной базы данных по проблеме организации труда был способ интеграции всех гетерогенных данных. Изначально, анализ данных показал отсутствие прямых связей с компонентами, составляющими эти данные. Тем не менее, каждый человек имеет имя, а каждая книга или картина – название. Единственно возможным путем интеграции всех этих данных было введение дополнительного компонента, который смог бы выступать в качестве связующего звена между всеми другими компонентами этих данных.
Такой компонент был создан через внедрение фиксированного набора ключевых слов. В этом случае, все записи в базе данных могли быть описаны с помощью присвоения им определенного количества таких слов, независимо от того, являются ли они записью на носителе, адреса, или какого-то организационного аспекта. Набор ключевых слов представляется пользователю в виде списка, из которого он может выбрать столько слов, сколько ему необходимо. Базовый набор ключевых слов не может редактироваться обычным пользователем.
Список ключевых слов был взят из определенного терминологического словаря, специально созданного для промышленной медицины. В последствии этот список был дополнен терминами из области управления проектом и логистики. В конечном счете, этот список уже включал все аспекты, с которыми когда-либо работали или будут работать в институте. Он превратился в список, специально адаптированный к рабочей среде института. Однако, при необходимости, он остается открытым для дальнейшего редактирования. Редактирование проходит в строгом соответствии с установленной процедурой и может осуществляться только специально назначенным персоналом.
2.2.2 Результаты осуществления разработки системы
При поиске конкретной информации пользователь снова использует список ключевых слов. Пользователь выбирает слова, описывающие интересующую его проблему, и запускает поиск. Устройство поиска данных просматривает все компоненты данных, затем выбирает все записи по всем компонентам, которым присвоены соответствующие ключевые слова, и выдает отчет по найденным записям. Если количество полученных данных слишком велико, пользователь может ограничить поиск определенными компонентами или научными областями, не изменяя используемого списка ключевых слов, т. к. эти слова уже практически описали проблему, информацию о которой ищет пользователь.
Следующие рисунки иллюстрируют различие поиска баз данных без использования ключевых слов (слева), и с их использованием (справа):
Запрос о поиске Запрос о поиске Запрос о поиске
|
|
|
|
|
| ||
|
| ||
|
Рис.: Поиск базы данных без ключевых слов Рис.: Поиск базы данных
с ключевыми словами
С помощью этой методики пользователь имеет возможность найти всю имеющуюся информацию в течение одной поисковой операции. Несмотря на то, что исходные данные являются гетерогенным и требуют отдельных поисковых операций для каждого их компонента, несколько операций не потребовалось. Результаты представлены в виде одного общего отчета, а не отдельного отчета по каждому компоненту.
Таким образом, использование ключевых слов представляет собой метод для интеграции гетерогенных данных. Это дает возможность пользователю находить информацию с помощью только одной операции поиска. Ключевые слова основаны на терминологическом словаре соответствующего рабочего окружения. |
2.3 Последствия для Северо-Западного Проекта
Проект по тиражированию в области здравоохранения для северо-западного региона России (Северо-Западный проект) также имеет дело с проблемой гетерогенных данных, поступающих из различных источников. Даже при одинаковом типе данных, они, зачастую, имеют различный формат. Если эти данные должны храниться в единой интегрированной системе, и доступ к ним должен быть получен в течение достаточно короткого промежутка времени, необходимо, чтобы разрабатываемая Система ОИ также должна использовать один или более список ключевых слов.
ПРОБЛЕМА РАЗРАБОТКИ: ОБМЕН ДАННЫМИ МЕЖДУ ИСТОЧНИКАМИВ современных организациях разделение труда, как правило, проблема очень сложная. В имеющихся условиях, пользователь системой ИТ работает с ограниченным набором данных, соответствующим своей области знаний. Затем эти данные получают другие пользователи из прочих сфер деятельности с целью их дальнейшей обработки, укрупнения и консолидации. Консолидированные данные образуют новый набор данных, который снова может быть использован в качестве основы для повседневной работы. Системы ИТ, применяемые для этой цели, представляют собой сетевые системы, дающие возможность всем ее участникам делится одним, общим набором данных.
Такая схема обмена данными является общепринятой для большинства видов деятельности, которые включают управленческие и административные задачи: например, в больницах и на крупных производственных площадках. Если точки доступа к данным разбросаны по нескольким местам: по филиалам или сотрудничающим организациям, такие информационные системы будут обладать сильным общим компонентом для распространения данных, превращаясь, таким образом, в системы ОИ.
3.1 Проблема и некоторые возможные пути ее решения
Каждая система ОИ должна отвечать многим требованиям и условиям. Она должна обладать специальной способностью обеспечения целостности и преемственности данных, даже, если точки доступа к информации находятся на большом отдалении друг от друга, или если доступ к ним накладывается во времени или задерживается из-за больших расстояний и медленной передачи данных.
Необходимо проведение специальных проверок на целостность данных, а также внедрение процедур контроля за частотой их обновления. Современные системы баз данных автоматически поддерживают эти функции до тех пор, пока пользователи имеют постоянное соединение типа «онлайн» между своими компьютерами и базой общего доступа. Если такое соединение «онлайн» не может быть гарантировано, или вообще отсутствует, осуществление надежного обмена данных сильно осложняется. В таких случаях, во избежание дефицита и создания механизма обмена данными по типу «оффлайн» разработчик должен запрограммировать дополнительные процедуры. Осуществление таких дополнительных процедур требует больших усилий и времени для проведения дополнительной разработки, кодирования и испытания.
Для обеспечения целостности данных, при условии надежного и достаточно быстрого соединения, обычно рекомендуется использование встроенных функций баз данных. Если качество соединения не достаточно, необходимо применять функции проверки на целостность данных. В смешанном окружении, при котором некоторые точки доступа к данным имеют надежное соединение, а другие – нет, нужно решить, которое из двух решений следует применить. Также оправданно применение обоих вариантов обмена в одной и той же системе ОИ, т. е. постоянное соединение «онлайн» для надежных точек доступа к данным, и механизм «оффлайн» – для точек с недостаточным доступом.
3.2 Система на практике: Обмен финансовыми данными в секторе здравоохранения
Монголия использует систему ОИ для обмена и контроля данных о финансовой ситуации в учреждениях здравоохранения страны. Эта система называется Финансовая База Данных (ФБД 2001) и является как инструментом управления, так и отчетности для лиц, ответственных за принятие решений в системе здравоохранения. Эта система была разработана и внедрялась в течение г. г. и работает с лета 2001 года.
Монголия – это пост-коммунистическая страна, находящаяся на переходном этапе к рыночной экономике. Столица – Улан-Батор, сравнительно хорошо развита. Однако, регионы находятся на сравнительно низком уровне развития и работают в сложных условиях. В столице информационные соединения через Интернет осуществляются быстро и надежно, однако этого нельзя сказать о регионах, в некоторых из которых их вообще не существует.
Финансовая база данных хранит многочисленные сведения об учреждениях здравоохранения страны, включающих свыше 100 больниц и различных медицинских центров. Эти данные пересылаются из учреждений в региональные департаменты здравоохранения, где они анализируются и укрупняются. Из этих департаментов данные поступают в Министерство здравоохранения, снова анализируются и укрупняются. Копии этих сведений рассылаются в соответствующие страховые компании. Статистическая информация регулярно доставляется из Статистического Управления Монголии в Министерство здравоохранения, что обеспечивает постоянное обновление поступающих новых статистических данных в компьютерные базы медицинских учреждений. Следующий рисунок демонстрирует процессы обмена данными.
![]() |
![]() |
![]() | ![]() | ![]() |

= некомпьютер. мед. учреждение = передача фин. данных на дискете
= передача фин. данных на бумаге

= передача стат. данных на дискете
= компьютер. мед. учреждение
Рис. Обмен финансовыми данными между медицинскими учреждениями и администрацией здравоохранения
В настоящее время медицинские учреждения передают свою информацию в департаменты здравоохранения или в Министерство, используя механизм «оффлайн», т. е. они рассылают дискеты с финансовыми данными. В дальнейшем, для крупнейших больниц столицы планируется внедрение системы связи «онлайн». Для этого уже создана финансовая база данных. Такие данные автоматически доставляются с компьютеризированных бухгалтерских систем, установленных в больницах в Администрацию здравоохранения, где они попадают в финансовую базу данных для проведения анализа и составления отчета.
В небольших больницах и медицинских центрах сельской местности компьютеров нет. Бухгалтерская отчетность осуществляется на бумаге. Однако, эти учреждения также участвуют в системе отчетности. Они получают специальную форму, которая точно указывает необходимый формат предоставления отчетности. Эта форма регулярно заполняется местным бухгалтером и отсылается в соответствующий департамент здравоохранения. Здесь она вводится в компьютер и становится частью электронной системы ОИ.
В Министерстве Финансов имеются укрупненные финансовые данные по всем учреждениям. Затем эти сведения, на регулярной основе, или по специальному запросу могут отсылаться назад, в отделы здравоохранения. Таким образом, регионы также имеют возможность отслеживать свое финансовое состояние и сравнивать его с финансовым состоянием других регионов, или всей страны в целом.
Таким образом, база финансовых данных в Монголии позволяет органам управления здравоохранения, а также самим медицинским учреждениям отслеживать финансовую информацию. Необходимый обмен данными гибко интегрируется и работает в оба направления, с тем, чтобы все учреждения могли участвовать в работе системы, независимо от технических условий, в которых они работают. |
3.3 Последствия для Северо-Западного Проекта
Проект по тиражированию в области здравоохранения для северо-западного региона России (Северо-Западный проект) должен обеспечить управление обменом данными между медицинскими учреждениями региона и Министерством здравоохранения. Электронные соединения для такого обмена не всегда надежны. Таким образом, есть необходимость внедрения механизма обмена данными, который мог бы решить эти проблемы.
Главной целью проекта является распространение на другие регионы предварительно собранной и подготовленной информации, например, через проведение интервью и анализа. Для осуществления этого процесса и обеспечения его эффективности и качества, рекомендуется проводить централизованное обновление данных. Таким образом, все заинтересованные группы и учреждения могли бы участвовать в процессе обмена информацией, независимо от их технических возможностей.
Одним из разумных решений для реализации такого сценария могло бы быть обеспечение доступа в Интернет для регионов, чтобы они могли получать информацию, обращаясь к Вэб серверу, работающему в центре. Однако, распространение информации может осуществляться и без него.







