региональные базы геолого-геофизических данных как
составная часть геоинформационных систем
В.
(Иркутский государственный технический университет, г. Иркутск)
Рассмотрена проблема хранения массовых геолого-геофизических данных в геоинформационных системах, предложена технология создания региональных и целевых баз данных и ее включение в программный комплекс GIA («Геоинформационный анализ»). Программный комплекс GIA включает в себя «оболочку» и функциональные программные модули, динамически вызываемые оболочкой для гибкого построения графов обработки данных. Оболочка комплекса построена в соответствии с такими требованиями к современному программному обеспечению, как событийная ориентированность, объектная ориентированности и унифицированный графический интерфейс. Набор функциональных модулей может расширяться с одновременным включением в оболочку новых пунктов меню. Такая структура программного комплекса, а также ориентация на хранение информации по исследуемой площади в реляционной базе данных, позволяют оперативно конфигурировать GIA для решения конкретного круга задач. В настоящее время GIA включает в себя программные средства для создания (или выбора ранее созданной) локальной базы данных, для ввода в эту базу картографической информации и массовых геофизических данных по конкретной площади, для разделения полей, их интерполяции и построения карт с нанесением на них выбранных картографических объектов, для статистического анализа данных (одномерный, факторный, корреляционно-регрессионный) и прогнозирования геологических объектов и явлений (метод аналогий и системно-модельный подход, основывающийся на формализации знаний). Таким образом, включение в GIA программных модулей для создания и использования региональных баз данных (РБД) позволяет объединить в одном программном комплексе технологии создания региональных и целевых баз и их последующего использования для решения прогнозных задач.
Геология стала одной из первых сфер научно-практической деятельности, в которой стали применяться математические методы и компьютерные технологии. В 60 – 70-х годах геоинформационные системы (ГИС) используют как инструмент для графического отображения координатно-привязанных данных и, соответственно, для печати карт. Дальнейшее развитие ГИС пошло по двум направлениям: первое – эффективный ввод и хранение пространственных данных (построение карт), второе направление – разработка процедур и функций для анализа данных в геоинформационных системах. Применяемые в геологии и геофизике современные геоинформационные системы позволяют хранить и выполнять разнообразные преобразования географических координат, дают пользователю удобный механизм выявления закономерностей пространственного размещения геологических объектов.
При анализе существующих ГИС можно сделать вывод, что применяющиеся на практике геоинформационные системы позволяют организовать хранение картографической информации, а также использовать ее для построения карт и выявления сравнительно простых пространственных закономерностей. В рамках ГИС хранится также семантическая информация, привязанная к картографическим объектам – их основные характеристики в табличной форме. Однако, проблема хранения массовых геолого-геофизических данных, т. е. информации второго уровня обобщения (по классификации, приведенной в табл. 1), ими не решается. Между тем, для получения таких данных, как значения ускорения силы тяжести в редукции Буге (в гравиразведке), аномальные значения магнитного поля (в магниторазведке), значения вертикального времени прохождения волн, отраженных от целевых границ (в сейсморазведке) и т. п., ежегодно проводятся геолого-геофизические съемки разных масштабов и другие дорогостоящие полевые работы. Эти массовые данные являются основными для выделения различных геологических объектов: структур осадочного чехла, зон улучшенных коллекторских свойств, разнообразных интрузий, тектонических нарушений и др. Соответственно возникают трудности при организации тематических работ с целью обобщения и комплексного анализа данных, накопленных по поисково-разведочным площадям. Между тем, технология создания региональных и целевых баз данных была предложена уже в 80-х годах прошедшего столетия [1, 2, 3]. Эта технология в полной мере использовалась в объединениях «Иркутскгеофизика» и «Главтюменьгеология» и в 90-х годах позволила «спасти» массовые геофизические данные по обширным территориям. В настоящее время, в связи с возобновлением в РФ геологоразведочных работ, есть смысл вновь вернуться к созданию и использованию региональных баз геолого-геофизических данных (РБД), причем с учетом современных технических возможностей.
Таблица 1
Классификация геолого-геофизических данных по уровням обобщения информации
Исходные данные (классификация по уровням обобщения) | Цели и основные задачи обработки и анализа данных | Методы обработки и анализа данных |
1. Первичные данные – результаты геолого-геофизических измерений | Минимизация влияния негеологических факторов: рельефа местности, геометрии системы наблюдений и т. д. | Стандартная обработка данных конкретного геолого-геофизического метода. |
2. Данные, полученные в результате стандартной обработки первичных данных, приводящие к минимизации влияния негеологических факторов – поля различных геохимических, геологических, геофизических признаков | 2.1. Формирование «признакового пространства»: интерполяция в узлы квадратной сети, расчет в скользящих окнах характеристик полей для узлов сети; построение карт. | Методы интерполяции и разделения полей, расчета их статистик и других характеристик в скользящих окнах, построения карт. |
2.2. Статистический анализ данных с целью выявления связей и других закономерностей.
| Одномерный, факторный, корреляционно-регрессионный анализ и пр. | |
2.3. Прогнозирование и выделение локальных геологических объектов (интрузий, структур, тектонических нарушений, зон улучшенных коллекторских свойств, проявлений вторичных геологических процессов и т. п.) и оценка их параметров. | Распознавание образов, построение карт вероятностей обнаружения целевых объектов, решение «прямых» и «обратных» задач – переход от априорных оценок параметров объектов к апостериорным оценкам. | |
3. Выделенные геологические объекты, формализовано описываемые как картографические – картографические и параметрические данные, полученные в результате интерпретации информации предыдущего уровня обобщения | Прогнозирование геосистем: рудных полей, нефтегазовых провинций и полей, месторождений и залежей, площадей, пригодных для строительства крупных сооружений | Расчет вторичных картографических признаков для узлов квадратной сети. Формализация знаний: выбор способа квантования признаков и для каждой градации оценка вероятностей попадания объектов разных классов. Квантование признаков и расчет апостериорных вероятностей для узлов сети. Построение карт вероятностей обнаружения целевых объектов. |
Предлагаемая технология создания региональных и целевых баз данных иллюстрируется рисунком 1. Эта технология позволяет создавать РБД по миллионным листам (как на рисунке), геолого-структурным зонам (таким, например, как Байкальская рифтовая зона), либо по территориям, выделенным с учетом прагматических соображений (площади лицензионного отвода и т. п.). Важное методологическое значение имеют понятия локальных методных и целевых баз данных.
Локальные методные базы данных всегда существуют при обработке материалов каждого геофизического метода после завершения полевых работ. Эта обработка, по-существу, заключается в цепочке переходов от файлов одних типов к файлам других типов [3]. Типизация данных на этапе их обработки позволяет унифицировать структуры и состав типовых файлов для каждого геолого-геофизического метода, а также выбрать те файлы, которые подлежат долговременному хранению в региональных базах. Например, в гравиразведке долговременному хранению подлежат файлы типа A [4]. В их записях содержатся координаты пунктов X, Y, H, аномальные значения ускорения силы тяжести GA и значения поправки за рельеф GT при определенной плотности промежуточного слоя. В сейсморазведке обычно хранят для каждой общей глубинной точки ее координаты X, Y и значения вертикального времени прохождения волн, отраженных от целевых границ (например, TA, TM2, TF и т. п.). Кроме временных параметров, могут храниться абсолютные отметки целевых границ, а также кинематические и динамические параметры слоев принятой модели. Подобная унификация позволяет, во-первых, конкретизировать состав записей в файлах, подлежащих долговременному хранению, а во-вторых, при последующем создании локальных целевых баз данных указывать идентификаторы отбираемых признаков. 
Рис. 1. Принципиальная схема создания и использования региональных баз данных
Локальные целевые базы данных создаются для обобщения и анализа геолого-геофизических материалов, накопленных по тем или иным площадям. Методы анализа информации второго и третьего уровней обобщения, перечисленные в таблице 1, реализованы в рамках программного комплекса GIA («Геоинформационный анализ»). В этот же комплекс было встроено и программное обеспечение создания региональных и целевых баз данных. Оно, во-первых, позволяет включать новые фрагменты данных в РБД, а, во-вторых, создавать по запросам целевые базы данных для их последующего использования при решении задач комплексного анализа имеющихся материалов и геологического прогнозирования. Следовательно, программное обеспечение создания региональных и целевых баз данных можно рассматривать как составную часть общего программного обеспечения геолого-геофизических исследований (Рис. 2).

Рис. 2. Взаимодействие общего программного обеспечения геолого-геофизических исследований (1) и методо-ориентированных систем программ (2, 3, 4, …)
Программный комплекс GIA включает в себя «оболочку» и функциональные программные модули, динамически вызываемые оболочкой для гибкого построения графов обработки данных. Оболочка комплекса построена в соответствии с такими требованиями к современному программному обеспечению, как событийная ориентированность, объектная ориентированности и унифицированный графический интерфейс. Набор функциональных модулей может расширяться с одновременным включением в оболочку новых пунктов меню. Такая структура программного комплекса, а также ориентация на хранение информации по исследуемой площади в реляционной базе данных, позволяют оперативно конфигурировать GIA для решения конкретного круга задач. В настоящее время GIA включает в себя программные средства для создания (или выбора ранее созданной) локальной базы данных, для ввода в эту базу картографической информации и массовых геофизических данных по конкретной площади, для разделения полей, их интерполяции и построения карт с нанесением на них выбранных картографических объектов, для статистического анализа данных (одномерный, факторный, корреляционно-регрессионный) и прогнозирования геологических объектов и явлений (метод аналогий и системно-модельный подход, основывающийся на формализации знаний) [3, 4]. Таким образом, включение в GIA программных модулей для создания и использования РБД позволяет объединить в одном программном комплексе технологии создания региональных и целевых баз и их последующего использования для решения прогнозных задач.
Включение файла локальной методной базы данных в РБД сводится к созданию его поискового образа, а также к передаче самого файла. Такая передача заключается в импорте файла из форматов локальной базы и его записи на один из томов соответствующей РБД, например, на том P48001, P48002 и т. п. Технически том может быть представлен диском CD или DVD. При включении файла в региональную базу данных ему дается новое имя, например, ZRP05003 – данные, относящиеся к региональной базе ZRP (образно говоря, стеллаж для размещения новой книги), полученные в 2005 году (полка) и помеченные номером 003 (номер книги на полке). Назначение такого подхода – сохранить информацию, полученную в течение года геологическими и геофизическими партиями, работавшими в пределах данного листа масштаба 1:1000000. Каждая база данных при таком подходе имеет имя, состоящее из трех символов: P48, BRZ, ZRP и т. п.
Одновременно с включением файла в РБД в файл поисковых образов (в нашем примере в файл ZRP. RBD) добавляется поисковый образ нового файла – по аналогии с карточкой, заполняемой при поступлении новой книги в библиотеку. Диалоговое окно для формирования поискового образа файла показано на рисунке 3.

Рис. 3. Диалоговое окно для формирования поискового образа файла РБД
При создании поискового образа файла указываются его основные характеристики: имя файла в РБД; серийный номер тома; номер редакции файла (зарезервированное поле); обозначение вида сети, по которой организованы данные (произвольная, прямоугольная и т. п.); «ключи» к координатам в записях файла; граничные координаты площади, к которой относятся данные файла; признак актуальности данных; дескрипторы, например, D=12000,100 – данные гравиразведки (12000) масштаба 1:100
Файл поисковых образов в дальнейшем позволяет отобрать из РБД все файлы определенного содержания, имеющие определенную привязку по месту и времени. При создании целевой базы данных вид диалогового окна изменится (Рис.4).

Рис. 4. Диалоговое окно для формирования целевой базы данных
В этом диалоговом окне выбирается контур целевой площади, ограничения на виды сетей (GRID), дескрипторы D, определяющие в основном геолого-геофизические методы и масштабы исследований, а также идентификаторы отбираемых признаков (P) и новые «ключи» к координатам (CX, CY).
При создании целевой базы данных сначала «просматриваются» поисковые образы файлов, относящихся к данной РБД. Поисковые образы, соответствующие запросу, отбираются, и после этого начинается «просмотр» самих файлов региональной базы. Сначала координаты в каждой записи файла РБД пересчитываются к единой системе координат с учетом новых «ключей» CX, CY. Затем точка, соответствующая записи, проверяется на попадание в пределы целевой площади. Из отобранных записей берутся координаты и указанные в запросе элементы данных (признаки–поля). Так формируется файл целевой базы данных по одному геолого-геофизическому методу. Этот файл может содержать данные многолетних исследований, выполненных на заданной площади. При этом координаты в записях, извлеченных из разных файлов РБД, будут приведены к единой системе. Для формирования файлов целевой базы данных по нескольким геолого-геофизическим методам необходимо несколько раз воспользоваться диалоговым окном, приведенным на рисунке 4.
После создания целевой базы для анализа данных могут быть применены методы, перечисленные в таблице 1 для второго и третьего уровней обобщения информации. Таким образом, обеспечивается концептуальное единство общего программного обеспечения геолого-геофизических исследований (см. рис. 3) – в нем интегрируются методы хранения и анализа данных с конечной целью решения прогнозных задач.
Литература
1. Ломтадзе формирования баз геолого-геофизических данных. М.: Изв. вузов, Геология и разведка, № 6, 1985.
2. , , Бородаченко файловых баз данных (ФБД) и ФОРТРАН-ФБД. Материалы мирового центра данных Б. М.: АН СССР, 19с.
3. Ломтадзе и информационное обеспечение геофизических исследований. - М.: Недра. -199с.
4. Марченко -машинные методы геологического прогнозирования. - М.: Недра. -198с.


