logo search
Поротов Г

Математические способы

Математические методы, применяемые для изучения и прогноза изменчивости геологических объектов, достаточно многочисленны и разнообразны. Объем и задачи учебника не позволяют подробно рассмотреть все методы, да в этом и нет необходимости, поскольку имеется целый ряд учебных и научных материалов, в которых соответствующие вопросы освещены с надлежащей полнотой и детальностью. Задача состоит в том, чтобы дать общее представление об основных направлениях математического решения рассматриваемой проблемы, кратко охарактеризовать наиболее распространенные математические способы изучения изменчивости, указать области их применения и оценить практическую значимость получаемых результатов.

Геологические объекты относятся к так называемым "плохо организованным природным системам", что объясняется сложностью породивших их геологических процессов. Вследствие этого они не поддаются точному количественному описанию и, как правило, взаимосвязь между их параметрами не может быть выражена строгим законом  его обычно заменяет модель, дающая лишь приближенное представление о строении объекта или динамике процесса. На базе геологических моделей создаются различные математические модели, которые можно сгруппировать следующим образом:

 детерминированные модели;

 статистические модели;

 модели геостатистические;

 разностные модели;

 модель на основе стационарных случайных функций;

 модели на основе нестационарных случайных функций.

Детерминированные модели основаны на допущении, что состояние или поведение системы пространственной переменной полностью определяется ее начальным или граничным состоянием. Эти модели полностью игнорируют случайную составляющую изменчивости, представляя ее как закономерную  прямолинейную при обычной интерполяции и экстраполяции фактических данных за пределы точек наблюдения или плавную криволинейную при использовании для этого кубических сплайн-функций. Их используют при построении изображений геологических объектов, но они играют второстепенную роль при математическом анализе изменчивости геолого-промышленных параметров.

Статистические модели относятся к числу наиболее распространенных и давно применяемых в практике геолого-разведочных работ. Они, в свою очередь, могут быть подразделены на одно-, двух- и многомерные. В первом случае решается задача обобщения результатов наблюдения какого-либо одного признака геологического объекта, а в остальных случаях выясняются взаимоотношения между несколькими признаками.

Применение одномерной статистической модели основано на предположении независимости значений изучаемого признака, т.е. полного отсутствия связи между наблюдаемыми его значениями и положением точек наблюдения в геологическом пространстве. В общем случае можно лишь считать, что чем выше степень изменчивости признака, тем полученные результаты ближе к статистической совокупности. Например, опыт показывает, что формулы математической статистики дают достаточно достоверные результаты при изучении изменчивости месторождений золота, платины, алмазов, редких и отчасти цветных металлов, мусковита и др., но оказываются совершенно ненадежными при оценке изменчивости залежей многих осадочных полезных ископаемых.

В практике разведочных работ одномерные статистические модели используются главным образом для численной оценки степени изменчивости геолого-промышленных параметров тел полезных ископаемых и месторождений, а также оценки точности полученных результатов. Важнейшими характеристиками таких моделей являются среднее значение изучаемого параметра xср, дисперсия 2, среднеквадратичное отклонение  и коэффициент вариации V = /хср.

Поскольку у реальных геологических объектов мы имеем дело с сочетанием случайной и закономерной изменчивости, статистические модели, считающие все изменения случайными, дают в таких случаях завышенную оценку изменчивости геолого-промышленных параметров. Во избежание этого необходимо выделять и исключать закономерную составляющую и рассчитывать коэффициент вариации только по случайной составляющей изменчивости.

Следует заметить, что при разведке месторождений чаще всего имеют дело с небольшими по размеру выборками значений изучаемого параметра, в силу чего оценка его среднего значения является случайной величиной и не соответствует математическому ожиданию, которое и представляет собой истинное среднее значение этого параметра для генеральной совокупности  геологического объекта в целом. Поэтому одной из важнейших задач является выбор наилучшего способа вычисления этой оценки и определение степени ее точности.

Известно, что статистические оценки могут быть точечными (они выражаются определенным числом) и интервальными (указывается некоторый интервал значений, в пределах которого находится истинное значение величины при заданной вероятности этого события).

Точечной оценкой истинного среднего является среднеарифметическое значение параметра xср. Интервальная оценка заключается в определении интервала, в котором находится истинное значение хист. Этот интервал выражается соотношением

где t  коэффициент вероятности;   среднеквадратичная случайная погрешность среднего значения, n – количество наблюдений в выборке.

Коэффициент вероятности t зависит от вероятности p совпадения истинного и вычисленного среднего значения параметра. Значения коэффициента t при малом количестве наблюдений берутся из таблиц распределения Стьюдента при количестве степеней свободы k = n – 1 (см. табл.18 в подразделе 3.11), а при большом  из таблиц нормального закона. Практически при количестве наблюдений более 30 можно пользоваться следующими соотношениями, вытекающими из нормального закона распределения:

Вероятность р

0,67

0,82

0,954

0,997

Коэффициент t

1

1,5

2

3

При сравнении изменчивости параметров различной размерности наряду с абсолютной используют относительную величину (коэффициент вариации), обычно выражаемую в процентах:

.

Коэффициент вариации имеет смысл при оценке изменчивости лишь тех геолого-промышленных параметров, для которых важны их средние значения и погрешности определения при разведке. Поэтому статистическая модель с успехом применяется для изучения изменчивости содержания компонентов в рудах и мощностей тел полезных ископаемых, но она непригодна для анализа условий залегания этих тел, их внутреннего строения и изменчивости качества нерудных полезных ископаемых, используемых как порода в целом (известняк, доломит, гипс и др.).

Двухмерные статистические модели позволяют выявить статистические связи между двумя случайными величинами и оценить их силу. Один параметр оруденения определяется по другому известному параметру, если между ними имеется сильная статистическая зависимость. Надежное прогнозирование осуществляется с помощью уравнения линейной регрессии, если коэффициент корреляции превышает 0,87,

.

При использовании уравнения следует учитывать погрешность прогноза, которая зависит от дисперсии прогнозируемой величины, степени связи между величинами и принимаемой доверительной вероятности:

.

Двухмерные статистические модели чаще всего применяют для определения показателей качества полезных ископаемых по косвенным данным (содержания попутных компонентов полезных ископаемых в зависимости от содержания главных компонентов), для обработки результатов контроля геолого-разведочных работ, для уточнения параметров тел полезных ископаемых по данным их отработки и для решения других практических задач.

Многомерные статистические модели используются для прогноза значений какой-либо величины, корреляционно связанной с двумя и более величинами, а также для типизации и группировки геологических объектов (факторный и кластерный анализы).

Помимо рассмотренных выше классических статистических моделей существует еще ряд способов анализа изменчивости, использующих статистические идеи, т.е. независимость значений изучаемого параметра от положения точек наблюдения в пространстве. Бóльшая их часть основана на определении различных соотношений.

Чаще всего используется соотношение промышленных и непромышленных участков в теле полезного ископаемого, что позволяет в определенной мере охарактеризовать степень изменчивости изучаемых параметров. Одним из таких способов является расчет коэффициента рудоносности как отношения суммарных длин или площадей участков полезного ископаемого, отвечающих показателям кондиций, к общей мощности или площади рудоносного горизонта по тем же выработкам. В случае нерудных полезных ископаемых этот показатель называют коэффициентом кондиционности. Общепринятой классификации тел полезных ископаемых по значению таких коэффициентов пока не существует, но на основе имеющихся публикаций можно рекомендовать такую их группировку:

Тела

Коэффициент рудоносности

(кондиционности)

Выдержанные

>0,95

Относительно выдержанные

0,75-0,95

Невыдержанные

0,50-0,75

Весьма невыдержанные

<0,50

Другим способом является определение показателя устойчивости тел полезных ископаемых в проекции на какую-либо плоскость. Показатель представляет собой отношение суммарной площади тела, в пределах которой оно имеет промышленную мощность, к общей площади тела на проекции. По значению показателя устойчивости выделяют четыре группы тел:

Тела

Показатель устойчивости

Устойчивые (непрерывные)

1

Относительно устойчивые (слабо прерывистые)

0,75-1

Неустойчивые (прерывистые)

0,50-0,75

Крайне неустойчивые (сильно прерывистые)

<0,50

Третьим способом следует считать определение контурного модуля, дающего представление о сложности формы тела полезного ископаемого в проекции на какую-либо плоскость. Такой модуль может быть вычислен либо как отношение площади тела к длине его контура, либо как отношение фактической длины контура тела к теоретической длине контура равновеликой простой фигуры.

В первом случае получается величина, характеризующая ширину полосы, примыкающей к контуру тела, причем по мере усложнения формы проекции тела эта ширина уменьшается, что позволяет использовать такой показатель для классификации объектов по изменчивости их формы.

Во втором случае в качестве равновеликой фигуры может быть выбран круг, эллипс или прямоугольник. При этом формулы для вычисления теоретической длины контура таких фигур Lт имеют следующий вид: для круга, эллипса и прямоугольника соответственно

где S  площадь тела; a  отношение большой и малой полуосей эллипса; b  отношение длинной и короткой сторон прямоугольника.

Измерив фактическую длину контура тела L, несложно рассчитать контурный модуль по формуле Kм = L/Lт. По значению контурного модуля можно выделить четыре группы тел:

Номер группы

Форма

Контурный модуль Kм

I

Простая

1,0-1,2

II

Относительно простая

1,2-1,5

III

Сложная

1,5-2,0

IV

Весьма сложная

>2,0

Геостатистические модели основаны на предположении, что результаты наблюдений зависят от расположения пунктов наблюдений. При смещении начального пункта наблюдений результаты измерений меняются, и по этой причине их рассматривают как случайные величины. Однако средний квадрат разности измеренных значений зависит только от расстояния между пунктами наблюдений. Главной характеристикой геостатистических моделей служит вариограмма – функция среднего квадрата разности от расстояния между пунктами наблюдений (шага измерений). В зависимости от способа аппроксимации вариограммы различают несколько видов моделей: сферическая, логарифмическая, показательная и др. [3,10,15].

Разностные модели изменчивости основаны на изучении приращений значений признака между соседними точками наблюдения и имеют целью исключение влияния закономерной составляющей изменчивости для более правильной характеристики случайной изменчивости.

Модель со вторыми разностями впервые была предложена Д.А.Казаковским [9] и нашла широкое практическое применение. Впоследствии на ее базе была разработана видоизмененная модель З.Д.Низгурецкого, а Е.И.Попов применил вторые разности для оценки площадной изменчивости при построении гипсометрических планов.

Метод Д.А.Казаковского разработан для правильных квадратных сетей и позволяет оценивать изменчивость геолого-промышленных параметров, которые могут быть изображены в виде топографических поверхностей, главным образом для изучения изменчивости мощности тел полезных ископаемых. Сначала вычисляют первые разности значений признака по соседним точкам:

а затем находят вторые разности как приращения соседних первых разностей:

Абсолютной мерой изменчивости является показатель сложности топографической поверхности а, который представляет собой среднее значение абсолютной величины вторых разностей:

,

где k  количество вторых разностей.

Относительная изменчивость признака оценивается с помощью показателя изменчивости , который представляет собой выраженное в долях единицы отношение показателя сложности поверхности  к среднему значению изучаемого параметра ср.

Д.А.Казаковский установил экспериментальную зависимость между показателем изменчивости объекта и степенью его изученности: R = n/1000, где n  количество наблюдений изучаемого параметра.

При доверительной вероятности 0,67 показателю разведанности соответствуют следующие значения относительной погрешности статистической оценки среднего значения параметра:

Показатель разведанности, доли единицы

0,29

0,14

0,05

0,02

Относительная погрешность среднего значения, %

2

4

10

15

Вторая разность  является аналогом второй производной функции пространственной переменной и связана с кривизной поведения параметра в пространстве. Если параметр меняется по закону прямой линии, то вторая разность (и вторая производная) равна нулю. Чем больше значения параметра отклоняются от прямой линии, тем больше вторая разность.

Одно из преимуществ модели на основе вторых разностей перед статистическими состоит в том, что она устраняет влияние закономерной изменчивости на степень случайной изменчивости. Когда шаг между пунктами наблюдений мал, вторые разности близки к нулю (рис.18). Это значит, что при малом шаге наблюдений поведение параметра между точками наблюдений практически прямолинейное, следовательно, сеть наблюдений позволяет исчерпывающим образом изучить поведение параметра в пространстве, а прямолинейная интерполяция его значений достаточно точно характеризует поведение параметра между точками наблюдений.

По мере увеличения шага наблюдений, начиная с шага hmin, вторые разности растут, т.е. наблюдается зависимость между вторыми разностями и шагом наблюдений. Начинает сказываться криволинейность в поведении значений параметра. Линейная интерполяция лишь приближенно отражает поведение параметра в пространстве, а значения параметра представляют собой зависимые случайные величины.

После достижения некоторого шага наблюдений hmax вторые разности перестают расти и стабилизируются около предельного значения пр, которое пропорционально коэффициенту вариации V. В данном случае действуют статистические закономерности, значения параметра представляют собой независимые случайные величины, а линейная интерполяция значений между точками наблюдений носит формальный характер и не отражает фактического поведения параметра.

Таким образом, график вторых разностей (рис.18) дает возможность судить о том, насколько надежно разведочная сеть выявляет истинное поведение параметра в пространстве, и позволяет дать некоторые рекомендации по рациональной плотности разведочной сети. Сгущать разведочную сеть до шага, меньшего hmin,, не следует, так как это практически не улучшает достоверность результатов. Желательно иметь плотность разведочной сети в пределах от hmin до hmax, чтобы выявить пространственное поведение параметра. Шаг наблюдений больше hmax не дает надежных сведений о пространственных закономерностях размещения параметра и пригоден лишь для грубой статистической его оценки.

При неравномерной сети наблюдений вместо вторых разностей можно воспользоваться градиентом значений признака между соседними точками наблюдений: gi = (i+1 – i)/hi, где hi  расстояние между соседними точками наблюдения. Далее находят разности соседних градиентов g, определяют сумму абсолютных значений этих разностей и абсолютный показатель изменчивости, аналогичный показателю сложности топографической поверхности Д.А.Казаковского:

,

где k  количество разностей градиентов.

Отнеся абсолютный показатель изменчивости к среднему значению признака, получим индекс изменчивости I = /ср, который может быть рассчитан и при непостоянных расстояниях между выработками.

Модели на основе случайных функций используются для количественного описания изменчивости признака (пространственной переменной) в зависимости от местоположения пунктов наблюдений. В основе модели лежит гипотеза, что значение признака является случайной функцией координат:

.

Случайная функция состоит из двух частей: закономерной m(x) и случайной (x) составляющих. Закономерную часть называют математическим ожиданием случайной функции. Значения случайной функции, получаемые в результате эксперимента, заранее неизвестны и называются ее реализацией. Основными характеристиками случайной функции (x) являются ее математическое ожидание, дисперсия случайной составляющей, автоковариационная и автокорреляционная функции. Математическое ожидание m(х) представляет собой наиболее вероятное значение случайной функции в точкax х. Дисперсия случайной составляющей D выражается формулой

.

Автоковариационная функция K(h) представляет собой среднее произведение соседних отклонений на расстоянии h:

где n  количество наблюдений; m  количество пар соседних отклонений.

Наконец, автокорреляционная функция r(h) представляет собой отношение автоковариационной функции к дисперсии:

r(h) = K(h)/D.

Главная трудность применения случайных функций состоит в том, что результаты геологических наблюдений представляют собой, как правило, лишь одну ее реализацию, и характеристики случайной функции можно найти либо тогда, когда она является стационарной и эргодичной, либо при введении дополнительных гипотез.

Стационарной называют случайную функцию, у которой характеристики не меняются при сдвиге сети наблюдений. Она имеет постоянные математическое ожидание и дисперсию, а корре­ля­ционная функция ее зависит лишь от расстояния h между соседними пунктами наблюдения, т.е. по существу является функцией одного аргумента. Эргодической именуют стационарную случайную функцию, одна реализация которой на большом интервале экви­валентна большому числу реализаций на малом интервале.

Модель на основе стационарной случайной функции получила наибольшее применение в практике геолого-разведочных работ. В этой модели предполагается, что математическое ожидание – величина постоянная, т.е. закономерные изменения признака в пространстве отсутствуют. Тогда математическое ожидание (оценка математического ожидания) равно среднему значению признака: m(х) = ср, а случайные отклонения находят по формуле (x) = (x) – ср. Дисперсия, автоковариационная и автокорреляционная функции вычисляются по формулам, приведенным выше.

Из перечисленных характеристик наибольший интерес представляет автокорреляционная функция r(h), которая показывает степень связи соседних значений признака в зависимости от шага наблюдений h. При h = 0 корреляционная функция r = 1, с увеличением шага наблюдений значение r убывает и стремится к нулю. Предельный шаг наблюдений, при котором коэффициент автокорреляции становится неотличимым от нуля, называется радиусом автокорреляции R, он соответствует максимальному расстоянию, на котором еще обнаруживается взаимосвязь соседних наблюдений.

Теоретическая автокорреляционная функция показана на рис.19, а. Часто наблюдающиеся на практике отклонения реальных графиков от теоретической картины (переход коэффициента автокорреляции в область отрицательных значений, его незатухающая периодичность и др.) указывают на то, что изменчивость изучаемых объектов более сложная и не удовлетворяет требованиям стационарности. На практике автокорреляционная функция вычисляется по дискретным данным и изображается ломаной линией. За радиус автокорреляции обычно принимают тот шаг, при котором линия автокорреляции первый раз пересекает линию абсцисс.

Автокорреляционная функция зависит от направления, в котором изучается изменчивость параметров, поэтому она дает представление об анизотропии изменчивости. Чем больше радиус автокорреляции в данном направлении, тем медленнее меняется значение параметра, тем меньше его изменчивость. Если значение радиуса автокорреляции одинаково по всем направлениям, то геологический объект является изотропным. Радиус автокорреляции характеризует средний размер области влияния одного наблюдения, что используется при обосновании плотности разведочной сети. Для надежного установления поведения параметра между пунктами наблюдений необходимо, чтобы расстояние между ними не превышало двух радиусов, т.е. области влияния соседних наблюдений перекрывались.

Ж.Матерон [15] предложил оценивать изменчивость параметров с помощью вариограммы (h), лежащей в основе геостатистической модели:

Вариограмма является дополнением автоковариационной функции до дисперсии параметра: (h) + K(h) = D (рис.19, б).

На основании корреляционных функций и вариограммы можно решать следующие задачи:

 судить об однородности объекта и наличии закономерностей в пространственном размещении признаков объекта;

 определять предельные расстояния между точками наблюдения, при которых сохраняются связи между соседними значениями параметра и возможна обоснованная интерполяция фактических данных.

Следует заметить, что характеристики стационарной случайной функции определяются достоверно лишь при отсутствии периодической изменчивости с периодами, сопоставимыми с размерами объекта. В противном случае (ритмичность разреза, периодичность появления рудных столбов или разрывных нарушений и т.д.) требуется отыскание периодов и амплитуд периодической изменчивости и вычитание ее из реализации случайной функции, чтобы значения параметра привести к стационарному виду.

Модели на основе нестационарных случайных функций применяют, если математическое ожидание случайной функции непостоянное, что часто наблюдается на практике. Наиболее распространенными среди них являются модель со сглаживанием наблюдений и тренд-модель.

Модель со сглаживанием наблюдений допускает, что на отдельных небольших участках нестационарная случайная функция является стационарной. Наиболее простой вариант этой модели был предложен П.Л.Каллистовым для упорядоченного ряда наблюдений с постоянным шагом по какому-либо направлению. В этом случае для разделения общей изменчивости признака на случайную и закономерную составляющие используется так называемое "скользящее окно", охватывающее несколько соседних точек наблюдения и последовательно перемещаемое на шаг наблюдения. При каждом положении "окна" значения признака по отдельным входящим в него точкам заменяют на их среднеарифметические значения, относимые к середине "окна". По полученным сглаженным значениям можно построить линию, приближенно отражающую закономерную изменчивость признака (рис.20), а разности между фактическими и сглаженными значениями будут характеризовать случайную составляющую изменчивости.

Обычно количество точек в "окне" равно трем или пяти, а операция сглаживания повторяется несколько раз (при последующих операциях вместо исходных данных используют соответствующие сглаженные значения) до получения минимальной дисперсии случайных отклонений между исходными и сглаженными значениями. Рассчитанный на основе этой дисперсии коэффициент вариации дает представление о степени случайной изменчивости изучаемого параметра, а отношение этой дисперсии к общей дисперсии параметра  о доле случайной составляющей в общей изменчивости этого параметра.

Аналогичная методика может быть применена для площадных выборок с правильной сетью наблюдений, например при построении любых планов в изолиниях. При этом за скользящее "окно" обычно принимается элементарная ячейка сети, и после двукратного сглаживания каждому фактическому значению признака будет соответствовать сглаженное, в той или иной мере выражающее закономерную изменчивость. Эти операции повторяются до получения минимальной дисперсии случайной составляющей изменчивости.

Тренд-модель заключается в аппроксимации измеренных значений параметров алгебраической функцией, чаще всего полиномом, вычисляемой по методу наименьших квадратов. Уравнение тренда принимается за приближенную оценку закономерной изменчивости, а отклонения исходных данных от тренда характеризуют случайную изменчивость. В зависимости от числа учитываемых пространственных координат тренд может быть одномерным (линейным), двухмерным (площадным) и трехмерным (объемным). Наилучшим считается тренд, дающий минимальную дисперсию отклонений значений тренда от исходных данных с учетом количества степеней свободы k, равного количеству коэффициентов в алгебраическом выражении тренда:

Тренд-модели достаточно широко используются для отображения закономерной изменчивости мощности, условий залегания и качества тел полезных ископаемых, для прогнозирования значений этих параметров и выявления неоднородности изучаемого объекта.

Завершая обзор математических методов, используемых для анализа и прогноза изменчивости параметров рудных тел, необходимо отметить, что ни один из них не обеспечивает достаточно полного и надежного решения этой задачи. Поэтому для изучения одного и того же параметра приходится применять комплекс математических и геологических методов.