Щелкановцев Николай Михайлович

Эвристический алгоритм
определения физических закономерностей по результатам
наблюдений.



6. Структура системы обработки информации. Алгоритм определения зависимостей между параметрами исследуемого явления.


Результаты двух предыдущих разделов позволяют определить состав, структуру и алгоритмы системы обработки информации, с помощью которой могут быть установлены зависимости между параметрами изучаемого физического явления по результатам наблюдений.

Представим результаты измерений параметров исследуемого явления в виде прямоугольной N * k таблицы  ( матрицы )  A (  y *) измеренных величин.

foto

Каждый элемент этой матрицы yij* ( i =1,..., N;  j =1,...,  k ) представляет собой измеренное в общем случае с ошибкой значение реализовавшегося в i-том эксперименте j-того наблюдаемого параметра yi,j .

Один из вариантов cтруктурной схемы системы определения зависимостей на основании результатов экспериментов приведен на Рисунке 1. В состав системы входят: комлекс наблюдения исследуемого явления, база данных для накопления и хранения результатов измерений, база знаний для размещения результатов анализа и ряд алгоритмов анализа данных. В том числе алгоритм проверки существования и определения числа зависимостей между наблюдаемыми параметрами и алгоритм оценки параметров связей между наблюдаемыми параметрами y1 ,.., yk .

Проверка существования зависимостей между параметрами сводится к проверкам статистическох гипотез о равенстве нулю значений определителей  d e t D p - l  ( y )    (  l = 0 , 1 ,..., L , L+1 ) матриц

D p-l  ( y )  =  matrix (  d p-l,i,j ( yi1, yi2 , ... , yik) )
( i = 1 , ... , p ; j = 1 , ... , p ; l = 0 , 1 , . .. , L , L = 1 )

на основании информации, представленной в виде таблицы A ( y*) (8) , или гипотез о принадлежности к одной генеральной совокупности значений определителей : соответствующих исходным матрицам

D p-l  ( y* )  =  matrix ( d p-l,i,j  ( y*i1, y* i2 , ... , y*ik ) )
( i = 1 , ... , p ; j = 1 , ... , p ; l = 0 , 1 , . .. , L , L = 1 )

и матрицам, полученным из них путем принудительного разрушения причинно-следственных связей между элементами их столбцов. В процессе этих проверок определяется также число существующих зависимостей L между наблюдаемыми величинами и формируются неоднородные уравнения (7), которым удовлетворяют интересующие нас параметры исследуемых зависимостей.
       Кроме упомянутых, в состав системы целесообразно включить комплекс алгоритмов анализа возможностей снижения размерности задачи на двух уровнях: на уровне матрицы наблюдений A и на уровне матрицы D. Эти алгоритмы призваны устранить столбцы матрицы A, не участвующие в формировании линейно зависимых столбцов матрицы D, и матрицы D, не входящие в число таких столбцов, и снизить тем самым размерность задачи. На завершающей стадии анализа, если в поле зрения исследователя оказалось несколько зависимостей, целесообразно провести декомпозицию ситуации , выделив в виде отдельной задачи анализ каждой мз зависимостей.

Если степень аппроксимирующего полинома в процессе анализа будет выбрана большей, чем это необходимо для представления исследуемого соотношения, среди решений появяться "вторичные" завмсимости. Например, при действительной связи между параметрами  x1 = x2 + x3  и степени полинома равной двум среди решений, кроме основного, появится "вторичное"  x12 = ( x2 +  x3 )2 . Такие решения должны быть идентифицированы с основными и удалены, а степень полинома соответствующим образом скорректирована.

Обратим внимание на следующее обстоятельство: невыполнение условий detDp-l ( y ) = 0, проверка которых была осуществлена по информации, представленной в виде матрицы (8), еще не означает, что параметры x1 ,..., xn не связаны функционально между собой. Такое событие может наступить и при наличии зависимости, если степень аппроксимирующего полинома (3) недостаточна для представления исследуемого соотношения, а также в случае, когда не все параметры исследуемого явления наблюдаются.

foto

В этой ситуации для нахождения решения необходимо сначала повышать степень полинома , а если это не приводит к успеху, увеличивать число наблюдаемых параметров изучаемого явления , используя для принятия решения о включении в состав измерительного комплекса дополнительных измерителей экспертные оценки состава вектора параметров, характеризующих изучаемое явление

Для разработки алгоритмов проверки упомянутых выше гипотез необходимо знать условные законы распределения определителей матриц D   p-l  (  y* ).

Вид этих законов зависит от ряда факторов: числа наблюдаемых параметров, степени разложения функции отклика (3), числа экспериментов, уровня и законов распределения ошибок измерения, распределения наблюдаемых параметров. Исследование их в общем случае представляет собой достаточно сложную задачу.

В таблице 1 и на рисунке 2 приведены результаты такого исследования для частного случая: полученные методом Монте-Карло [10] при числе циклов моделирования 1000 гистограммы распределения определителя матрицы D размерности (15х15), что соответствуют числу наблюдаемых параметров равному четырем и второй степени аппроксимирующего полинома, количеству экспериментов N равному 15, аддитивных ошибках измерения уровня 5% от наблюдаемых величин и равномерном распределении измеряемых параметров.

foto

Кривая N 1 на рис. 2 и колонка N 1 таблицы 1 соответствуют случаю, когда функциональная зависимость между элементами столбцов матрицы А и, следовательно, линейная зависимость между элементами столбцов матрицы D существует. Кривые  N  2, 3, 4 и соответствующие им колонки  N  2, 3, 4 таблицы относятся к ситуациям, когда такие связи принудительно разрушены.

Результаты моделирования показывают, что графики плотности распределения значений определителя detD имеют колоколообразную форму с сильно вытянутыми в обеих направлениях вдоль оси X ветвями. Разрушение связей между элементами матриц A и D заметно изменяют вид законов распределения определителя матрицы D. Такое изменение более существенно при разрушении связей между элементами матрицы A (кривая N 4 существенно отличается от кривой N 1 ). Кривые N 2 и 3 , соответствующие случаю разрыва связей между элементами столбцов матрицы D, отличаются от кривой N 1 в меньшей степени.

Приведенные результаты моделирования позволяют сделать вывод о возможности создания основанного на предложенных принципах работоспособного алгоритма определения физических закономерностей по результатам наблюдений.