
1. Введение. Постановка задачи
Многие проблемы, связанные с исследованием явлений окружающей нас действительности, сводятся к задаче определения неизвестных функциональных зависимостей между характеризующими эти явления величинами. Такие зависимости представляют собой физические закономерности ( законы природы ), описывающие происходящие в окружающей нас действительности процессы, если мы изучаем природные явления [1], или математические модели в случае исследования различного рода естественных или искусственно созданных систем.
Интересующие нас функциональные зависимости могут быть определены в результате анализа данных, полученных при проведении специальных экспериментов, или в процессе наблюдения изучаемых явлений в ходе их естественного развития.
Существует два подхода [3] к решению задачи исследования зависимостей. При первом, характерном для регрессионного анализа, переменные разделяются на две группы : результирующие (прогнозируемые) и объясняющие (предикторные). Затем при соответствующих допущениях определяются зависимости первых от вторых. Неудобство такого подхода обусловлено тем, что для подобного разделения часто нет достаточных оснований. Особенно тогда, когда исследуются слабо изученные объекты. В этом случае к числу прогнозируемых переменных случайно могут быть отнесены такие, которые на самом деле не зависят от остальных. Полученные при этом результаты анализа не будут иметь никакой ценности: они не могут быть интерпретированы, так как за ними нет никакой существующей зависимости.
Более привлекательным в свете сказанного представляется подход, принятый в факторном анализе, когда все переменные считаются равноценными [4]. Но модель классического факторного анализа, основанная на представлении величин в виде линейной комбинации факторов с соответствующими факторными нагрузками, предоставляет исследователю значительно меньше возможностей, чем более гибкие нелинейные модели регрессионного анализа.
В настоящей работе предпринята попытка использовать достоинства упомянутых подходов и отказаться от некоторых допущений, принятых при решении задачи исследования зависимостей в [3] : разделения переменных на объясняющие и результирующие, а также предположений о том, что число характеризующих исследуемое явление параметров, число зависимостей, связывающих между собой наблюдаемые величины, и степень алгебраического полинома,определяющего вид функции регрессии, известны.
Прежде чем приступить к формулировке задачи сделаем одно замечание. Зависимости между параметрами, характеризующими явления окружающей нас действительности, могут иметь вероятностный или детерминированный характер. В случае вероятностной зависимости при осуществлении события, заключающегося в том, что часть параметров принимает какое-то определенное значение, величины остальных параметров могут быть указаны лишь с некоторой вероятностью. При детерминированной - заданием части параметров значения остальных определяются однозначно.
В приведенной ниже формулировке задачи исследуемые зависимости между параметрами будут считаться детерминированными. Отметим, что такие зависимости характерны для многих фундаментальных законов природы. Со случайными связями параметров мы часто сталкиваемся только потому, что при исследованиях в силу различных обстоятельств не учитываем факторов, влияющих на изучаемое явление и имеющих случайный характер. Измерение этих факторов и включение их в состав вектора наблюдаемых величин сводит задачу к случаю детерминированных зависимостей.
Введем в рассмотрение два вектора : вектор наблюдаемых в экспериментах величин, представляющих собой измеряемые параметры исследуемого явления
Состав вектора Yk определяется структурой измерительного комплекса, который фиксирует в общем случае с ошибками реализовавшиеся в экспериментах параметры исследуемого явления, то есть компоненты вектора Xn.
Приступая к изучению явления, мы, как правило, не знаем какими параметрами это явление характеризуется [1]. Нам обычно не известна размерность n вектора параметров Xn. Часто не бывает ясна даже физическая сущность всех величин, входящих в его состав. Поэтому вектор наблюдаемых параметров Yk по своему составу, как правило, отличается от вектора параметров Xn.
Эти отличия могут быть сведены к двум случаям. В первом среди составляющих вектора наблюдаемых параметров Yk могут присутствовать такие, которые не имеют аналога среди компонент вектора Xn. Они не являются измеренными значениями параметров исследуемого явления. В состав вектора Yk они оказываются включенными случайно из-за недостаточности знаний об изучаемом явлении и выступают в роли мешающих факторов (помех), увеличивая размерность задачи и повышая случайные ошибки результатов определения зависимостей между параметрами Xn.
Во втором - в составе вектора Yk могут отсутствовать компоненты, соответствующие некоторым составляющим вектора Xn . Так случается, когда часть определяющих физическое явление параметров также из-за недостаточности знаний об изучаемом явлении не наблюдается. В этой ситуации закономерность, связывающая между собой параметры изучаемого явления, найдена быть не может. Чтобы ее можно было определить, необходимо расширить возможности системы наблюдения исследуемого явления, включив в ее состав дополнительные измерительные устройства. Такие и столько, чтобы все характеризующие явление параметры были бы измерены. Эта задача может быть решена, по-видимому, только методом проб и ошибок с привлечением экспертных оценок состава вектора Xn
Задачу определения неизвестных функциональных зависимостей между параметрами изучаемого явления сформулируем следующим образом : по результатам измерений характеризующих изучаемое явление параметров, представленных величинами ![]() где N - число наблюдений (экспериментов), k - число измеряемых в каждом наблюдении величин, а Δ yi j- ошибки измерения, построить такую неявно заданную векторнозначную функцию ![]() которая наилучшим в определенном смысле образом восстанавливала бы неизвестные зависимости между параметрами x1 , x2 , . . , xn исследуемого явления. |
В приведенной формулировке наблюдаемые параметры не разделяются на объясняющие и результирующие. Интересующая нас зависимость (1) представлена в виде неявно заданной векторнозначной функции составляющих вектора Xn. Такое представление позволяет учесть при анализе все зависимости, которыми, возможно, связаны между собой различные наблюдаемые величины, входящие в состав Xn . Число этих зависимостей может равняться нулю, что соответствует случаю отсутствия связей между параметрами, единице, двум и т.д. Обозначим его через L. Число L в рассматриваемой задаче будем считать неизвестным.