Методы путевого анализа и их применение к системам одновременных уравнений
СОДЕРЖАНИЕ: Метод путевого анализа предложен американским генетиком Райтом. Этот метод применяется в биометрии, построении социологических причинных моделей и экономике. Процедура Саймона-Блейлока - формальный прием о ложной корреляции и каузальной упорядоченности.Содержание
Введение
Методы путевого анализа и их применение к системам одновременных уравнений
1.Метод Райта путевого анализа
2. Основная теорема путевого анализа
3. Процедура Саймона-Блейлока
Заключение
Список используемой литературы
Введение
Методы корреляций и регрессий создавались как методы описания совместных изменений двух и более переменных. Совместные изменения переменных могут не означать наличия причинных связей между ними. Потребность в причинном объяснении корреляции привела американского генетика С. Райта к созданию метода путевого анализа (1910—1920) как одного из разновидностей структурного моделирования. Путевой анализ основан на изучении всей структуры причинных связей между переменными, т. е. на построении графа связей и изоморфной ему рекурсивной системы уравнений. Его основным положением является то, что оценки стандартизированных коэффициентов рекурсивной системы уравнений, которые интерпретируются как коэффициенты влияния (путевые коэффициенты), рассчитываются на основе коэффициентов парной корреляции. Это позволяет проанализировать структуру корреляционной связи с точки зрения причинности. Каждый коэффициент парной корреляции рассматривается как мера полной связи двух переменных.
Путевой анализ позволяет разложить величину этого коэффициента на четыре компоненты.
Таким образом, путевой анализ С. Райта, так же как и структурные модели, позволил прояснить проблему ложной корреляции, которой занимались многие видные статистики, начиная с К. Пирсона (1857-1936).
Методы путевого анализа и их применение к системам одновременных уравнений
1. Метод Райта путевого анализа
Метод путевого анализа (или путевых коэффициентов) предложен в 20-х гг. XX в. американским генетиком С. Райтом. Сегодня этот метод нашел широкое применение в биометрии построении социологических причинных моделей, но все еще остается мало знакомым экономистам. Основные положения метода сводятся к следующему. Пусть x1 , x2 , ...., xp — случайные переменные, измеренные в соответствующих единицах. Основным предположением метода является предположение об аддитивности и линейности связей между переменными. (1)
Здесь xui — символ неизмеримого имплицитного фактора ui , действующего на хi , и обозначающего действие на хi всех переменных, не включенных во множество {xj }; gij - некоторые константы; giu — коэффициент влияния xui на xi .
Будем называть xj j-йпричиной, а хi — следствием комбинированного действия всех m-причин. Использование линейных зависимостей между всеми переменными делает р-анализ специальным случаем регрессионного анализа, в котором коэффициенты регрессии интерпретируются в терминах причинно-следственных отношений.
Соотношение (1) можно записать также в виде (2)
где xj – среднее значение j-й переменной
Без потери общности можно допустить, что xiu имеет нулевое среднее и единичную дисперсию. В стандартизованной форме уравнение (2) будет иметь вид: (3)
где, Sj – стандартное отклонение j-й переменной.
Тогда pij = (sj /si )cij .
Коэффициенты cij являются специальным типом частных коэффициентов регрессии. Коэффициент pij является стандартизованным коэффициентом p-регрессии. Будем называть pij коэффициентом влияния (согласно С. Райту), понимая при этом, что pij есть числовая величина, которая измеряет долю стандартного отклонения i-й эндогенной переменной (следствия) с соответствующим знаком, обусловленную влиянием j-й экзогенной переменной (причины) в том смысле, что если произвести измерение этого влияния при изменении j-й переменной в тех же условиях, что и в данных наблюдениях и при неизменных прочих условиях (включая постоянное воздействие фактора xij ), то полученный результат будет равен pij . (4)
В формуле (4) si .12…( j -1)( j +1)… p . u показывает стандартное отклонение i-й переменной с учетом влияния переменных от, 1 до (j-1) и от (j+1) до p при постоянном влиянии фактора u.
Из данного определения следует, что квадрат p-коэффициента показывает, какая часть общей вариации следствия определяется j-й причиной. Эта величина представляет собой коэффициент детерминации: dxij = p2 ij .
Относительно имплицитных переменных xui заметим, что фактор xui , представляющий постоянное воздействие на следствие xi переменных, не включенных явным образом в модель, считается некоррелированным ни с другими аналогичными факторами xu , ни с экзогенными переменными (входами или причинами) системы xj .
Входом системы называют переменную xj , при которой ее вариация целиком и полностью определяется фактором xuj , т. е. pjuj = 1, djuj = 1. Входы системы могут быть коррелированы попарно.
Простейшим случаем является модель звена линейной причинной цепи, т. е. детерминации следствия y, всего лишь одной переменной — причиной x. Уравнение этой модели в форме линейной регрессии будет иметь вид (для стандартизованных переменных): (5)
Систему (5) можно представить в виде графа связей (рис.1). Встает вопрос об оценке коэффициентов pyx , pyu 2. Коэффициент корреляции случайных переменных xи yкак первый смешанный момент нормированных случайных величин определяется соотношением
так как cov(x, x)= 1, cov(x, xu )= 0 по условию о некоррелированности имплицитных факторов. Но, как известно, в данном частном случае ryx =byx , где byx — стандартизованный коэффициент линейной регрессии. Таким образом, p-коэффициент (рyx )есть стандартизованный регрессионный коэффициент byx , и его оценка методом наименьших квадратов будет являться оценкой эффективности влияния по С. Райту (рис.1 и 2).
Прямая оценка влияний неизмеримых факторов хи невозможна, поэтому ее получают косвенным образом из соотношений для коэффициентов детерминации. В случае модели (5) оценку коэффициента pyu 2 , можно получить следующим образом. Соотношение полной детерминации у посредством хи u2 имеет вид: r2 yy = p2 yx + p2 yu 2 = 1,
Откуда pyu 2 = 1-p2 yx = 1-b2 yx = 1-r2 yx .
Обобщение рассмотренной модели на случай n-звенной линейной цепи, а также случай к независимых причин xk одного и того же следствия у могут быть проведены индуктивно.
Широко распространена структурная модель системы с коррелированными входами (случай множества взаимодополняющих причин), изображенная на рис.2. Для этой модели основное уравнение системы записывается следующим образом: (6), а корреляция следствия с i-й причиной определяется из соотношения (7)
Соотношение (7) демонстрирует важную особенность коэффициента влияния Райта — он может быть как больше, так и меньше соответствующего коэффициента корреляции по абсолютной величине и не совпадать с ним по знаку.
Значения p-коэффициента заключены в интервале [-, ]. Положительное значение р- коэффициента указывает на то, что фактор xj влияет на хi ,- таким образом, что при изменении xj в одном направлении (допустим, увеличении) признак xi ,- изменяется в этом же направлении. Отрицательное значение показывает, что хi , и xj изменяются противоположно. Знак коэффициента влияния получается автоматически в результате решения системы уравнений, связывающей rij и pij . Содержательная интерпретация коэффициентов влияния Райта как показателей интенсивности влияния по дуге графа аналогична интерпретации b-коэффициентов (как показателей сравнительной силы воздействия факторов) в обычных моделях множественной регрессии.
Выражение полной детерминации у посредством множества взаимокоррелированных причин {хj } имеет вид: (8)
Слагаемое называется показателем корреляционной детерминации. Квадрат множественного коэффициента корреляции (коэффициент множественной детерминации):
Таким образом, метод p-коэффициентов позволяет найти наилучшую оценку множественной корреляции R2 y * x 1… xk .
Подчеркнем, что попарная корреляция входов в модели (8) не структурируется. Между тем эта корреляция может быть как следствием координированного изменения двух различных взаимонезависимых причин — истинной корреляцией, так и ложной — результатом воздействия третьей переменной — общей для этих двух переменных причины.
Пусть на рис.3аизображен граф модели, истинность корреляции входов которой находится под вопросом. Г. Саймон показал, что если корреляция x1 и x2 является ложной в отмеченном смысле, то частный коэффициент корреляции первого порядка rx 1 x 2* z где z — общая для х1 и х2 причина — должен быть равен нулю.
В самом деле, для такой модели (сравните граф на риc.3б с рис.3а) будут справедливы следующие отношения:
2. Основная теорема путевого анализа
Первым этапом путевого анализа является идентификация уравнений системы.
В современной эконометрической литературе идентификация понимается как структурная спецификация модели, призванная не только определить значения параметров, но и выделить одну-единственную итоговую структурную модель анализируемых данных.
Проблема идентифицируемости в системе структурных уравнений связана с наличием достаточного числа ограничений, накладываемых на него моделью. Применительно к p-анализу - это проблема соответствия между количеством возможных соотношений между rij и pij и числом pij .
Иначе говоря, проблема идентифицируемости структурных параметров — это проблема достаточности эмпирических данных для оценки всех коэффициентов модели. Необходимым условием идентифицируемости уравнения является отсутствие среди линейных комбинаций оставшихся уравнений, таких, которые удовлетворяли бы всем ограничениям модели, накладываемым на исследуемое уравнение.
Это эквивалентно так называемому условию порядка: для того чтобы уравнение в системе из т линейных структурных уравнений было идентифицируемо, необходимо, чтобы в нем отсутствовало по меньшей мере т — 1 переменных из т + к переменных, встречающихся в модели. Обозначим через т число эндогенных переменных в модели, к — число предопределенных переменных, h — число эндогенных переменных в рассматриваемом уравнении, g — число предопределенных переменных в рассматриваемом уравнении. Тогда условие порядка может быть записано в форме т+к — h — g m — 1 или к — g h — 1.
Структурное уравнение называется идентифицируемым, если оно удовлетворяет условию порядка; в случае точного равенства уравнение называется точно идентифицируемым, при строгом неравенстве — сверхидентифицируемым.
Следующим этапом является оценивание структурных параметров. Для структурных моделей, построенных на основе p-коэффициентов, оценка pij производится не методом наименьших квадратов, а с помощью такого приема. Запишем уравнение (3) следующим образом: или иначе (9)
Используем коэффициенты корреляции между зависимой переменной и каждой из объясняющих переменных: (10)
где n- число наблюдений.
Подставляя в (10) вместо xi правую часть выражения (10), получим: (11)
В этом преобразовании учтено, что корреляция ui , с хj по определению равна нулю. Если учесть, что rij =1, то соотношение (11), называемое основной теоремой путевого анализа, можно записать так: (12)
Здесь j указывает на объясняющую переменную, связь которой с объясняемой переменной i раскрывается в структурной модели, к пробегает по подмножеству всех переменных, непосредственно влияющих на i-ю переменную (на графе эти вершины связаны с вершиной i дугами). Соотношение (12) справедливо для любой рекурсивной системы.
Путевой анализ позволяет произвести декомпозицию корреля ции rij . Введем понятия «полная (совокупная) связь», «совокупное влияние», «прямое влияние», «косвенное влияние». Если коэффициент корреляции нулевого порядка rij рассматривать как измеритель полной связи двух переменных, то мерой совокупного влияния j-й переменной на i-ю переменную (qij ) будет являться ее часть, не зависящая ни от общих для них переменных — причин, ни от корреляции между общими для j-й и i-й переменных причинами (компоненты ложной корреляции), ни от наличия не анализируемой в модели априорной корреляции предопределенных переменных — входов.
Таким образом, мы можем разложить полную связь двух переменных на четыре составляющие с учетом постулируемой в модели асимметрии воздействия: на совокупное влияние (причинное влияние) j-й переменной на i-ю, на две компоненты, измеряющие эффект ложной корреляции, и на компоненту, еще не имеющую общепринятого названия. В свою очередь, совокупное влияние может быть разложено на две составляющие с учетом того, каким образом оно осуществляется — непосредственно или через другие переменные.
Прямое влияние одной переменной на другую измеряется коэффициентом pij ;в этом случае в цепи между объясняющей и объясняемой переменными нет промежуточных звеньев. Косвен ное влияние — это влияние тех составляющих совокупного влияния одной переменной на другую, которое образуется при учете эффекта передачи воздействия через посредство переменных, специфицированных в модели как промежуточные звенья в причинной цепи, связывающей изучаемые переменные. Поскольку строение совокупного влияния всецело зависит от постулируемой причинной структуры отношений между переменными, то и все введенные выше понятия имеют смысл только лишь по отношению к причинной модели с заданным графом связей.
3. Процедура Саймона-Блейлока
Структурные причинные модели в эконометрике и социологии соединяют теорию объекта с эмпирическими данными на основе графа связей. Структурные модели формализуют гипотезы о причинных отношениях. Встает задача выбора гипотез, обозначаемая иногда в эконометрической и социологической литературе как проблема каузального вывода. Х.Блейлок, изучая этот вопрос как часть общего вопроса о средствах построения социологических теорий, предложил формальный прием, основанный на идеях Г.Саймона о ложной корреляции и каузальной упорядоченности, иногда называемый процедурой Саймона — Блейлока.
Формальное содержание этого подхода заключается в гипотезе о полностью специфицированной линейной рекурсивной причинной модели, оценке ее параметров, а затем использовании этих значений для воспроизведения эмпирической корреляционной матрицы. Основная идея процедуры — это положение о том, что модель, которая не воспроизводит эмпирических корреляций, должна быть отвергнута.
Очевидна целесообразность использования процедуры Саймона — Блейлока в двух случаях. Во-первых, когда известен причинный приоритет среди переменных. Если в этом случае имеются две гипотезы, постулирующие различные причинные цепи (структуры графа), то, используя процедуру Саймона - Блейлока, можно воссоздать эмпирические корреляции и отвергнуть ту каузальную цепь, где рассогласование слишком большое. Таким образом, мы можем сравнивать теории.
Второй ситуацией является случай с неизвестным каузальным приоритетом среди переменных. Допустим, что мы имеем набор переменных, для которых не известен каузальный порядок причина-следствие, и имеются две гипотезы, каждая по-своему устанавливающая его, постулируя отсутствие тех или иных возможных отношений. Описываемый подход может быть применен как для сравнения этих теорий, так и для их отбрасывания. Заметим, что в процедуре сравнения одна модель-гипотеза может оказаться лучше другой, но никогда — правильной. Более того, если одна из гипотез близка к тому, чтобы описываться полной рекурсивной системой, то обычно она работает, лучше воспроизводя корреляционную матрицу, и, естественно, будет выбираться как более удачная, даже если она весьма далека от истины.
Процедура Саймона — Блейлока является формальным приемом, создающим базис для отвергания гипотез, но никоим образом не представляет собой процедуру для создания новых теорий.
Другим известным приемом является вычеркивание связей в чрезмерно связанном графе с целью изучения поведения системы и ее элементов в новых условиях. Устойчивость системы может означать верность гипотезы. Решение об уничтожении той или иной связи модели может быть принято или на основании критерия статистической значимости, или на основании произвольно установленного порогового критерия величины коэффициента причинного влияния. Проверкой правильности гипотез и корректности модели должно служить ее подтверждение при испытаниях на контрольных данных.
Использование p-анализа в социально-экономических исследованиях связано с рядом трудностей. Прежде всего не всегда можно считать, что линейная зависимость в состоянии удовлетворительно отразить все разнообразие причинно-следственных связей в реальных структурах. Кроме того, следует учитывать, что р-анализ разработан для количественных переменных. Структурные модели и путевой анализ иллюстрируют единство теоретического (качественного) и формально-математического (количественного) подходов. Значимость результатов анализа определяется в первую очередь правильностью построения логического каркаса структурной модели — максимально связанного графа связей, изоморфной математической модели в виде системы уравнений.
Заключение
В данном реферате был рассмотрен метод Райта, который нашёл широкое применение в биометрии, построении социологических причинных моделей.
Путевой анализ можно разделить на несколько этапов.
Первым этапом путевого анализа является идентификация уравнений системы. Под идентификацией понимается структурная спецификация модели, призванная выделить одну-единственную итоговую структурную модель анализируемых данных.
Следующим этапом является оценивание структурных параметров.
Структурные причинные модели в эконометрике и социологии соединяют теорию объекта с эмпирическими данными на основе графа связей. Структурные модели формализуют гипотезы о причинных отношениях. Встает задача выбора гипотез, обозначаемая иногда в эконометрической и социологической литературе как проблема каузального вывода. Х.Блейлок, изучая этот вопрос как часть общего вопроса о средствах построения социологических теорий, предложил формальный прием, основанный на идеях Г.Саймона о ложной корреляции и каузальной упорядоченности, иногда называемый процедурой Саймона — Блейлока.
Формальное содержание этого подхода заключается в гипотезе о полностью специфицированной линейной рекурсивной причинной модели, оценке ее параметров, а затем использовании этих значений для воспроизведения эмпирической корреляционной матрицы. Основная идея процедуры — это положение о том, что модель, которая не воспроизводит эмпирических корреляций, должна быть отвергнута.
Путевой анализ Райта позволил прояснить проблему ложной корреляции, которой занимались многие статистики.
Используемая литература
1. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. – М.: ЮНИТИ, 1998
2. Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы.- М.: Финансы и статистика,1998
3. Елисеева И.И.. –М: Финансы и статистика,2001
4. Ферстер Э., Ренц Б. Методы корреляционного и регрессионного анализа.- М.: Финансы и статистика, 1983