Шпоры по эконометрике
СОДЕРЖАНИЕ: 1. СПЕЦИФИКАЦИЯ МОДЕЛИ Простая регрессия представляет собой регрессию между двумя переменными —у и х, т.е. модель вида , где — результативный признак;Шпоры по эконометрике.
№ 1. СПЕЦИФИКАЦИЯ МОДЕЛИ
Простая регрессия представляет собой регрессию между двумя переменными —у и х, т.е. модель вида , где у — результативный признак; х - признак-фактор.
Множественная регрессия представляет собой регрессию результативного признака с двумя и большим числом факторов, т. е. модель вида
Спецификация модели - формулировка вида модели, исходя из соответствующей теории связи между переменными. В уравнении регрессии корреляционная по сути связь признаков представляется в виде функциональной связи, выраженной соответствующей математической функцией. где yj — фактическое значение результативного признака;
yxj -теоретическое значение результативного признака.
— случайная величина, характеризующая отклонения реального значения результативного признака от теоретического.
Случайная величина называется также возмущением. Она включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения.
От правильно выбранной спецификации модели зависит величина случайных ошибок: они тем меньше, чем в большей мере теоретические значения результативного признака подходят к фактическим данным у.
К ошибкам спецификации относятся неправильный выбор той или иной математической функции для, и недоучет в уравнении регрессии какого-либо существенного фактора, т. е. использование парной регрессии вместо множественной.
Ошибки выборки - исследователь чаще всего имеет дело с выборочными данными при установлении закономерной связи между признаками.
Ошибки измерения практически сводят на нет все усилия по количественной оценке связи между признаками. Основное внимание в эконометрических исследованиях уделяется ошибкам спецификации модели.
В парной регрессии выбор вида математической функции может быть осуществлен тремя методами: графическим, аналитическим и экспериментальным.
Графический метод основан на поле корреляции. Аналитический метод основан на изучении материальной природы связи исследуемых признаков.
Экспериментальный метод осуществляется путем сравнения величины остаточной дисперсии Dост , рассчитанной при разных моделях. Если фактические значения результативного признака совпадают с теоретическими у =, то Docm =0. Если имеют место отклонения фактических данных от теоретических (у — ) то .
Чем меньше величина остаточной дисперсии, тем лучше уравнение регрессии подходит к исходным данным. Число наблюдений должно в 6 — 7 раз превышать число рассчитываемых параметров при переменной х.
№ 2 ЛИНЕЙНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ: СМЫСЛ И ОЦЕНКА ПАРАМЕТРОВ.
Линейная регрессия сводится к нахождению уравнения вида или .
Уравнение вида позволяет по заданным значениям фактора x иметь теоретические значения результативного признака, подставляя в него фактические значения фактора х.
Построение линейной регрессии сводится к оценке ее параметров а и в.
Оценки параметров линейной регрессии могут быть найдены разными методами.
1.
2.
Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу.
Формально а
— значение у
при х = 0. Если признак-фактор
не имеет и не может иметь нулевого значения, то вышеуказанная
трактовка свободного члена, а
не имеет смысла. Параметр, а
может
не иметь экономического содержания. Попытки экономически
интерпретировать параметр, а
могут привести к абсурду, особенно при а
0.
Интерпретировать можно лишь знак при параметре а. Если а 0, то относительное изменение результата происходит медленнее, чем изменение фактора.
Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции rxy . Существуют разные модификации формулы линейного коэффициента корреляции.
Линейный коэффициент корреляции находится и границах: -1. rxy 1. При этом чем ближе r к 0 тем слабее корреляция и наоборот чем ближе r к 1 или -1, тем сильнее корреляция, т.е. зависимость х и у близка к линейной. Если r в точности =1или -1 все точки лежат на одной прямой. Если коэф. регрессии b0 то 0 .rxy 1 и наоборот при b0 -1.rxy 0. Коэф. корреляции отражает степени линейной зависимости м/у величинами при наличии ярко выраженной зависимости др. вида.
Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции , называемый коэффициентом детерминации. Коэффициент детерминации характеризует долю дисперсии результативного признака y, объясняемую регрессией. Соответствующая величина характеризует долю дисперсии у, вызванную влиянием остальных не учтенных в модели факторов.
№ 3. МНК.
МНК позволяет получить такие оценки параметров а и b , которых сумма квадратов отклонений фактических значений результативного признака (у) от расчетных (теоретических) минимальна:
Иными словами, из всего множества линий линия регрессии на графике выбирается так, чтобы сумма квадратов расстояний по вертикали между точками и этой линией была бы минимальной. Решается система нормальных уравнений
№ 4. ОЦЕНКА СУЩЕСТВЕННОСТИ ПАРАМЕТРОВ ЛИНЕЙНОЙ РЕГРЕССИИ И КОРРЕЛЯЦИИ .
Оценка значимости уравнения регрессии в целом дается с помощью F-критерия Фишера. При этом выдвигается нулевая гипотеза, что коэффициент регрессии равен нулю, т. е. b = 0, и следовательно, фактор х не оказывает влияния на результат у.
Непосредственному расчету F-критерия предшествует анализ дисперсии. Центральное место в нем занимает разложение общей суммы квадратов отклонений переменной у от средне го значения у на две части - «объясненную» и «необъясненную»:
- общая сумма квадратов отклонений
- сумма квадратов отклонения объясненная регрессией - остаточная сумма квадратов отклонения.
Любая сумма квадратов отклонений связана с числом степеней свободы, т. е. с числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности nис числом определяемых по ней констант. Применительно к исследуемой проблеме число cтепеней свободы должно показать, сколько независимых отклонений из п возможных требуется для образования данной суммы квадратов.
Дисперсия на одну степень свободы D .
F-отношения (F-критерий):
Ecли нулевая гипотеза справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Для Н0 необходимо опровержение, чтобы факторная дисперсия превышала остаточную в несколько раз. Английским статистиком Снедекором разработаны таблицы критических значений F-отношений при разных уровнях существенности нулевой гипотезы и различном числе степеней свободы. Табличное значение F-критерия — это максимальная величина отношения дисперсий, которая может иметь место при случайном их расхождении для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F-отношения признается достоверным, если о больше табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи: Fфакт Fтабл Н0 отклоняется.
Если же величина окажется меньше табличной Fфакт ‹, Fтабл , то вероятность нулевой гипотезы выше заданного уровня и она не может быть отклонена без серьезного риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым. Но не отклоняется.
Стандартная ошибка коэффициента регрессии
Для оценки существенности коэффициента регрессии его величина сравнивается с его стандартной ошибкой, т. е. определяется фактическое значение t-критерия Стьюдентa: которое
затем сравнивается с табличным значением при определенном уровне значимости и числе степеней свободы (n- 2).
Стандартная ошибка параметра а :
Значимость линейного коэффициента корреляции проверяется на основе величины ошибки коэффициента корреляции т r :
Общая дисперсия признака х:
Коэф. регрессии Его величина показывает ср. изменение результата с изменением фактора на 1 ед.
Ошибка аппроксимации:
№ 5. ИНТЕРВАЛЫ ПРОГНОЗА ПО ЛИНЕЙНОМУ УРАВНЕНИЮ
РЕГРЕССИИ
Оценка стат. значимости параметров регрессии проводится с помощью t – статистики Стьюдента и путем расчета доверительного интервала для каждого из показателей. Выдвигается гипотеза Н0 о статистически значимом отличие показателей от 0 a = b = r = 0. Рассчитываются стандартные ошибки параметров a,b, r и фактич. знач. t – критерия Стьюдента.
Определяется стат. значимость параметров.
ta ›Tтабл - a стат. значим
tb ›Tтабл - b стат. значим
Находятся границы доверительных интервалов.
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что параметры a и b находясь в указанных границах не принимают нулевых значений, т.е. не явл.. стат. незначимыми и существенно отличается от 0.
№ 6. НЕЛИНЕЙНАЯ РЕГРЕССИЯ. ВИДЫ МОДЕЛЕЙ
Если между экономическими явлениями существуют нелинейные соотношения, то они выражаются с помощью соответствующих нелинейных функций: например, равносторонней гиперболы , параболы второй степени и д.р.
Различают два класса нелинейных регрессий:
• регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам;
• регрессии, нелинейные по оцениваемым параметрам.
Примером нелинейной регрессии по включаемым в нее объясняющим переменным могут служить следующие функции:
• полиномы разных степеней
• равносторонняя гипербола
К нелинейным регрессиям по оцениваемым параметрам относятся функции:
• степенная
• показательная
• экспоненциальная
№ 7. СМЫСЛ КОЭФФИЦИЕНТА РЕГРЕССИИ.
Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. Оценку коэффициента регрессии можно получить не обращаясь к методу наименьших квадратов. Альтернативную оценку параметра b можно найти исходя из содержания данного коэффициента: изменение результата сопоставляют с изменением фактора
Общая сумма квадратов отклонений индивидуальных значений результативного признака у от среднего значения вызвана влиянием множества причин. Условно разделим всю совокупность причин на две группы: изучаемый фактор х и прочие факторы.
Если фактор не оказывает влияния на результат, то линия регрессии на графике параллельна оси ох и .Тогда вся дисперсия результативного признака обусловлена воздействием прочих факторов и общая сумма квадратов отклонений совпадет с остаточной. Если же прочие факторы не влияют на результат, то у связан с х функционально и остаточная сумма квадратов равна нулю. В этом случае сумма квадратов отклонений, объясненная регрессией, совпадает с общей суммой квадратов.
Поскольку не все точки поля корреляции лежат на линии регрессии, то всегда имеет место их разброс как обусловленный влиянием фактора х, т. е. регрессией у по х, так и вызванный действием прочих причин (необъясненная вариация). Пригодность линии регрессии для прогноза зависит от того, какая часть общей вариации признака у приходится на объясненную вариацию
Очевидно, что если сумма квадратов отклонений, обусловленная регрессией, будет больше остаточной суммы квадратов, то уравнение регрессии статистически значимо и фактор х оказывает существенное воздействие на результат у
Любая сумма квадратов отклонений связана с числом степеней свободы , т. е. с числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности n ис числом определяемых по ней констант. Применительно к исследуемой проблеме число степеней свободы должно показать, сколько независимых отклонений из п возможных требуется для образования данной суммы квадратов.
№8. ПРИМЕНЕНИЕ МНК К МОДЕЛЯМ НЕЛИНЕЙНЫМ ОТНОСИТЕЛЬНО ВКЛЮЧАЕМЫХ ПЕРЕМЕННЫХ И ОЦЕНИВАЕМЫХ ПАРАМЕТРОВ.
Нелинейная регрессия по включенным переменным не таит каких-либо сложностей в оценке ее параметров. Она определяется, как и в линейной регрессии, методом наименьших квадратов (МНК), ибо эти функции линейны по параметрам. Так, в параболе второй степени y=a0 +a1 x+a2 x2 + заменяя переменные x=x1 ,x2 =x2 , получим двухфакторное уравнение линейной регрессии: у=а0 +а1 х1 +а2 х2 +
Парабола второй степени целесообразна к применению, если для определенного интервала значений фактора меняется характер связи рассматриваемых признаков: прямая связь меняется на обратную или обратная на прямую. В этом случае определяется значение фактора, при котором достигается максимальное (или минимальное), значение результативного признака: приравниваем к нулю первую производную параболы второй степени: , т.е. b+2cx=0 и x=-b/2c
Применение МНК для оценки параметров параболы второй степени приводит к следующей системе нормальных уравнений:
Решение ее возможно методом определителей:
В моделях, нелинейных по оцениваемым параметрам, но приводимых к линейному виду, МНК применяется к преобразованным уравнениям. Если в линейной модели и моделях, нелинейных по переменным, при оценке параметров исходят из критерия min, то в моделях, нелинейных по оцениваемым параметрам, требование МНК применяется не к исходным данным результативного признака, а к их преобразованным величинам, т. е.ln y, 1/y.
Так, в степенной функции МНК применяется к преобразованному уравнению lny = ln + ln x ln . Это значит, что оценка параметров основывается на минимизации суммы квадратов отклонений в логарифмах. Соответственно если в линейных моделях то в моделях, нелинейных по оцениваемым параметрам, . Вследствие этого оценка параметров оказываются несколько смещенной.
№9. КОЭФФИЦИЕНТЫ ЭЛАСТИЧНОСТИ ПО РАЗНЫМ ВИДАМ РЕГРЕССИОННЫХ МОДЕЛЕЙ.
1. Линейная y = a + bx + , y = b, Э = .
2. Парабола 2 порядка y = a +bx + c +, y = b + 2cx, Э = .
3. Гипербола y = a+b/x +, y=-b/, Э = .
4. Показательная y=a, y = ln , Э = x ln b.
5. Степенная y = a, y = , Э = b.
6. Полулогарифмическая y = a + b ln x + , y = b/x , Э = .
7. Логистическая , y = , Э = .
8. Обратная y = , y = , Э = .
№ 10 ПОКАЗАТЕЛИ КОРРЕЛЯЦИИ
1. индекс корреляции ( R ):
Величина данного показателя находится в границах: 0 R 1, чем ближе к 1, тем теснее связь рассматриваемых признаков, тем более надежно найденное уравнение регрессии.
2. индекс детерминации используется для проверки существенности в целом ур-ия нелинейной регрессии по F- критерию Фишера:
, где R2 - индекс детерминации, n- число наблюдений, m – число параметров при переменной х.
№11. МНОЖЕСТВЕННАЯ РЕГРЕССИЯ. СПЕЦИФИКАЦИЯ МОДЕЛИ. ОТБОР ФАКТОРОВ ПРИ ПОСТРОЕНИИИ МОДЕЛИ.
Регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Поведение отдельных экономических переменных контролировать нельзя, т. е. не удается обеспечить равенство всех прочих условий для оценки влияния одного исследуемого фактора. В этом случае следует попытаться выявить влияние других факторов, введя их в модель, т. е. построить уравнение множественной регрессии: y = a + b 1 x 1 + b 2 +…+ bp xp + e ; Такого рода уравнение может использоваться при изучении потребления. Тогда коэффициенты bj — частные производные потребления у по соответствующим факторам xi : , в предположении, что все остальные хi постоянны. В 30-е гг. XX в. Кейнс сформулировал свою гипотезу потребительской функции. С того времени исследователи неоднократно обращались к проблеме ее совершенствования. Современная потребительская функция чаще всего рассматривается как модель вида: C = j ( y , P , M , Z ), где С — потребление; у — доход; Р — цена, индекс стоимости жизни; М — наличные деньги; Z — ликвидные активы. При этом .. Основная цель множественной регрессии — построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель. Спецификация модели включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии. Требования к факторам.1 Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность (например, в модели урожайности качество почвы задается в виде баллов) 2.Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи. Включение в модель факторов с высокой интеркорреляцией, когда Ryx 1 Rx 1 x 2 .Для зависимости y = a + b 1 x 1 + b 2 +…+ bp xp + e может привести к нежелательным последствиям, повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии. Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются не интерпретированными.
Включаемые во множественную регрессию факторы должны объяснить вариацию независимой переменной. Если строится модель с набором р- факторов, то для нее рассчитывается показатель детерминации R 2 , который фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии р- факторов. Влияние других не учтенных в модели факторов оценивается как 1 - R 2 с соответствующей остаточной дисперсией S2 . При дополнительном включении в регрессию (р + 1) фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться:. Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметров регрессии по t-критерию Стьюдента.
Таким образом, хотя теоретически регрессионная модель позволяет учесть любое число факторов, практически в этом нет необходимости. Отбор факторов производится на основе качественного теоретико-экономического анализа, который обычно осуществляется в две стадии: на первой подбираются факторы исходя из сущности проблемы; на второй – на основе показателей корреляции определяют t-статистики для параметров регрессии. Коэффициенты интеркорреляции (т. е. корреляции между объясняющими переменными) позволяют исключать из модели дублирующие факторы. Считается, что две переменных явно кол линеарны, т. е. находятся между собой в линейной зависимости, если . Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается не фактору, более тесно связанному с результатом, а тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом требовании проявляется специфика множественной регрессии как метода исследования комплексного воздействия факторов в условиях их независимости друг от друга. Наибольшие трудности в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимостью. Наличие мультиколлинеарности факторов может означать, что некоторые факторы будут всегда действовать в унисон. В результате вариация в исходных данных перестает быть полностью независимой, и нельзя оценить воздействие каждого фактора в отдельности. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов (МНК). Включение в модель мультиколлинеарных факторов нежелательно в силу следующих последствий: 1.затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде, ибо факторы коррелированы; параметры линейной регрессии теряют экономический смысл;2оценки параметров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений. Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреля ции между факторами.
Если бы факторы не коррелировали между собой, то матрица парных коэффициентов корреляции между факторами была бы единичной матрицей. Для включающего три объясняющих переменных уравнения: y = a + b 1 x 1 + b 2 + b 3 x 3 + e . Матрица коэф-в корреляции м/у факторами имела бы определитель равный 1. Det =1, т.к. rx 1 x 1 =rx 2 x 2 =1 и rx 1 x 2 =rx 1 x 3 =rx 2 x 3 =0. Если м/у факторами сущ-ет полная линейная зависимость и все коэф-ты корреляции =1, то определитель такой матрицы =0. Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И, наоборот, чем ближе к единице определитель матрицы межфакторной корреляции, тем меньше мультиколлинеарность факторов.
№12. ЧТО ОЗНОЧАЕТ ВЗАИМОДЕЙСТВИЕ ФАКТОРОВ И КАК ОНО МОЖЕТ БЫТЬ ПРЕДСТАВЛЕНО ГРАФИЧЕСКИ?
Одним из путей учета внутренней корреляции факторов является переход к совмещенным уравнениям регрессии, т. е. к уравнениям, которые отражают не только влияние факторов, но и их взаимодействие. Так, если y=f(x1,x2,x3), то возможно построение следующего совмещенного уравнения: y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 + b 12 x 1 x 2 + b 13 x 1 x 3 + b 23 x 2 x 3 + e . Рассматриваемое уравнение включает взаимодействие первого порядка (взаимодействие двух факторов). Возможно включение в модель и взаимодействий более высокого порядка, если будет доказана их статистическая значимость по F-критерию Фишера. Если анализ совмещенного уравнения показал значимость только взаимодействия факторов х1 и х3 ,то уравнение будет иметь вид: y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 + b 13 x 1 x 3 + e . Взаимодействие факторов х1 и х3 означает, что на разных уровнях фактора х3 влияние фактора х1 на у будет неодинаково, т. е. оно зависит от значений фактора х3 . На рис. взаимодействие факторов представляется непараллельными линиями связи с результатом у. И, наоборот, параллельные линии влияния фактора x1 на у при разных уровнях фактора х3 означают отсутствие взаимодействия факторов х1 и х3 . Графики:
а — х1 влияет на у, причем это влияние одинаково как при х3 =В1 , так и при х3 =В2 (одинаковый наклон линий регрессии), что означает отсутствие взаимодействия факторов х1 и х3 ; б — с ростом х1 результативный признак y возрастает при х3 = В1 ; с ростом х1 результативный признак у снижается при х3 = В2 .. Между х1 и х3 существует взаимодей-вие. Совмещенные уравнения регрессии строятся, например, при исследовании эффекта влияния на урожайность разных видов удобрений.Решению проблемы устранения мультиколлинеарности факторов может помочь и переход к уравнениям приведенной формы. С этой целью в уравнение регрессии производится подстановка рассматриваемого фактора через выражение его из другого уравнения.
№13. ИНТЕРПРИТАЦИЯ КОЭФФИЦИЕНТОВ РЕГРЕССИИ ЛИНЕЙНОЙ МОДЕЛИ ПОТРЕБЛЕНИЯ. СМЫСЛ СУММЫ bi В ПРОИЗВОДСТВЕННЫХ ФУНКЦИЯХ И ЗНАЧЕНИЕ СУММЫ bi 1 . КОЭФФИЦИЕНТЫ, ИСПОЛЬЗУЕМЫЕ ДЛЯ ОЦЕНКИ СРАВНИТЕЛЬНОЙ СИЛЫ ВОЗДЕЙСТВИЯ ФАКТОРОВ НА РЕЗУЛЬТАТ.
Функция потребления: С=К*у+L, где С-потребление, у-доход, К и L-параметры функции.(у=С+I, I-размер инвистиций). Предположим, что функция потребления составила :С= 1,9 + 0,65 *у . Коэффициент регрессии характеризует склонность к потреблению. Он показывает, что из каждой тысячи дохода на потребление расходуется в среднем 650 руб., а 350 руб. инвестируются. В производственных функциях:
где Р - количество продукта, изготавливаемого с помощью т производственных факторов (F1 , F 2 ,..., Fm ); b - параметр, являющийся эластичностью количества продукции по отношению к количеству соответствующих производственных факторов.
Экономический смысл имеют не только коэффициенты b каждого фактора, но и их сумма, т. е. сумма эластичностей: В= b 1 + b 2 +...+ Ьт . Эта величина фиксирует обобщенную характеристику эластичности производства.
При практических расчетах не всегда .Она может быть как больше, так и меньше единицы. В этом случае величина В фиксирует приближенную оценку эластичности выпуска с ростом каждого фактора производства на 1 % в условиях увеличивающейся (В 1) или уменьшающейся (В 1) отдачи на масштаб. Так, если Р = 2,4* F * F2 0,7 * F3 0,2 , то с ростом значений каждого фактора производства на 1 % выпуск продукции в целом возрастает приблизительно на 1,2 %.
№14. НАЗНАЧЕНИЕ ЧАСТНОЙ КОРРЕЛЯЦИИ ПРИ ПОСТРОЕНИИ МОДЕЛИ МНОЖЕСТВЕННОЙ РЕГРЕССИИ. Ранжирование факторов, участвующих во множественной линейной регрессии, может быть проведено через стандартизованные коэффициенты регрессии, с помощью частных коэффициентов корреляции — для линейных связей. При нелинейной взаимосвязи исследуемых признаков эту функцию выполняют частные индексы детерминации. Кроме того, частные показатели корреляции широко используются при решении проблемы отбора факторов: целесообразность включения того или иного фактора в модель доказывается величиной показателя частной корреляции.
Частные коэффициенты (или индексы) корреляции характеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в уравнение регрессии.
Показатели частной корреляции представляют собой отношение сокращения остаточной дисперсии за счет дополнительного включения в анализ нового фактора к остаточной дисперсии, имевшей место до введения его в модель.
Частные коэффициенты корреляции измеряющие влияние на у фактора хi при неизменном уровне др. факторов можно определить по формуле:
;
При двух факторах и i=1 данная формула примет вид:
Частные коэффициенты корреляции изменяются в пределах от -1 до 1.
№15. ЧАСТНЫЙ F -КРИТЕРИЙ, ЕГО ОТЛИЧИЕ ОТ ПОСЛЕДОВАТЕЛЬНОГО F -КРИТЕРИЯ, СВЯЗЬ МЕЖДУ СОБОЙ t - КРИТЕРИЯ СТЬЮДЕНТА ДЛЯ ОЦЕНКИ ЗНАЧИМОСТИ bi И ЧАСТНЫМ F -КРИТЕРИЕМ .
Ввиду корреляции м/у факторами значимость одного и того же фактора м/б различной в зависимости от последовательности его введения в модель. Мерой для оценки включения фактора в модель служит частый F-критерий, т.е. Fxi . В общем виде для фактора xi частый F-критерий определяется как :
Если рассматривается уравнение y = a + b 1 x 1 + b 2 + b 3 x 3 + e , то определяются последовательно F-критерий для уравнения с одним фактором х1 , далее F-критерий для дополнительного включения в модель фактора х2 , т. е. для перехода от однофакторного уравнения регрессии к двухфакторному, и, наконец, F-критерий для дополнительного включения в модель фактора х3 , т. е. дается оценка значимости фактора х3 после включения в модель факторов x1 их2 . В этом случае F-критерий для дополнительного включения фактора х2 после х1 является последовательным в отличие от F-критерия для дополнительного включения в модель фактора х3 , который является частным F-критерием, ибо оценивает значимость фактора в предположении, что он включен в модель последним. С t-критерием Стьюдента связан именно частный F-критерий. Последовательный F-критерий может интересовать исследователя на стадии формирования модели. Для уравнения y = a + b 1 x 1 + b 2 + b 3 x 3 + e оценка значимости коэффициентов регрессии Ь1 ,Ь2, , b 3 предполагает расчет трех межфакторных коэффициентов детерминации, а именно: ,, и можно убедиться, что существует связь между собой t- критерия Стьюдента для оценки значимости bi и частным F-критерием:
На основе соотношения bi и получим:
№16 ПРЕДПОСЫЛКИ МНК.
При оценке параметров уравнения регрессии применяется МНК. При этом делаются определенные предпосылки относительно составляющей , которая представляет собой ненаблюдаемую величину.
Исследования остатков - предполагают проверку наличия следующих пяти предпосылок МНК: 1.случайный характер остатков; 2.нулевая средняя величина остатков, не зависящая от хi ;
3.гомоскедастичность —дисперсия каждого отклонения ,одинакова для всех значений х; 4.отсутствие автокорреляции остатков. Значения остатков , распределены независимо друг от друга; 5.остатки подчиняются нормальному распределению.
1. Проверяется случайный характер остатков , с этой целью строится график зависимости остатков от теоретических значений результативного признака. Если на графике получена горизонтальная полоса, то остатки , представляют собой случайные величины и МНК оправдан, теоретические значения ух хорошо аппроксимируют фактические значения y. В других случаях необходимо либо применять другую функцию, либо вводить дополнительную информацию и заново строить уравнение регрессии до тех пор, пока остатки , не будут случайными величинами.
2. Вторая предпосылка МНК относительно нулевой средней величины остатков означает, что (у — ух ) = 0. Это выполнимо для линейных моделей и моделей, нелинейных относительно включаемых переменных. С этой целью наряду с изложенным графиком зависимости остатков от теоретических значений результативного признака ух строится график зависимости случайных остатков от факторов, включенных в регрессию хi . Если остатки на графике расположены в виде горизонтальной полосы, то они независимы от значений xj . Если же график показывает наличие зависимости и хj то модель неадекватна. Причины неадекватности могут быть разные.
3. В соответствии с третьей предпосылкой МНК требуется, чтобы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора xj остатки , имеют одинаковую дисперсию. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность. Наличие гетероскедастичности можно наглядно видеть из поля корреляции. Гомоскедастичность остатков означает, что дисперсия остатков - одинакова для каждого значения х .
4.Отсутствие автокорреляции остатков, т. е. значения остатков распределены независимо друг от друга. Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений. Отсутствие автокорреляции остаточных величин обеспечивает состоятельность и эффективность оценок коэффициентов регрессии.
№17. СУЩНОСТЬ АНАЛИЗА ОСТАТКОВ ПРИ НАЛИЧИИ РЕГРЕССИОННОЙ МОДЕЛИ. КАК МОЖНО ПРОВЕРИТЬ НАЛИЧИЕ ГОМО- ИЛИ ГЕТЕРОСКЕДАСТИЧНОСТИ ОСТАТКОВ. ОЦЕНКА ОТСУТСТВИЯ АВТОКОРРЕЛЯЦИИ ОСТАТКОВ ПРИ ПОСТРОЕНИИ СТАТИСТИЧЕСКОЙ РЕГРЕССИОННОЙ МОДЕЛИ.
С этой целью строиться график зависимости остатков ei от теоретических значений результативного признака:
Если на графике получена горизонтальная полоса, то остатки ei представляют собой случайные величины и МНК оправдан, теоретические значения ух хорошо аппроксимируют фактические значения у.
Возможны следующие случаи: если ei зависит от у x , то: 1.остатки ei не случайны.2. остатки ei , не имеют постоянной дисперсии. 3. Остатки ei носят систематический характер в данном случае отрицательные значения ei , соответствуют низким значениям ух , а положительные — высоким значениям. В этих случаях необходимо либо применять другую функцию, либо вводить дополнительную информацию.
Как можно проверить наличие гомо- или гетероскедастичноси остатков? Гомоскедастичность остатков означает, что дисперсия остатков ei одинакова для каждого значения х. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность. Наличие гетероскедастичности можно наглядно видеть из поля корреляции. а — дисперсия остатков растет по мере увеличения х; б — дисперсия остатков достигает максимальной величины при средних значениях переменной х и уменьшается при минимальных и максимальных значениях х; в — максимальная дисперсия остатков при
малых значениях х и дисперсия остатков однородна по мере увеличения значений х. Графики гомо- и гетеро-ти.
Оценка отсутствия автокорреляции остатков (т.е. значения остатков ei распределены независимо друг от друга). Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений. Коэффициент корреляции между ei и ej , где ei — остатки текущих наблюдений, ej — остатки предыдущих наблюдений, может быть определен по обычной формуле линейного коэффициента корреляции . Если этот коэффициент окажется существенно отличным от нуля, то остатки автокоррелированы и функция плотности вероятности F(e ) зависит j-й точки наблюдения и от распределения значений остатков в других точках наблюдения. Для регрессионных моделей по статической информации автокорреляция остатков может быть подсчитана, если наблюдения упорядочены по фактору х . Отсутствие автокорреляции остаточных величин обеспечивает состоятельность и эффективность оценок коэффициентов регрессии. Особенно актуально соблюдение данной предпосылки МНК при построении регрессионных моделей по рядам динамики, где ввиду наличия тенденции последующие уровни динамического ряда, как правило, зависят от своих предыдущих уровней.
№18 СМЫСЛ ОБОБЩЕННОГО МНК .
При нарушении гомоскедастичности и наличии автокорреляции ошибок рекомендуется традиционный МНК заменять обобщенным методом. Обобщенный МНК применяется к преобразованным данным и позволяет получать оценки, которые обладают не только свойством несмещенности, но и имеют меньшие выборочные дисперсии. Обобщенный МНК для корректировки гетерос-ти. В общем виде для уравнения yi =a+bxi +e i при где Ki – коэф-т пропор-ти. Модель примет вид: yi =+xi +e i . В ней остаточные величины гетероскедастичны. Предполагая в них отсутствие автокорреляции, можно перейти к уравнению с гомоскедастичными остатками, поделив все переменные, зафиксированные в ходе i-го наблюдения на . Тогда дисперсия остатков будет величиной постоянной. От регрессии у по х мы перейдем к регрессии на новых переменных: y / и х/ . Уравнение регрессии примет вид: . По отношению к обычной регрессии уравнение с новыми, преобразованными переменными представляет собой взвешенную регрессию, в которой переменные у и х взяты с весами . Коэф-т регрессии b можно определить как Как видим, при использовании обобщенного МНК с целью корректировки гетероскедастичности коэффициент регрессии b представляет собой взвешенную величину по отношению к обычному МНК с весами 1/К.Аналогичный подход возможен не только для уравнения парной, но и для множественной регрессии. Модель примет вид: . Модель с преобразованными переменными составит
. Это уравнение не содер-т свобод-го члена, применяя обычный МНК получим: Применение в этом случае обобщенного МНК приводит к тому, что наблюдения с меньшими значениями преобразованных переменных х/К имеют при определении параметров регрессии относительно больший вес, чем с первоначальными переменными.
№19. СИСТЕМЫ ЭКОНОМЕТРИЧЕСКИХ УРАВНЕНИЙ. ПРОБЛЕМА ИДЕНТИФИКАЦИИ.
Сложные экономические процессы описывают с помощью системы взаимосвязанных уравнений. Различают несколько видов систем уравнений: 1. Система независимых уравнений - когда каждая зависимая переменная у рассматривается как функция одного и того же набора факторов х :
y 1 = a 11 * x 1 + a 12 * x 2 +…+ a 1 m * xm + e 1 Для решения этой системы и нахождения ее параметров
yn =an1 *x1 +an2 *x2 +…+anm *xm +en используется МНК.
2.Система рекурсивных уравнений – когда зависимая переменная у одного уравнения выступает в виде фактора х в другом уравнении:
y1 =a11 *x1 +a12 *x2 +…+a1m *xm +e1
y2 =b21 *y1 +a21 *x1 +a22 *x2 +…+a2m *xm +e2
y3 =b31 *y1 +b32 *y2 +a31 *x1 +a32 *x2 +…+a3m *xm +e3
yn =bn1 *y1 +bn2 *y2 +…+bnn-1 *yn-1 +an1 *x1 +an2 *x2 +…+anm *xm +en
Для решения этой системы и нахождения ее параметров используется МНК.
3 Система взаимосвязанных уравнений – когда одни и те же зависимые переменные в одних уравнениях входят в левую часть, а в других – в правую.
y1= b12 *y2 +b13 *y3 +…+b1n *yn +a11 *x1 +a12 *x2 +…+a1m *xm +e1
y2 =b21 *y1 +b23 *y3 +…+b2n *yn +a21 *x1 +a22 *x2 +…+a2m *xm +e2
yn =bn1 *y1 +bn2 *y2 +…+bnn-1 *yn-1 +an1 *x1 +an2 *x2 +…+anm *xm +en
Такая система уравнений называется структурной формой модели. Эндогенные переменные – взаимосвязанные переменные, которые определяются внутри модели (системы) у. Экзогенные переменные – независимые переменные, которые определяются вне системы х. Предопределенные переменные – экзогенные и лаговые (за предыдущие моменты времени) эндогенные переменные системы. Коэффициенты a и b при переменных – структурные коэффициенты модели. Система линейных функций эндогенных переменных от всех предопределенных переменных системы - приведенная форма модели.
где - коэффициенты приведенной формы модели.
Необходимое условие идентификации – выполнение счетного правила:
D+1=H –уравнение идентифицируемо;
D+1H – уравнение неидентифицируемо;
D+1H – уравнение сверхидентифицируемо.
Где Н – число эндогенных переменных в уравнении, D – число предопределенных переменных, отсутствующих в уравнении, но присутствующих в системе.
Достаточное условие идентификации- определитель матрицы, составленной из коэффициентов при переменных, отсутствующих в исследуемом уравнении на равен нулю и ранг этой матрицы не менее эндогенных переменных без единицы. Для решения идентифицируемого уравнения применяется КМНК, для решения сверхидентифицируемых - двухшаговый МНК.
№20 КМНК . Применяется в случае точно идентифицируемой модели. Процедура применения КМНК предполагает выполнение следующих этапов: 1. Составляют приведенную форму модели и определяют численные значения параметров для каждого ее уравнения обычным МНК. 2. путем алгебраических преобразований переходят от приведенной формы к уравнениям структурной формы модели, получая тем самым численные оценки структурных параметров.
№21 ДВУХШАГОВЫЙ МНК. (ДМНК)
Основная идея ДМНК — на основе приведенной формы модели получить для сверхидентифицируемого уравнения теоретические значения эндогенных переменных, содержащихся в правой части уравнения. Далее, подставив их вместо фактических значений, можно применить обычный МНК к структурной форме сверхидентифицируемого уравнения. Метод получил название двухшагового МНК, ибо дважды используется МНК: на первом шаге при определении приведенной формы модели и нахождении на ее основе оценок теоретических значений эндогенной переменной
и на втором шаге применительно к структурному сверхидентифицируемому уравнению при определении структурных коэффициентов модели по данным теоретических (расчетных) значений эндогенных переменных.
Сверхидентифицируемая структурная модель может быть двух типов:
• все уравнения системы сверхидентифицируемы;
• система содержит наряду со сверхидентифицируемыми точно
идентифицируемые уравнения.
Если все уравнения системы сверхидентифицируемые, то для оценки структурных коэффициентов каждого уравнения используется ДМНК. Если в системе есть точно идентифицируемые уравнения, то структурные коэффициенты по ним находятся из системы приведенных уравнений.
Применим ДМНК к простейшей сверхидентифицируемой
модели:
Данная модель может быть получена из предыдущей идентифицируемой модели:
если наложить ограничения на ее параметры, а именно: b12 =a11
В результате первое уравнение стало сверхидентифицируемым: Н= 1 (у1 ),
D = 1(х2 ) и D +1 Н. Второе уравнение не изменилось и является точно идентифицируемым: Н = 2 и D =1
На первом шаге найдем приведенную форму модели, а
именно:
ДМНК является наиболее общим и широко распространенным методом решения системы одновременных уравнений.
Несмотря на важность системы эконометрических уравнений, на практике часто не принимают во внимание некоторые взаимосвязи, применение традиционного МНК к одному или нескольким уравнениям также широко распространено в эконометрике. В частности, при построении производственных функций анализ спроса можно вести, используя обычный МНК.
№22 ОСНОВНЫЕ ЭЛЕМЕНТЫ ВРЕМЕННОГО РЯДА.
Временной ряд — это совокупность значений какого-либо показателя за несколько последовательных моментов или периодов времени. Каждый уровень временного ряда формируется под воздействием большого числа факторов, которые условно можно подразделить на три группы:
• факторы, формирующие тенденцию ряда;
• факторы, формирующие циклические колебания ряда;
• случайные факторы.
При различных сочетаниях в изучаемом явлении или процессе этих факторов зависимость уровней ряда от времени может принимать различные формы. Во-первых, большинство временных рядов экономических показателей имеют тенденцию, характеризующую совокупное долговременное воздействие множества факторов на динамику изучаемого показателя. Очевидно, что эти факторы, взятые в отдельности, могут оказывать разнонаправленное воздействие на исследуемый показатель. Однако в совокупности они формируют его возрастающую или убывающую тенденцию. Рис1
Во-вторых, изучаемый показатель может быть подвержен циклическим колебаниям. Эти колебания могут носить сезонный характер, поскольку экономическая деятельность ряда отраслей экономики зависит от времени года рис2 Некоторые временные ряды не содержат тенденции и циклической компоненты, а каждый следующий их уровень образуется как сумма среднего уровня ряда и некоторой (положительной или отрицательной) случайной компоненты. Рис3
В большинстве случаев фактический уровень временного ряда можно представить как сумму или произведение трендовой, циклической и случайной компонент. Модель, в которой временной ряд представлен как сумма перечисленных компонент, называется аддитивной моделью временного ряда. Модель, в которой временной ряд представлен как произведение перечисленных компонент, называется мультипликативной моделью временного ряда. Основная задача эконометрического исследования от дельного временного ряда — выявление и придание количественного выражения каждой из перечисленных выше компонент с тем, чтобы использовать полученную информацию для прогнозирования будущих значений ряда или при построении моделей взаимосвязи двух или более временных рядов.
№23. АВТОКОРРЕЛЯЦИЯ УРОВНЕЙ ВРЕМЕННОГО РЯДА
Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда. Количественно ее можно измерить с помощью линейного коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени. Коэффициент корреляции имеет вид:
можно определить коэффициенты автокорреляции второго и более высоких порядков. Так, коэффициент автокорреляции второго порядка характеризует тесноту связи между уровнями у t и yt -1 и определяется по формуле:
Число периодов, по которым рассчитывается коэффициент автокорреляции, называют лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается.
Отметим два важных свойства коэффициента автокорреляции. Во-первых, он строится по аналогии с линейным коэффициентом корреляции и таким образом характеризует тесноту только линейной связи текущего и предыдущего уровней ряда.
Во-вторых, по знаку коэффициента автокорреляции нельзя делать вывод о возрастающей или убывающей тенденции в уровнях ряда.
Последовательность коэффициентов автокорреляции уровней первого, второго и т. д. порядков называют автокорреляцион ной функцией временного ряда. График зависимости ее значений от величины лага называется коррелограммой.
№24. МОДЕЛИРОВАНИЕ ТЕНДЕНЦИЙ ВРЕМЕННОГО РЯДА (АНАЛИТИЧЕСКОЕ ВЫРАВНИВАНИЕ ВРЕМЕННОГО РЯДА)
Одним из наиболее распространенных способов моделирования тенденции временного ряда является построение аналитической функции, характеризующей зависимость уровней ряда от времени, или тренда. Этот способ называют аналитическим вы равниванием временного ряда.
Поскольку зависимость от времени может принимать разные формы, для ее формализации можно использовать различные виды функций. Для построения трендов чаще всего применяются следующие функции:
• линейный тренд:
• гипербола: ,
• экспоненциальный тренд:
• тренд в форме степенной функции:
• парабола второго и более высоких порядков:
Параметры каждого из перечисленных выше трендов можно определить обычным МНК, используя в качестве независимой переменной время t=1,2,..., n, а в качестве зависимой перемен- 1 ной — фактические уровни временного ряда yt . Существует несколько способов определения типа тенденции. К числу наиболее распространенных способов относятся качественный анализ изучаемого процесса, построение и визуальный анализ графика зависимости уровней ряда от времени, расчет некоторых основных показателей динамики. В этих же целях можно использовать и коэффициенты автокорреляции уровней ряда. Тип тенденции можно определить путем сравнения коэффициентов автокорреляции первого порядка, рассчитанных по исходным и преобразованным уровням ряда. Если временной ряд имеет линейную тенденцию, то его соседние уровни у t и у t -1 тесно коррелируют. В этом случае коэффициент автокорреляции первого порядка уровней исходного ряда должен быть высоким. Если временной ряд содержит нелинейную тенденцию, например, в форме экспоненты, то коэффициент автокорреляции первого порядка по логарифмам уровней исходного ряда будет выше, чем соответствующий коэффициент, рассчитанный по уровням ряда. Чем сильнее выражена нелинейная тенденция в изучаемом временно м ряде, тем в большей степени будут различаться значения указанных коэффициентов.
Выбор наилучшего уравнения в случае, если ряд содержит нелинейную тенденцию, можно осуществить путем перебора основных форм тренда, расчета по каждому уравнению скорректированного коэффициента детерминации R 2 и выбора уравнения тренда с максимальным значением скорректированного коэффициента детерминации.
№;25. ММЕТОДЫ ИСКЛЮЧЕНИЯ ТЕНДЕНЦИЙ. МЕТОД ОТКЛОНЕНИЙ ОТ ТРЕНДА.
Сущность всех методов исключения тенденции заключается в том, чтобы устранить или зафиксировать воздействие фактора времени на формирование уровней ряда. Основные методы исклю чения тенденции можно разделить на две группы:
• методы, основанные на преобразовании уровней исходного
ряда в новые переменные, не содержащие тенденции. Полученные переменные используются далее для анализа взаимосвязи изучаемых временных рядов. Эти методы предполагают непосредственное устранение трендовой компоненты Т
из каждого уровня временного ряда. Два основных метода в
данной группе — это метод последовательных разностей и
метод отклонений от трендов;
• методы, основанные на изучении взаимосвязи исходных
уровней временных рядов при элиминировании воздействия
фактора времени на зависимую и независимые переменные
модели. В первую очередь это метод включения в модель регрессии по временным рядам фактора времени.
Рассмотрим подробнее методику применения, преимущества и недостатки каждого из перечисленных выше методов. Метод отклонений от тренда
Пусть имеются два временных ряда xt и yt каждый из которых содержит трендовую компоненту Т и случайную компоненту е. Проведение аналитического выравнивания по каждому из этих рядов позволяет найти параметры соответствующих уравнений трендов и определить расчетные по тренду уровни соответственно. Эти расчетные значения можно принять за оценку трендовой компоненты Т каждого ряда. Поэтому влияние тенденции можно устранить путем вычитания расчетных значений уровней ряда из фактических. Эту процедуру проделывают для каждого временного ряда в модели. Дальнейший анализ взаимосвязи рядов проводят с использованием не исходных уровней, а отклонений от тренда и при условии, что последние не содержат тенденции.
№26. МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ РАЗНОСТЕЙ .
В ряде случаев вместо аналитического выравнивания временного ряда с целью устранения тенденции можно применить более простой метод — метод последовательных разностей.
Если временной ряд содержит ярко выраженную линейную тенденцию, ее можно устранить путем замены исходных уровней ряда цепными абсолютными приростами (первыми разностями).
Пусть (1) ;
Тогда (6.3) Тогда
Коэффициент b — константа, которая не зависит от времени.
Если временной ряд содержит тенденцию в форме параболы второго порядка, то для ее устранения можно заменить исходные уровни ряда на вторые разности.
Пусть имеет место соотношение (1), однако
Тогда
Как показывает это соотношение, первые разности t , непосредственно зависят от фактора времени t и, следовательно, содержат тенденцию.
Определим вторые разности:
Очевидно, что вторые разности t 2 , не содержат тенденции, поэтому при наличии в исходных уровнях тренда в форме параболы второго порядка их можно использовать для дальнейшего анализа. Если тенденции временного ряда соответствует экспоненциальный или степенной тренд, метод последовательных разностей следует применять не к исходным уровням ряда, а к их логарифмам.
№27. ВКЛЮЧЕНИЕ В МОДЕЛЬ РЕГРЕССИИ ФАКТОРА ВРЕМЕНИ.
В корреляционно-регрессионном анализе устранить воздействие какого-либо фактора можно, если зафиксировать воздействие этого фактора на результат и другие включенные в модель факторы. Этот прием широко используется в анализе временных рядов, когда тенденция фиксируется через включение фактора времени в модель в качестве независимой переменной.
Модель вида относится к группе моделей, включающих фактор времени. Очевидно, что число независимых переменных в такой модели может быть больше единицы. Кроме того, это могут быть не только текущие, но и лаговые значения независимой переменной, а также лаговые значения результативной переменной. Преимущество данной модели по сравнению с методами отклонений от трендов и последовательных разностей в том, что она позволяет учесть всю информацию, содержащуюся в исходных данных, поскольку значения yt и х t есть уровни исходных временных рядов. Кроме того, модель строится по всей совокупности данных за рассматриваемый период в отличие от метода последовательных разностей, который приводит к потере числа наблюдений. Параметры а и b модели с включением фактора времени определяются обычным МНК.
Система нормальных уравнений имеет вид:
№28 .АВТОКОРРЕЛЯЦИЯ В ОСТАТКАХ. КРИТЕРИЙ ДАРБИНА-УОТСОНА.
Существуют два наиболее распространенных метода определения автокорреляции остатков. Первый метод — это построение графика зависимости остатков от времени и визуальное определение наличия или отсутствия автокорреляции. Второй метод — использо вание критерия Дарбина — Уотсона и расчет величины
(1)
Таким образом, d есть отношение суммы квадратов разностей последовательных значений остатков к остаточной сумме квадратов по модели регрессии. Можно предположить что: , предположим также
Коэффициент автокорреляции остатков определяется как
С учетом (3) имеем:
Таким образом, если в остатках существует полная положительная автокорреляция и , то d = 0. Если в остатках полная отрицательная автокорреляция, то и, следовательно, d = 4.Если автокорреляция остатков отсутствует, то и d = 2. Следовательно, 0d4
Алгоритм выявления автокорреляции остатков на основе критерия Дарбина — Уотсона следующий. Выдвигается гипотеза Н0 об отсутствии автокорреляции остатков. Альтернативные гипотезы Н1 Н1 * состоят, соответственно, в наличии положительной или отрицательной автокорреляции в остатках. Далее по специальным таблицам определяются критические значения критерия Дарбина — Уотсона dl и du для заданного числа наблюдений n, числа независимых переменных модели к и уровня значимости . По этим значениям числовой промежуток [0;4] разбивают на пять отрезков. Если фактическое значение критерия Дарбина — Уотсона попадает в зону неопределенности, то на практике предполагают существование автокорреляции остатков и отклоняют гипотезу Hо .
№29 . ОБЩАЯ ХАРАКТЕРИСТИКА МОДЕЛЕЙ С РАСПРЕДЕЛЕННЫМ ЛАГОМ. ИНТЕРПРИТАЦИЯ ПАРАМЕТРОВ МОДЕЛЕЙ С РАСПРЕДЕЛЕННЫМ ЛАГОМ .
Величину L, характеризующую запаздывание в воздействии фактора на результат, называют в эконометрике лагом, а временные ряды самих факторных переменных, сдвинутые на один ил более моментов времени, — лаговыми переменными.
Эконометрическое моделирование осуществляется с применением моделей, содержащих не только текущие, но и лаговые значения факторных переменных. Эти модели называются моделями с распределенным лагом. Модель вида
является примером модели с распределенным лагом.
Наряду с лаговыми значениями независимых, или факторных, переменных на величину зависимой переменной текущего периода могут оказывать влияние ее значения в прошлые моменты или периоды времени. Эти процессы обычно описывают с помощью моделей регрессии, содержащих в качестве факторов лаговые значения зависимой переменной, которые называются моделями авторегрессии. Модель вида
относится к моделям авторегрессии. Построение моделей с распределенным лагом и моделей авторегрессии имеет свою специфику. Во-первых, оценка параметров моделей авторегрессии, а в большинстве случаев и моделей с распределенным лагом не может быть произведена с помощью обычного МНК ввиду нарушения его предпосылок и требует специальных статистических методов. Во-вторых, исследователям приходится решать проблемы выбора оптимальной величины лага и определения его структуры. Наконец, в-третьих, между моделями с распределенным лагом и моделями авторегрессии существует определенная взаимосвязь, и в некоторых случаях необходимо осуществлять переход от одного типа моделей к другому. Интерпретация параметров моделей с распределительным лагом. Рассмотрим модель с распределенным лагом в ее общем виде в предположении, что максимальная величина лага конечна:
Эта модель говорит о том, что если в некоторый момент времени t происходит изменение независимой переменной х, то это изменение будет влиять на значения переменной у в течение l следующих моментов времени.
Коэффициент регрессии b0 при переменной xt характеризует среднее абсолютное изменение у t при изменении х t на 1 ед. своего измерения в некоторый фиксированный момент времени t , без учета воздействия лаговых значений фактора x. Этот коэффициент называют краткосрочным мультипликатором.
В момент (t+1) совокупное воздействие факторной переменной xt на результат уt , составит (b0 + b1 ) усл. ед., в момент (t+2) это воздействие можно охарактеризовать суммой ( b 0 + b 1 + b 2 ) и т. д. Полученные таким образом суммы называют промежуточными мультипликаторами.
Введем следующее обозначение:
b0 +b1 +…+bl =b
Величину b называют долгосрочным мультипликатором. Он показывает абсолютное изменение в долгосрочном периоде t + l результата у под влиянием изменения на 1 ед. фактора х.
Предположим
j =bj /b, j=0:1
Назовем полученные величины относительными коэффициен тами модели с распределенным лагом. Сред ний лаг определяется по формуле средней арифметической взвешенной: и представляет собой средний период, в течение которого будет происходить изменение результата под воздействием изменения фактора в момент времени t . Небольшая величина среднего лага свидетельствует об относительно быстром реагировании результата на изменение фактора, тогда как высокое его значение говорит о том, что воздействие фактора на результат будет сказываться в течение длительного периода времени. Медианный лаг — это величина лага, для которого
Это тот период времени, в течение которого с момента времени t будет реализована половина общего воздействия фактора на результат.
№ 30 МЕТОД АЛМОНА.
В методе А. предполагается ,что веса текущих лаговых значений объясняющих переменных подчиняются палениальному распределению. bj = c0 +c1 j+ c2 j2 +…+ ck jk
Уравнение регрессии примет вид yt = a+c0 z0 +c1 z1 + c2 z2 + ck zk +t , где zi =; i=1,…,k; j=1,…,p. Расчет параметров модели с распределенным лагом проводится по следующей схеме:
1. Устанавливается макси. величина лага l.
2. Определяется степень паленома k,описывающего структуру лага.
3. Рассчитывается значение переменных с z0 до zk .
4. Определяются параметры уравнения линейной регрессии yt (zi ).
5. Рассчитываются параметры исходной модели с распределенным лагом.
№ 31 МЕТОД КОЙКА.
В распределение Койка делается предположение, что коэффициенты при лаговых значениях объясняющей переменной убывают в геометрической прогрессии. bl =b0 l ; l=0,1,2,3; 0 1. Уравнение регрессии преобразовывается к виду:
yt =a+b0 xt +b0 xt -1 +b0 2 xt -2 +…+ t . После несложных преобразований получаем ур-ие оценки параметров исходящего ур-ия.
№ 32 МЕТОД ГЛАВНЫХ КОМПОНЕНТ.
Суть метода — сократить число объясняющих переменных до наиболее существенно влияющих факторов. Метод главных компонент применяется для исключения или уменьшения мультиколлинеарности объясняющих переменных регрессии. Основная идея заключается в сокращении числа объясняющих переменных до наиболее существенно влияющих факторов. Это достигается путем линейного преобразования всех объясняющих переменных xi (i=0,..,n) в новые переменные, так называемые главные компоненты. При этом требуется, чтобы выделению первой главной компоненты соответствовал максимум общей дисперсии всех объясняющих переменных xi (i=0,..,n). Второй компоненте — максимум оставшейся дисперсии, после того как влияние первой главной компоненты исключается и т. д.
№ 33 МОДЕЛИ АВТОРЕГРЕССИИ. ОЦЕНКА ПАРАМЕТРОВ МОДЕЛЕЙ АВТОРЕГРЕССИИ.
Модели содержащие в качестве факторов лаговые знач. зависимой переменной называются моделями авторегрессии. Н-р yt =a+b0 xt +c1 yt -1 + t . Как и в модели с распределенным лагом b0 и в этой модели характеризует краткосрочные изменения yt под воздействием изменения х1 на 1 ед. Долгосрочный мультипликатор в модели авторегрессии рассчитывается как сумма краткосрочного и промежуточных мультипликаторов b = b0 +b0 c1 +b0 c1 2 +b0 c1 3 +…=b0 (1+c1 +c1 2 +c1 3 +…)=b0 /1-c1
Отметим, что такая интерпретация коэффициентов модели авторегрессии и расчет долгосрочного мультипликатора основаны на предпосылке о наличие бесконечного лага в воздействии текущего знач. зависимой переменной на ее будущее знач.
Одним из возможных методов расчета параметров уравнения авторегрессии является метод инструментальных переменных. Сущность этого метода состоит в том, чтобы заменить переменную из правой части модели, для которой нарушаются предпосылки МНК, на новую переменную, включение которой в модель регрессии не приводит к нарушению его предпосылок. Применительно к моделям авторегрессии необходимо удалить из правой части модели переменную yt -1 . Искомая новая переменная, которая будет введена в модель вместо yt -1ь должна иметь два свойства. Во-первых, она должна тесно коррелировать с yt -1ь во-вторых, она не должна коррелировать с остатками ur .
Еще один метод, который можно применять для оценки параметров моделей авторегрессии типа — это метод максимального правдоподобия
№34 ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ. ????????????????????
№ 35 МЕТОД ПОДВИЖНОГО (СКОЛЬЗЯЩЕГО) СРЕДНЕГО.
Метод простого скользящего ср. состоит в том, что расчет показателя на прогнозируемый момент времени строится путем усреднения значения этого показателя за несколько предшествующих моментов времени.
где хk - i – реальное знач. показателя в момент времени tn -1.
n- число предшествующих моментов времени использующих при расчете.
fk – прогноз на момент времени tk .
№ 36 МЕТОД ЭКСПОНЕНЦИАЛЬНОГО СГЛАЖИВАНИЯ.
Учитываются отклонения предыдущего прогноза от реального показателя а сам расчет проводится по след. формуле:
где xk -1 – реальное значение показателя в момент времени tk -1 .
fk – прогноз на момент времени tk .
– постоянное сглаживание.
Замечание: знач. подчиняется условию 0‹ ‹ 1, определяет степень сглаживания и обычно выбирается универсальным методом проб и ошибок.
№ 37 МЕТОД ПРОЕЦИРОВАНИЯ ТРЕНДА.
Основной идеей метода проецирования линейного тренда является построение прямой, которая в среднем наименее уклоняется от массива точек заданного временным рядом. Прямая ищется в виде: x = at + b (a и b -постоянные). Величины a и b удовлетворяют. следующей линейной системе:
№38. КАЗУАЛЬНЫЕ МЕТОДЫ ПРОГНОЗИРОВАНИЯ. КАЧЕСТВЕННЫЕ МЕТОДЫ ПРОГНОЗИРОВАНИЯ. ????????????????