Таким образом, среди пяти факторов было отобрано такие два фактора, статистическая зависимость между которыми достаточно слабая (чем слабее, тем лучше), но связь каждого из них с показателем Y сильнее, чем между собой.
Рассчитаем параметры уравнения двухфакторной линейной регрессии Y = a0+a1X2+a2X5 с помощью Метода наименьших квадратов (МНК).
В соответствии с этим методом, для расчета параметров данного уравнения, необходимо построить и решить систему нормальных уравнений (1), которая имеет вид:
na0 + a1 ?xi + a2?xj= ?y;
a0 ?xi + a1 ?xi2 + a2 ?xi xj= ?yxi;
a0 ?xj + a1 ?xi xj + a2 ?xj2= ?yxj;
Чтобы составить такую систему, вначале необходимо рассчитать все суммы (?xi , ?xi , ?y,…и т.д.), являющиеся коэффициентами при неизвестных в системе, заполнив вспомогательную таблицу 2 приложения.
Затем построенная система уравнений решается методом определителей.
Вначале находится определитель матрицы коэффициентов при неизвестных:
n | ? Xi | ? Xj | ||
? | = | ? Xi | ? Xi2 | ? Xi Xj |
? Xj | ? Xi Xj | ? X j2 |
Потом поочередно каждый столбец данной матрицы заменяют столбцом свободных членов системы (1), т.е. столбцом и находят три других определителя ?0, ?1, ?2. Наконец, рассчитываются коэффициенты системы по формулам: a0 = ; a1 = ; a2 =
Расчет определителей: ?0, ?1, ?2, ?3
28 | 44,374 | 2,1 | 1001998,606 | |||||
? = | 44,374 | 76,379692 | 3,247445 | = | 2,910870272 | 1421400,164 | ||
2,1 | 3,247445 | 0,175738 | 803594588 | |||||
(определитель матрицы коэффициентов системы) | (столбец свободных членов) | |||||||
1001998,606 | 44,374 | 2,1 | |||
?0 = | 1421400,164 | 76,379692 | 3,247445 | = | 182265,7323 |
803594588 | 3,247445 | 0,175738 |
28 | 1001998,61 | 2,1 | |||
?1 = | 44,374 | 1421400,16 | 3,247445 | = | -73295,83668 |
2,1 | 80359459 | 0,175738 |
28 | 44,374 | 1001998,606 | |||
?2 = | 44,374 | 76,379692 | 1421400,164 | = | 507465,1936 |
2,1 | 3,247445 | 803594588 |
Расчет параметров уравнения регрессии:
а0 = 62615,54
а1= -251804
а2 = 174334,52
Уравнение зависимости выручки, компании МТС от Х1 — APPM (средняя цена за 1 минуту разговора) и Х3 — Churn rate (коэффициент оттока абонентов):
Y = 62615,54-251804*X1+174334,52*X3
Оценим значимость построенного уравнения с помощью критерия Фишера. Формула для расчета критерия Фишера имеет вид:
F = , где R2 – индекс детерминации, n – длина ряда, m – число параметров регрессии. Расчетное значение критерия Фишера сравнивают с табличным (для случая, когда длина ряда равна 20, а m=3, 2 Fтабл =3,8). Если расчетное значение превышает табличное, можно сделать вывод о значимости