Нахождение полиноминальной аппроксимации методом наименьших квадратов
СОДЕРЖАНИЕ: Построение теоретико-вероятностной модели исследуемого явления случайной величины математическими выводами. Реализация выборки статистической моделью, описывающей серию опытов. Точечная (выборочная) оценка неизвестного параметра и кривая регрессии.Московский Авиационный Институт
(государственный технический университет)
Курсовая работа по
«теории вероятностей и математической статистике»
на тему:
Нахождение полиноминальной аппроксимации методом наименьших квадратов
Вариант №2
Выполнила: Студентка группы 05-202
Андреева Виктория
Принял: Преподаватель кафедры 804
Молчанов Игорь Иванович
Москва
2010 г.
ЗАДАНИЕ (вариант № 2) : Даны результаты измерений случайного процесса в равноотстоящие моменты времени (реализация временного ряда).
13,393 13,207 13,477 11,911 14,311 14,979 14,437 14,957 13,044 12,142
12,000 11,496 12,927 11,849 11,612 10,401 8,755 8,185 9,681 9,644
9,073 8,535 9,062 7,602 9,164 6,913 7,749 5,543 5,901 5,901
6,760 4,593 6,131 3,651 3,796 3,663 3,068 3,008 2,809 0,333
1,730 -0,072 0,479 -3,180 -2,962 -5,849 -6,153 -7,911 -10,134 -11,662
Измерения производятся с шагом по аргументу 0,08
ЦЕЛЬ РАБОТЫ: Требуется найти полиноминальную аппроксимацию этого процесса методом наименьших квадратов.
Теоретическая часть
Математическая статистика – наука о математических методах, позволяющих по статистическим данным, например по реализацией случайной величины (СВ), построить теоретико-вероятностную модель исследуемого явления. Задачи математической статистики являются, в некотором смысле, обратными к задачам теории вероятностей. Центральным понятием математической статистики является выборка.
Выборка
Однородной выборкой (выборкой) объема n при называется случайный вектор , компоненты которого , называемые элементами выборки, являются независимыми СВ с одной и той же функцией распределения F ( x ) . Будем говорить, что выборка соответствует функции распределения F ( x ) .
Реализацией выборки называется неслучайный вектор , компонентами которого являются реализации соответствующих элементов выборки .
Из вышеописанных определений вытекает, что реализацию выборки можно также рассматривать как последовательность из n реализаций одной и той же СВ X , полученных в серии из n независимых одинаковых опытов, проводимых в одинаковых условиях. Поэтому можно говорить, что выборка порождена наблюдаемой СВ X , имеющей распределение.
Если компоненты вектора независимы, но их распределения различны, то такую выборку называют неоднородной .
Множество S всех реализаций выборки называется выборочным пространством .
Выборочное пространство может быть всем n -мерным евклидовым пространством или его частью, если СВ X непрерывна, а также может состоять из конечного или счетного числа точек из , если СВ X дискретна.
На практике при исследовании конкретного эксперимента распределения СВ редко бывают известны полностью. Часто априори (до опыта) можно лишь утверждать, что распределение случайного вектора принадлежит некоторому классу (семейству) .
Пара ( S , F ) называется статистической моделью описания серии опытов , порождающих выборку .
Если распределение из класса F определены с точностью до некоторого векторного параметра , то такая статистическая модель называется параметрической и обозначается .
В некоторых случаях выборочное пространство может не зависеть от неизвестного параметра распределения .
В зависимости от вида статистической модели в математической статистике формулируются соответствующие задачи по обработке информации, содержащейся в выборке.
СВ , где - произвольная функция, определенная на выборочном пространстве S и не зависящая от распределения , называется статистикой.
Кривая регрессии.
регрессия вероятность статистический опыт
Условное математическое ожидание СВ как функция параметра называется регрессией на . График функции называется кривой регрессии на .
Точечная оценка.
Точечной (выборочной) оценкой неизвестного параметра распределения называется произвольная статистика построенная на выборке и принимающая значения в множестве .
Оценка параметра называется несмещенной, если ее МО равно , т. е. для любого .
Оценка параметра называется состоятельной, если она сходится по вероятности к , т. е. при для любого .
Оценка параметра называется сильно состоятельной, если она сходится почти наверное к , т. е. при для любого .
Очевидно, что если оценка сильно состоятельная, то она является также состоятельной.
Доверительный интервал.
Чтобы дать представление о точности и надежности оценки , в математической статистике пользуются так называемыми доверительными интервалами и доверительными вероятностями .
Пусть для параметра получена из опыта несмещенная оценка . Назначим некоторую достаточно большую вероятность (например, или 0,99) такую, что событие с вероятностью можно считать практически достоверным, и найдем такое значение , для которого
Тогда диапазон практически возможных значений ошибки, возникающей при замене на , будет ; большие по абсолютной величине ошибки будут появляться только с малой вероятностью
Вероятность принято называть доверительной вероятностью , а интервал - доверительным интервалом . Границы интервала : и называются доверительными границами .
Интервальные оценки.
Пусть имеется параметрическая статическая модель , и по выборке , соответствующей распределению наблюдаемой СВ , требуется определить неизвестный параметр . Вместо точечных оценок, рассмотренных ранее, рассмотрим другой тип оценок неизвестного параметра .
Интервал со случайными концами, «накрывающий» с вероятностью , , неизвестный параметр , т. е.
,
называется доверительным интервалом (или интервальной оценкой ) уровня надежности параметра .
Число называется доверительной вероятностью или уровнем доверия .
Уровень значимости.
Уровнем значимости статистического критерия называется вероятность ошибки 1-го рода . Вероятность ошибки 1-го рода может быть вычислена, если известно распределение .
Ошибки 1 и 2-го рода.
Ошибкой 1-го рода называется событие, состоящее в том, что гипотеза отвергается, когда она верна.
Ошибкой 2-го рода называется событие, состоящее в том, что принимается гипотеза , когда верна гипотеза .
Проверка статистических гипотез.
Статистической гипотезой H или просто гипотезой называется любое предположение относительно параметров или закона распределения СВ , проверяемое по выборке .
Проверяемая гипотеза называется основной (или нулевой ) и обозначается . Гипотеза, конкурирующая с , называется альтернативной и обозначается .
Статистическая гипотеза называется простой , если она однозначно определяет параметр или распределение СВ . В противном случае гипотеза называется сложной .
Статистическим критерием (критерием согласия, критерием значимости или решающим правилом) проверки гипотезы называется правило, в соответствии с которым по реализации статистики гипотеза принимается или отвергается.
Критической областью статистического критерия называется область реализаций статистики , при которых гипотеза отвергается.
Доверительной областью статистического критерия называется область значений статистики , при которых гипотеза принимается.
Практическая часть.
Этап 1 (Вычисление оценок , неизвестных коэффициентов регрессии , ):
;
;
- оценка полезного сигнала (кривая регрессии);
- ошибка;
Формулируем все ошибки:
.
Находим наименьшую ошибку. Для этого продифференцируем уравнение по a и по b , приравняем к 0, получив систему:
- система нормальных уравнений.
Решаем систему методом Крамера:
Расчетная схема для оценок по методу наименьших квадратов.
Номер | Y | X | y^2 | X*Y | x^2 | ^2=(y-at-b)^2 |
1 | 13,393 | -2 | 179,37245 | -26,786 | 4 | 84,52154547 |
2 | 13,207 | -1,92 | 174,42485 | -25,3574 | 3,6864 | 77,33345969 |
3 | 13,477 | -1,84 | 181,62953 | -24,7977 | 3,3856 | 63,01706699 |
4 | 11,911 | -1,76 | 141,87192 | -20,9634 | 3,0976 | 79,54344995 |
5 | 14,311 | -1,68 | 204,80472 | -24,0425 | 2,8224 | 35,20165139 |
6 | 14,979 | -1,6 | 224,37044 | -23,9664 | 2,56 | 21,89755599 |
7 | 14,437 | -1,52 | 208,42697 | -21,9442 | 2,3104 | 21,49126227 |
8 | 14,957 | -1,44 | 223,71185 | -21,5381 | 2,0736 | 12,46267515 |
9 | 13,044 | -1,36 | 170,14594 | -17,7398 | 1,8496 | 23,59662672 |
10 | 112,142 | -1,28 | 12575,828 | -143,542 | 1,6384 | 8991,966406 |
11 | 12 | -1,2 | 144 | -14,4 | 1,44 | 22,3767305 |
12 | 11,496 | -1,12 | 132,15802 | -12,8755 | 1,2544 | 21,61124277 |
13 | 12,927 | -1,04 | 167,10733 | -13,4441 | 1,0816 | 6,928339322 |
14 | 11,849 | -0,96 | 140,3988 | -11,375 | 0,9216 | 9,762864991 |
15 | 11,612 | -0,88 | 134,83854 | -10,2186 | 0,7744 | 7,705858746 |
16 | 10,401 | -0,8 | 108,1808 | -8,3208 | 0,64 | 11,56902772 |
17 | 8,755 | -0,72 | 76,650025 | -6,3036 | 0,5184 | 19,90687251 |
18 | 8,185 | -0,64 | 66,994225 | -5,2384 | 0,4096 | 19,76777254 |
19 | 9,681 | -0,56 | 93,721761 | -5,42136 | 0,3136 | 5,590769531 |
20 | 9,644 | -0,48 | 93,006736 | -4,62912 | 0,2304 | 3,29736681 |
21 | 9,073 | -0,4 | 82,319329 | -3,6292 | 0,16 | 3,244500827 |
22 | 8,535 | -0,32 | 72,846225 | -2,7312 | 0,1024 | 3,075233208 |
23 | 9,062 | -0,24 | 82,119844 | -2,17488 | 0,0576 | 0,410905071 |
24 | 7,602 | -0,16 | 57,790404 | -1,21632 | 0,0256 | 2,296447057 |
25 | 9,164 | -0,08 | 83,978896 | -0,73312 | 0,0064 | 0,399692323 |
26 | 6,913 | 0 | 47,789569 | 0 | 0 | 1,067444888 |
27 | 9,749 | 0,08 | 95,043001 | 0,77992 | 0,0064 | 5,704661232 |
28 | 5,543 | 0,16 | 30,724849 | 0,88688 | 0,0256 | 1,517679181 |
29 | 5,901 | 0,24 | 34,821801 | 1,41624 | 0,0576 | 0,083131718 |
30 | 5,901 | 0,32 | 34,821801 | 1,88832 | 0,1024 | 0,088381223 |
31 | 6,76 | 0,4 | 45,6976 | 2,704 | 0,16 | 3,034234095 |
32 | 4,593 | 0,48 | 21,095649 | 2,20464 | 0,2304 | 0,025766932 |
33 | 6,131 | 0,56 | 37,589161 | 3,43336 | 0,3136 | 5,217278758 |
34 | 3,651 | 0,64 | 13,329801 | 2,33664 | 0,4096 | 0,151906494 |
35 | 3,796 | 0,72 | 14,409616 | 2,73312 | 0,5184 | 1,255222992 |
36 | 3,663 | 0,8 | 13,417569 | 2,9304 | 0,64 | 2,474275069 |
37 | 3,068 | 0,88 | 9,412624 | 2,69984 | 0,7744 | 2,444839854 |
38 | 3,008 | 0,96 | 9,048064 | 2,88768 | 0,9216 | 4,364814626 |
39 | 2,809 | 1,04 | 7,890481 | 2,92136 | 1,0816 | 6,129731157 |
40 | 0,333 | 1,12 | 0,110889 | 0,37296 | 1,2544 | 0,342745729 |
41 | 1,73 | 1,2 | 2,9929 | 2,076 | 1,44 | 6,59493426 |
42 | -0,072 | 1,28 | 0,005184 | -0,09216 | 1,6384 | 1,827027788 |
43 | 0,479 | 1,36 | 0,229441 | 0,65144 | 1,8496 | 6,191594234 |
44 | -3,18 | 1,44 | 10,1124 | -4,5792 | 2,0736 | 0,34233389 |
45 | -2,962 | 1,52 | 8,773444 | -4,50224 | 2,3104 | 0,047752061 |
46 | -5,849 | 1,6 | 34,210801 | -9,3584 | 2,56 | 4,338314281 |
47 | -6,153 | 1,68 | 37,859409 | -10,337 | 2,8224 | 3,244489064 |
48 | -7,911 | 1,76 | 62,583921 | -13,9234 | 3,0976 | 8,842481446 |
49 | -10,134 | 1,84 | 102,69796 | -18,6466 | 3,3856 | 21,26146404 |
50 | -11,662 | 1,92 | 136,00224 | -22,391 | 3,6864 | 30,84025156 |
Сумма | 411,949 | -2 | 16631,368 | -504,296 | 66,72 | 9666,40808 |
Подставив найденные суммы в систему, получаем оценки :
=-7,320193878
=7,946172245
Этап 2 (Вычисление оценки неизвестной дисперсии шумов ):
, где
n – число измерений;
m – число неизвестных параметров.
Этап 3:
По таблице находим квантиль Стьюдента.
m/a | 0.85 | 0.9 | 0.95 | 0.975 |
47 | 1.0480 | 1.2998 | 1.6779 | 2.0117 |
48 | 1.0478 | 1.2994 | 1.6772 | 2.0106 |
49 | 1.0475 | 1.2991 | 1.6766 | 2.0096 |
50 | 1.0473 | 1.2987 | 1.6759 | 2.0086 |
Фрагмент таблицы 1
При =0,975 , квантиль Стьюдента 2.0086
Уровень доверия
;;
;
0,95 | 69,0225 | 30,7545 |
ymin | ymax |
25,9848632 | 19,188257 |
25,077453 | 18,924436 |
24,1700428 | 18,660615 |
23,2626327 | 18,396794 |
22,3552225 | 18,132973 |
21,4478123 | 17,869153 |
20,5404021 | 17,605332 |
19,632992 | 17,341511 |
18,7255818 | 17,07769 |
17,8181716 | 16,813869 |
16,9107614 | 16,550048 |
16,0033513 | 16,286227 |
15,0959411 | 16,022407 |
14,1885309 | 15,758586 |
13,2811208 | 15,494765 |
12,3737106 | 15,230944 |
11,4663004 | 14,967123 |
10,5588902 | 14,703302 |
9,65148007 | 14,439482 |
8,7440699 | 14,175661 |
7,83665973 | 13,91184 |
6,92924956 | 13,648019 |
6,02183939 | 13,384198 |
5,11442921 | 13,120377 |
4,20701904 | 12,856556 |
3,29960887 | 12,592736 |
2,3921987 | 12,328915 |
1,48478853 | 12,065094 |
0,57737835 | 11,801273 |
-0,3300318 | 11,537452 |
-1,237442 | 11,273631 |
-2,1448522 | 11,009811 |
-3,0522623 | 10,74599 |
-3,9596725 | 10,482169 |
-4,8670827 | 10,218348 |
-5,7744928 | 9,9545271 |
-6,681903 | 9,6907063 |
-7,5893132 | 9,4268854 |
-8,4967234 | 9,1630646 |
-9,4041335 | 8,8992437 |
-10,311544 | 8,6354229 |
-11,218954 | 8,371602 |
-12,126364 | 8,1077812 |
-13,033774 | 7,8439603 |
-13,941184 | 7,5801395 |
-14,848595 | 7,3163186 |
-15,756005 | 7,0524978 |
-16,663415 | 6,788677 |
-17,570825 | 6,5248561 |
-18,478235 | 6,2610353 |
Список литературы
1. Е.С. Кочетков “Метод наименьших квадратов”, Москва, МАИ, 1993.
2. А.И. Кибзун “Теория вероятностей и математическая статистика. Базовый курс с примерами и задачами”, Москва, «Физматлит», 2002.
3. Е.С. Вентцель “ Теория вероятностей ”, Москва, «Высшая школа», 1999.