Статистические методы обработки выборочных данных наблюдений или экспериментов

СОДЕРЖАНИЕ: Первичный анализ экспериментальных данных. Построение эмпирической плотности распределения случайной анализируемой величины и расчет ее характеристик. Определение вида закона распределения величины и расчёт его параметров при помощи метода моментов.

ФЕДЕРАЛЬНОЕ АГЕНСТВО ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСТЕТ ПУТЕЙ СООБЩЕНИЯ (МИИТ)

Институт транспортной техники и организации производства

(ИТТОП)

Кафедра: «Локомотивы и локомотивное хозяйство»

Курсовой проект

на тему:

«Статистические методы обработки выборочных данных наблюдений или экспериментов»

Выполнил: студент Краснов М.А.

группы ТЛТ-451

Принял: Пузанков А.Д.

Москва 2009


СОДЕРЖАНИЕ

1. ПЕРВИЧНЫЙ АНАЛИЗ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

2. ПОСТРОЕНИЕ ЭМПИРИЧЕСКОЙ ПЛОТНОСТИ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ АНАЛИЗИРУЕМОЙ ВЕЛИЧИНЫ И РАСЧЕТ ЕЕ ХАРАКТЕРИСТИК

3. ОПРЕДЕЛЕНИЕ ВИДА ЗАКОНА РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ И РАСЧЕТ ЕГО ПАРАМЕТРОВ ПРИ ПОМОЩИ МЕТОДА МОМЕНТОВ

4. ОПРЕДЕЛЕНИЕ ВИДА ТЕОРЕТИЧЕСКОГО ЗАКОНА РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ ГРАФИЧЕСКИМ МЕТОДОМ


1. Первичный анализ экспериментальных данных

Запишем полученные значения в вариационный ряд в возрастающем порядке:

Таблица 1.

16,4

21,6

35,46

38,76

39,84

40,65

44,25

46,73

47,62

50,25

50,25

51,02

51,8

55,22

55,25

55,55

61,73

63,3

64,93

67,56

68,5

68,5

71,94

73

73,53

73,53

74,07

77,52

78,12

78,74

78,74

80,64

85,47

86,2

87,72

90,1

92,6

94,34

95,24

96,15

99,01

99,01

106,4

108,6

116,28

133,3

135,13

137

144,93

149,25

153,84

161,3

166,7

172,4

172,4

175,44

178,6

178,6

185,18

192,3

208,33

212,76

227,27

232,56

238,1

243,9

256,41

277,8

277,8

285,7

285,71

285,71

322,6

322,6

344,83

370,4

370,4

370,4

384,6

420,6

526,3

555,55

588,23

943,4

xmax = 943,4; xmin = 16,4

Результат последних двух измерений вызывает сомнения. Поэтому выполняем проверку:

Величину выборочного среднего находим из соотношения:

(1)

Корень квадратный из дисперсии, взятый с положительным знаком, называется среднеквадратическим отклонением и рассчитывается по формуле:

(2)

Упрощённая проверка сомнительного результата на брак выполняется из условия:

Таким образом, по упрощенной проверке результат сомнительного измерения браком являются последнее одно значение, отбрасываем их и пересчитываем и :

Проверяем по упрощённой проверки:

Таким образом, по упрощенной проверке результат сомнительного измерения браком являются последние два значения, отбрасываем их и пересчитываем и :

Таким образом, по упрощенной проверке результат сомнительного измерения браком являются последнее одно значение, отбрасываем их и пересчитываем и :

Таким образом, по упрощенной проверке результат сомнительного измерения не является браком.

Так же выполним подобную проверку с помощью критерия Ирвина:

Таким образом, по расчётам обеих проверок результат последнего сомнительного измерения не является браком.

Из этого следует, что нужно произвести повторный расчёт, но уже без данного измерения:

2. Построение эмпирической плотности распределения случайной анализируемой величины и расчёт её характеристик

Определяем размах имеющихся данных, т.е. разности между наибольшим и наименьшим выборочным значениями (R = Xmax – Xmin):

Выбор числа интервалов группировки k при числе наблюдений n100 – ориентировочное значение интервалов можно рассчитать с использованием формулы Хайнхольда и Гаеде:

Тогда ширина интервала:


Результат подсчёта частот и характеристик эмпирического распределения

Таблица 2.

Границы интервала

группировки

Ср.знач.

интерв.

Распределение

данных

fi

U

U*f

U^2*f

16,4…61,31

38,86

////////////////

16

-1

-16

16

61,31…106,22

83,77

//////////////////////////

26

0

0

0

106,22…151,13

128,68

////////

8

1

8

8

151,13…196,04

173,59

//////////

10

2

20

40

196,04…240,96

218,50

/////

5

3

15

45

240,96…285,87

263,41

/////

5

4

20

80

285,87…330,78

308,32

////

4

5

20

100

330,78…375,69

353,23

////

4

6

24

144

375,69…420,60

398,14

//

2

7

14

98

ИТОГО

80

105

531

Принимаем «ложный нуль» x0 =83,77 и обозначаем нулем тот интервал, которому соответствует максимальная частота (f=26). Далее, для интервалов, следующих к наименьшему наблюдаемому значению вписываем -1, -2 … и 1, 2, … для интервалов, следующих к наибольшему значению наблюдаемой величины.

Выборочное среднее х и среднеквадратическое отклонение Sx рассчитываем, используя следующие выражения:

(3)


Для построения гистограммы, приведённой на рис.1, по оси абсцисс в выбранном масштабе отмечаем границы интервалов. Левая ось размечается масштабом частот, а на правую, в случае необходимости, можно нанести шкалу относительных частот. На чистом поле гистограммы указываются значения: числа данных; среднего арифметического; среднеквадратического отклонения.

Рис.1

Помимо гистограммы эмпирические данные измерений случайной величины могут быть представлены в виде кумулятивной кривой функции распределения вероятностей. Для этого данные, представленные в табл.1., должны быть дополнены частостями (см. табл.2.).

Частость находим из соотношения:

Таблица частот f и частостей .

Таблица 3.

Границы интервала

группировки

Частота,fi

Частость,

i

Накопленная

частость, н

16,4…61,31

16

0,20

0,20

61,31…106,22

26

0,33

0,53

106,22…151,13

8

0,10

0,63

151,13…196,04

10

0,13

0,75

196,04…240,96

5

0,06

0,81

240,96…285,87

5

0,06

0,88

285,87…330,78

4

0,05

0,93

330,78…375,69

4

0,05

0,98

375,69…420,60

2

0,03

1,00

ИТОГО

80

1

Рис. 2


3. Определение вида закона распределения случайной величины и расчёт его параметров при помощи метода моментов

Экспоненциальный (нормальный) закон распределения

Параметр закона распределения:

Таблица 4

xi

103 км

fi

шт

*xi

e-*xi

(xi)

10-6

fi’

шт

1

38,86

16

0,270

0,763

0,531

19,08

0,50

2

83,77

26

0,583

0,558

0,388

13,96

10,39

3

128,68

8

0,895

0,408

0,284

10,21

0,48

4

173,59

10

1,208

0,299

0,208

7,47

0,86

5

218,50

5

1,520

0,219

0,152

5,47

0,04

6

263,41

5

1,833

0,160

0,111

4,00

0,25

7

308,32

4

2,145

0,117

0,081

2,93

0,39

8

353,23

4

2,458

0,086

0,060

2,14

1,62

9

398,14

2

2,770

0,063

0,044

1,57

0,12

ИТОГО:

80

14,64

Рис. 4


Нормальный закон распределения двухпараметрический, число степеней свободы = 7 и = 14,067.

Так как 2 0,05 2 , то гипотеза о принадлежности эмпирической выборки значений, экспоненциальному закону распределения отвергается

Распределение Вейбулла - Гнеденко

Величина выборочного коэффициента вариации:

По данным приложения таблица П1,2:

Таблица 5

Xi

103 км

fi

шт

xi/a

a* (xi)

(xi)

10-6

fi’

шт

1

38,86

16

0,246

0,6944

4,4017

15,81

0,00

2

83,77

26

0,531

0,7197

4,5618

16,39

5,63

3

128,68

8

0,816

0,6085

3,8567

13,86

2,48

4

173,59

10

1,100

0,4637

2,9393

10,56

0,03

5

218,50

5

1,385

0,3293

2,0870

7,50

0,83

6

263,41

5

1,670

0,2213

1,4029

5,04

0,00

7

308,32

4

1,954

0,1422

0,9014

3,24

0,18

8

353,23

4

2,239

0,0879

0,5570

2,00

2,00

9

398,14

2

2,524

0,0525

0,3325

1,19

0,54

ИТОГО:

80

75,60

11,69


Рис. 5

Нормальный закон распределения двухпараметрический, число степеней свободы = 6 и = 12,592.

Так как 2 0,05 2 , то эмпирическая выборка значений пренадлежит закону распределения Вейбулла - Гнеденко

Нормальный (Гауссовский) закон распределения

Таблица 6

Xi

103 км

fi

ti

(ti)

10-2

(xi)

fi’

щт

1

38,86

16

-1,025

0,231

0,101

8,09

7,72

2

83,77

26

-0,586

0,328

0,144

11,52

18,18

3

128,68

8

-0,147

0,386

0,169

13,53

2,26

4

173,59

10

0,292

0,374

0,164

13,11

0,74

5

218,50

5

0,731

0,298

0,131

10,48

2,86

6

263,41

5

1,169

0,197

0,086

6,91

0,53

7

308,32

4

1,608

0,107

0,047

3,75

0,02

8

353,23

4

2,047

0,048

0,021

1,68

3,18

9

398,14

2

2,486

0,018

0,008

0,62

3,04

ИТОГО:

80

69,71

38,54


Рис. 6

Нормальный закон распределения двухпараметрический, число степеней свободы = 6 и = 12.592.

Так как 2 0,05 2 , то гипотеза о принадлежности эмпирической выборки значений, нормальному (Гауссовскому) закону распределения отвергается

Логарифмически - нормальный закон распределения

Значения средне-выборочное и средне-квадратичное:

Таблица 7

Xi

103 км

fi

ti

(ti)

(xi)

fi’

щт

1

38,86

16

-1,481

0,133

4,808

17,28

0,094

2

83,77

26

-0,404

0,367

6,155

22,12

0,682

3

128,68

8

0,198

0,391

4,263

15,32

3,494

4

173,59

10

0,618

0,329

2,663

9,57

0,019

5

218,50

5

0,941

0,256

1,645

5,91

0,140

6

263,41

5

1,203

0,193

1,030

3,70

0,455

7

308,32

4

1,423

0,144

0,659

2,37

1,126

8

353,23

4

1,614

0,108

0,430

1,55

3,892

9

398,14

2

1,782

0,081

0,287

1,03

0,908

ИТОГО:

80

10,81

Рис. 7

Нормальный закон распределения двухпараметрический, число степеней свободы = 6 и = 12.592.

Так как 2 0,05 2 , то эмпирическая выборка значений принадлежит логарифмически-нормальному закону распределения

4. Определение вида теоретического закона распределения случайной величины графическими методами

Расчёт координат эмпирических точек заданной выборки


Таблица 8.

№ п/п

Среднее значение

интервала xi , 103 км

fi , шт

fi

F(x)= fi /n+1

1

38,86

16

16

0,198

2

83,77

26

42

0,519

3

128,68

8

50

0,617

4

173,59

10

60

0,741

5

218,50

5

65

0,802

6

263,41

5

70

0,864

7

308,32

4

74

0,914

8

353,23

4

78

0,963

9

398,14

2

80

0,988

Используя полученные в табл.4. данные, строим вероятностную сетку и выполняем проверку согласованности.

Выбор масштаба построения вероятностной сетки:

· ширина графика (ось абсцисс) А = 140 мм ;

· высота графика (ось ординат) Н = 180 мм .

Нормальный закон распределения

Масштаб значений оси абсцисс устанавливается на основе выражения:

Таблица 9

P = F(x)

0,5

0,6

0,7

0,8

0,8413

0,85

0,903

y = Q-1 (P)

0

0,25

0,52

0,85

1

1,05

1,3

Ky (P), мм

0

7,5

15,6

25,5

30

31,5

39

P = F(x)

0,96

0,971

0,98

0,991

0,9953

0,997

0,9987

y = Q-1 (P)

1,75

1,9

2,05

2,35

2,6

2,75

3

Ky(P), мм

52,5

57

61,5

70,5

78

82,5

90


Лгарифмически - нормальный закон распределения

Масштаб значений оси абсцисс устанавливается на основе выражения:


Таблица 10

Границы интервала

xi

103 км

1

418,78…475,69

38,86

456,01

0,198

2

475,69…499,40

83,77

489,15

0,519

3

499,40…514,62

128,68

507,68

0,617

4

514,62…525,85

173,59

520,60

0,741

5

525,85…534,75

218,50

530,52

0,802

6

534,75…542,12

263,41

538,59

0,864

7

542,12…548,42

308,32

545,38

0,914

8

548,42…553,91

353,23

551,25

0,963

9

553,91…558,78

398,14

556,42

0,988


Экспоненциальный (нормальный) закон распределения

Таблица 11

P = F(x)

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

Ky (P), мм

0,0

3,2

6,7

10,7

15,3

20,8

27,5

36,1

P = F(x)

0,8

0,9

0,95

0,97

0,98

0,99

0,995

0,9975

Ky(P), мм

48,3

69,1

89,9

105,2

117,4

138,2

158,9

179,7


Распределение Вейбулла – Гнеденко

Таблица 12

P = F(x)

0,03

0,04

0,06

0,1

0,2

0,3

0,4

y = Q-1 (P)

-3,5

-3,2

-2,8

-2,25

-1,5

-1,03

-0,7

Ky (P), мм

-118,8

-108,6

-95,0

-76,4

-50,9

-35,0

-23,8

P = F(x)

0,5

0,632

0,78

0,9

0,97

0,955

0,999

y = Q-1 (P)

-0,36

0,00

0,41

0,83

1,25

1,66

1,93

Ky(P), мм

-12,2

0,00

13,9

28,2

42,4

56,3

65,5


Скачать архив с текстом документа