Проверить статистическую значимость параметров и уравнения множественной регрессии с надежностью 0.9

  • ID: 03963 
  • 21 страница

Фрагмент работы:

Проверить статистическую значимость параметров и уравнения множест…

Задача 1.

В базе данных магазина, торгующего поддержанными автомобилями, содержится информация об их потребительских свойствах и ценах.

Для анализа зависимости цены автомобиля...от его возраста...и мощности двигателя... из базы данных выбраны сведения о 16 автомобилях. Эти сведения приведены в таблице 1.

Таблица 1.

Номер автомобиля

Цена (тыс.у.е)

Возраст (лет)

Мощность двигателя (л.с.)

1 12,5 4,0 117

2 12,0 3,0 102

3 8,9 5,0 87

4 7,3 6,0 102

5 8,9 6,0 107

6 8,9 6,0 120

7 15,4 3,0 148

8 13,2 4,0 141

9 13,3 3,0 114

10 14,7 3,0 129

11 15,2 3,0 144

12 13,7 3,0 118

13 14,0 3,0 112

14 14,3 3,0 122

15 5,9 7,0 108

16 5,5 7,0 94

1.1. Построить поле рассеяний для цены...и возраста автомобиля..., а также для цены...и мощности двигателя.... На основе визуального анализа выдвинуть гипотезы о статистической зависимости...от...и...от...и записать их математически.

1.2. Методом наименьших квадратов найти оценки линейных уравнений регрессии:...и....

1.3. С помощью коэффициентов парной корреляции проанализировать тесноту линейной связи между ценой и возрастом автомобиля, а также между ценой и мощностью двигателя. Проверить их значимость с надежностью 0,9.

1.4. Проверить статистическую значимость параметров и уравнений регрессии с надежностью 0,9.

1.5. Построить доверительные полосы надежности для среднего значения цены автомобиля в зависимости от его возраста, а также мощности от двигателя. Изобразить графически линии регрессии и доверительные полосы в месте с полями рассеяний.

1.6. На продажу поступила очередная партия однотипных автомобилей. Их возраст 3 года, мощность двигателя 165 л.с. Рассчитать точечный и интервальный прогноз среднего значения цены поступивших автомобилей в зависимости от возраста и мощности двигателя с доверительной вероятностью 0,95.

Решение.

1.1. По исходным данным построим поля рассеяния переменной у в зависимости от... и..., нанесем линии тренда и эллипсы рассеяния.

Вид полей и эллипсов рассеивания позволяют выдвинуть гипотезу о том, что зависимость цены автомобиля (...) от его возраста (...) обратная, т.е. с увеличением возраста автомобиля цена на него уменьшается. Зависимость описывается линейной моделью вида:

где... и... - неизвестные постоянные коэффициенты, а ? - случайное отклонение, вызванное влиянием неучтённых факторов и погрешностями измерений.

Аналогично, между ценой автомобиля y и мощностью двигателя... зависимость прямая, т.е. с увеличением мощности двигателя цена автомобиль возрастает. И зависимость описывается моделью:

1.2. Найдем уравнения линейной регрессии

и...

неизвестные коэффициенты находятся по формулам (используя метод наименьших квадратов (МНК)):

Вычисления поясним с помощью таблицы, которую составим с помощью Microsoft Excel:

1 4 117 12,5 16 13689 50 1462,5 468 156,25

2 3 102 12 9 10404 36 1224 306 144

3 5 87 8,9 25 7569 44,5 774,3 435 79,21

4 6 102 7,3 36 10404 43,8 744,6 612 53,29

5 6 107 8,9 36 11449 53,4 952,3 642 79,21

6 6 120 8,9 36 14400 53,4 1068 720 79,21

7 3 148 15,4 9 21904 46,2 2279,2 444 237,16

8 4 141 13,2 16 19881 52,8 1861,2 564 174,24

9 3 114 13,3 9 12996 39,9 1516,2 342 176,89

10 3 129 14,7 9 16641 44,1 1896,3 387 216,09

11 3 144 15,2 9 20736 45,6 2188,8 432 231,04

12 3 118 13,7 9 13924 41,1 1616,6 354 187,69

13 3 112 14 9 12544 42 1568 336 196

14 3 122 14,3 9 14884 42,9 1744,6 366 204,49

15 7 108 5,9 49 11664 41,3 637,2 756 34,81

16 7 94 5,5 49 8836 38,5 517 658 30,25

сумма 69 1865 183,7 335 221925 715,5 22050,8 7822 2279,83

средние 4,31 116,56 11,48 20,94 13870,31

n=16

Тогда...

Таким образом...

Аналогично находятся оценки коэффициентов модели

Тогда...

Таким образом....

1.3. Коэффициент парной корреляции находится по формуле:

Подставляя соответствующие значения, получим

Так как...0, то связь между признаками прямая, т.е. с ростом...возрастает y. Используя таблицу Чедока при... определяем, что связь между признаками средняя.

Проверим значимость коэффициента корреляции...с помощью критерия Стьюдента. При уровне значимости 0,9 табличное значение...=1,76. Тогда

значит... существенно отличается от 0 и существует средняя линейная положительная связь между y и....

1.4. Проверим статистическую значимость параметров и уравнений регрессии с надежностью 0,9 с помощью t - статистики Стьюдента и путем расчета доверительного интервала для каждого из показателей. Выдвигаем гипотезу...о статистически незначимом отличии показателей от нуля:...уравнения....

Табличное значение... для числа степеней свободы...и...составляет....

Определим случайные ошибки..........

Составим расчетную таблицу

0,378 0,143 -0,313 0,098

-2,170 4,711 -1,313 1,723

-1,173 1,375 0,688 0,473

-0,724 0,524 1,688 2,848

0,876 0,768 1,688 2,848

0,876 0,768 1,688 2,848

1,230 1,512 -1,313 1,723

1,078 1,163 -0,313 0,098

-0,870 0,758 -1,313 1,723

0,530 0,280 -1,313 1,723

1,030 1,060 -1,313 1,723

-0,470 0,221 -1,313 1,723

-0,170 0,029 -1,313 1,723

0,130 0,017 -1,313 1,723

-0,075 0,006 2,688 7,223

-0,475 0,225 2,688 7,223

сумма 13,560 37,438

Тогда

Тогда

Так как...