Вариант 9. В базе данных магазина, торгующего поддержанными автомобилями, содержится информация об их потребительских свойствах и ценах

  • ID: 03414 
  • 23 страницы

Фрагмент работы:

Вариант 9. В базе данных магазина, торгующего поддержанными автомо…

Задача 1.

В базе данных магазина, торгующего поддержанными автомобилями, содержится информация об их потребительских свойствах и ценах.

Для анализа зависимости цены автомобиля...от его возраста...и мощности двигателя... из базы данных выбраны сведения о 16 автомобилях. Эти сведения приведены в таблице 1.

Таблица 1.

Номер автомобиля

Цена (тыс.у.е)

Возраст (лет)

Мощность двигателя (л.с.)

1 11,3 4,0 115

2 9,5 3,0 83

3 6,9 5,0 73

4 4,8 7,0 98

5 6,6 7,0 106

6 7,3 7,0 128

7 15,2 3,0 159

8 11,3 5,0 149

9 11,4 3,0 103

10 13,5 3,0 127

11 12,8 4,0 146

12 12,0 3,0 109

13 12,0 3,0 99

14 12,8 3,0 116

15 6,3 7,0 122

16 5,0 7,0 98

1.1. Построить поле рассеяний для цены...и возраста автомобиля..., а также для цены...и мощности двигателя.... На основе визуального анализа выдвинуть гипотезы о статистической зависимости...от...и...от...и записать их математически.

1.2. Методом наименьших квадратов найти оценки линейных уравнений регрессии:...и....

1.3. С помощью коэффициентов парной корреляции проанализировать тесноту линейной связи между ценой и возрастом автомобиля, а также между ценой и мощностью двигателя. Проверить их значимость с надежностью 0,9.

1.4. Проверить статистическую значимость параметров и уравнений регрессии с надежностью 0,9.

1.5. Построить доверительные полосы надежности для среднего значения цены автомобиля в зависимости от его возраста, а также мощности от двигателя. Изобразить графически линии регрессии и доверительные полосы в месте с полями рассеяний.

1.6. На продажу поступила очередная партия однотипных автомобилей. Их возраст 3 года, мощность двигателя 165 л.с. Рассчитать точечный и интервальный прогноз среднего значения цены поступивших автомобилей в зависимости от возраста и мощности двигателя с доверительной вероятностью 0,9.

Решение.

1.1. По исходным данным построим поля рассеяния переменной у в зависимости от... и..., нанесем линии тренда и эллипсы рассеяния.

Вид полей и эллипсов рассеивания позволяют выдвинуть гипотезу о том, что зависимость цены автомобиля (...) от его возраста (...) обратная, т.е. с увеличением возраста автомобиля цена на него уменьшается. Зависимость описывается линейной моделью вида:

где... и... - неизвестные постоянные коэффициенты, а ? - случайное отклонение, вызванное влиянием неучтённых факторов и погрешностями измерений.

Аналогично, между ценой автомобиля y и мощностью двигателя... зависимость прямая, т.е. с увеличением мощности двигателя цена автомобиль возрастает. И зависимость описывается моделью:

1.2. Найдем уравнения линейной регрессии

и...

неизвестные коэффициенты находятся по формулам (используя метод наименьших квадратов (МНК)):

Вычисления поясним с помощью таблицы:

1 4 115 11,3 16 13225 45,2 1299,5 460 127,69

2 3 83 9,5 9 6889 28,5 788,5 249 90,25

3 5 73 6,9 25 5329 34,5 503,7 365 47,61

4 7 98 4,8 49 9604 33,6 470,4 686 23,04

5 7 106 6,6 49 11236 46,2 699,6 742 43,56

6 7 128 7,3 49 16384 51,1 934,4 896 53,29

7 3 159 15,2 9 25281 45,6 2416,8 477 231,04

8 5 149 11,3 25 22201 56,5 1683,7 745 127,69

9 3 103 11,4 9 10609 34,2 1174,2 309 129,96

10 3 127 13,5 9 16129 40,5 1714,5 381 182,25

11 4 146 12,8 16 21316 51,2 1868,8 584 163,84

12 3 109 12 9 11881 36 1308 327 144

13 3 99 12 9 9801 36 1188 297 144

14 3 116 12,8 9 13456 38,4 1484,8 348 163,84

15 7 122 6,3 49 14884 44,1 768,6 854 39,69

16 7 98 5 49 9604 35 490 686 25

сумма 74 1831 158,7 390 217829 656,6 18793,5 8406 1736,75

средние 4,63 114,44 9,92 24,38 13614,31

n=16

4,63...114,44...9,92

74...1831...158,7

390...217829...1736,75

656,6...18793,5

Тогда...

Таким образом...

Аналогично находятся оценки коэффициентов модели

Тогда...

Таким образом....

1.3. Коэффициент парной корреляции находится по формуле:

Подставляя соответствующие значения, получим

Так как...0, то связь между признаками прямая, т.е. с ростом... возрастает y.

Проверим значимость коэффициента корреляции...с помощью критерия Стьюдента. При уровне значимости 0,9 табличное значение...=1,76. Тогда

значит...также существенно отличается от 0 и существует сильная линейная положительная связь между y и....

1.4. Проверим статистическую значимость параметров и уравнений регрессии с надежностью 0,9 с помощью t - статистики Стьюдента и путем расчета доверительного интервала для каждого из показателей. Выдвигаем гипотезу...о статистически незначимом отличии показателей от нуля:...уравнения....

Табличное значение... для числа степеней свободы...и...составляет....

Определим случайные ошибки..........

Составим расчетную таблицу

0,368 0,136 -0,625 0,391

-3,052 9,317 -1,625 2,641

-2,411 5,813 0,375 0,141

-1,270 1,612 2,375 5,641

0,530 0,281 2,375 5,641

1,230 1,514 2,375 5,641

2,648 7,010 -1,625 2,641

1,989 3,956 0,375 0,141

-1,152 1,328 -1,625 2,641

0,948 0,898 -1,625 2,641

1,868 3,491 -0,625 0,391

-0,552 0,305 -1,625 2,641

-0,552 0,305 -1,625 2,641

0,248 0,061 -1,625 2,641

0,230 0,053 2,375 5,641

-1,070 1,144 2,375 5,641

Сумма 37,224 47,750

Тогда

Тогда

Так как...