Вариант 54. В базе данных магазина, торгующего поддержанными автомобилями, содержится информация об их потребительских свойствах и ценах

  • ID: 05037 
  • 21 страница

Фрагмент работы:

Вариант 54. В базе данных магазина, торгующего поддержанными автом…

Задача 1.

В базе данных магазина, торгующего поддержанными автомобилями, содержится информация об их потребительских свойствах и ценах.

Для анализа зависимости цены автомобиля...от его возраста...и мощности двигателя... из базы данных выбраны сведения о 16 автомобилях. Эти сведения приведены в таблице 1.

Таблица 1.

Номер автомобиля

Цена (тыс.у.е)

Возраст (лет)

Мощность двигателя (л.с.)

1 3,5 5 108

2 7,2 3 126

3 4,5 5 134

4 4,2 6 151

5 7,4 4 184

6 7,9 4 193

7 5,6 3 92

8 0,9 7 71

9 5,7 5 166

10 1,5 7 125

11 1,3 6 73

12 1,8 5 67

13 3,3 4 81

14 0,9 6 63

15 5,6 4 120

16 0,6 7 64

1.1. Построить поле рассеяний для цены...и возраста автомобиля..., а также для цены...и мощности двигателя.... На основе визуального анализа выдвинуть гипотезы о статистической зависимости...от...и...от...и записать их математически.

1.2. Методом наименьших квадратов найти оценки линейных уравнений регрессии:...и....

1.3. С помощью коэффициентов парной корреляции проанализировать тесноту линейной связи между ценой и возрастом автомобиля, а также между ценой и мощностью двигателя. Проверить их значимость с надежностью 0,9.

1.4. Проверить статистическую значимость параметров и уравнений регрессии с надежностью 0,9.

1.5. Построить доверительные полосы надежности для среднего значения цены автомобиля в зависимости от его возраста, а также мощности от двигателя. Изобразить графически линии регрессии и доверительные полосы в месте с полями рассеяний.

1.6. На продажу поступила очередная партия однотипных автомобилей. Их возраст 3 года, мощность двигателя 165 л.с. Рассчитать точечный и интервальный прогноз среднего значения цены поступивших автомобилей в зависимости от возраста и мощности двигателя с доверительной вероятностью 0,95.

Решение.

1.1. По исходным данным построим поля рассеяния переменной у в зависимости от... и..., нанесем линии тренда и эллипсы рассеяния.

Вид полей и эллипсов рассеивания позволяют выдвинуть гипотезу о том, что зависимость цены автомобиля (...) от его возраста (...) обратная, т.е. с увеличением возраста автомобиля цена на него уменьшается. Зависимость описывается линейной моделью вида:

где... и... - неизвестные постоянные коэффициенты, а ? - случайное отклонение, вызванное влиянием неучтённых факторов и погрешностями измерений.

Аналогично, между ценой автомобиля y и мощностью двигателя... зависимость прямая, т.е. с увеличением мощности двигателя цена автомобиль возрастает. И зависимость описывается моделью:

1.2. Найдем уравнения линейной регрессии

и...

неизвестные коэффициенты находятся по формулам (используя метод наименьших квадратов (МНК)):

Вычисления поясним с помощью таблицы, которую составим с помощью Microsoft Excel:

1 5 108 3,5 25 11664 17,5 378 540 12,25

2 3 126 7,2 9 15876 21,6 907,2 378 51,84

3 5 134 4,5 25 17956 22,5 603 670 20,25

4 6 151 4,2 36 22801 25,2 634,2 906 17,64

5 4 184 7,4 16 33856 29,6 1361,6 736 54,76

6 4 193 7,9 16 37249 31,6 1524,7 772 62,41

7 3 92 5,6 9 8464 16,8 515,2 276 31,36

8 7 71 0,9 49 5041 6,3 63,9 497 0,81

9 5 166 5,7 25 27556 28,5 946,2 830 32,49

10 7 125 1,5 49 15625 10,5 187,5 875 2,25

11 6 73 1,3 36 5329 7,8 94,9 438 1,69

12 5 67 1,8 25 4489 9 120,6 335 3,24

13 4 81 3,3 16 6561 13,2 267,3 324 10,89

14 6 63 0,9 36 3969 5,4 56,7 378 0,81

15 4 120 5,6 16 14400 22,4 672 480 31,36

16 7 64 0,6 49 4096 4,2 38,4 448 0,36

сумма 81 1818 61,9 437 234932 272,1 8371,4 8883 334,41

средние 5,0625 113,625 3,86875 27,3125 14683,25

Тогда...

Таким образом...

Аналогично находятся оценки коэффициентов модели

Тогда...

Таким образом....

1.3. Коэффициент парной корреляции находится по формуле:

Подставляя соответствующие значения, получим

Так как...0, то связь между признаками прямая, т.е. с ростом...возрастает y. Используя таблицу Чедока при... определяем, что связь между признаками средняя.

Проверим значимость коэффициента корреляции...с помощью критерия Стьюдента. При уровне значимости 0,9 табличное значение...=1,76. Тогда

значит... существенно отличается от 0 и существует средняя линейная положительная связь между y и....

1.4. Проверим статистическую значимость параметров и уравнений регрессии с надежностью 0,9 с помощью t - статистики Стьюдента и путем расчета доверительного интервала для каждого из показателей. Выдвигаем гипотезу...о статистически незначимом отличии показателей от нуля:...уравнения....

Табличное значение... для числа степеней свободы...и...составляет....

Определим случайные ошибки..........

Составим расчетную таблицу

-0,465 0,216 -0,063 0,004

0,171 0,029 -2,063 4,254

0,535 0,287 -0,063 0,004

1,768 3,124 0,938 0,879

1,903 3,623 -1,063 1,129

2,403 5,777 -1,063 1,129

-1,429 2,041 -2,063 4,254

0,000 0,000 1,938 3,754

1,735 3,012 -0,063 0,004

0,600 0,359 1,938 3,754

-1,132 1,283 0,938 0,879

-2,165 4,685 -0,063 0,004

-2,197 4,825 -1,063 1,129

-1,532 2,349 0,938 0,879

0,103 0,011 -1,063 1,129

-0,300 0,090 1,938 3,754

сумма 31,710 26,938

Тогда

Тогда

Так как...