Для анализа зависимости цены автомобиля от его возраста и мощности двигателя из базы данных выбраны сведения о 16 автомобилях. Эти сведения приведены в таблице 1

  • ID: 04982 
  • 21 страница

Фрагмент работы:

Для анализа зависимости цены автомобиля от его возраста и мощности…

Задача 1.

В базе данных магазина, торгующего поддержанными автомобилями, содержится информация об их потребительских свойствах и ценах.

Для анализа зависимости цены автомобиля...от его возраста...и мощности двигателя... из базы данных выбраны сведения о 16 автомобилях. Эти сведения приведены в таблице 1.

Таблица 1.

Номер автомобиля

Цена (тыс.у.е)

Возраст (лет)

Мощность двигателя (л.с.)

1 10,5 4 90

2 17 3,5 170

3 10,2 5 105

4 16,5 4 165

5 8,4 5,5 88

6 15,1 4 145

7 5,7 7 95

8 11,9 5 130

9 14,9 5 165

10 12,7 3,5 112

11 14,2 3 120

12 13,5 4,5 145

13 14,6 3,5 140

14 9,8 7 145

15 10,3 5,5 120

16 11,5 5 130

1.1. Построить поле рассеяний для цены...и возраста автомобиля..., а также для цены...и мощности двигателя.... На основе визуального анализа выдвинуть гипотезы о статистической зависимости...от...и...от...и записать их математически.

1.2. Методом наименьших квадратов найти оценки линейных уравнений регрессии:...и....

1.3. С помощью коэффициентов парной корреляции проанализировать тесноту линейной связи между ценой и возрастом автомобиля, а также между ценой и мощностью двигателя. Проверить их значимость с надежностью 0,9.

1.4. Проверить статистическую значимость параметров и уравнений регрессии с надежностью 0,9.

1.5. Построить доверительные полосы надежности для среднего значения цены автомобиля в зависимости от его возраста, а также мощности от двигателя. Изобразить графически линии регрессии и доверительные полосы в месте с полями рассеяний.

1.6. На продажу поступила очередная партия однотипных автомобилей. Их возраст 3 года, мощность двигателя 165 л.с. Рассчитать точечный и интервальный прогноз среднего значения цены поступивших автомобилей в зависимости от возраста и мощности двигателя с доверительной вероятностью 0,95.

Решение.

1.1. По исходным данным построим поля рассеяния переменной у в зависимости от... и..., нанесем линии тренда и эллипсы рассеяния.

Вид полей и эллипсов рассеивания позволяют выдвинуть гипотезу о том, что зависимость цены автомобиля (...) от его возраста (...) обратная, т.е. с увеличением возраста автомобиля цена на него уменьшается. Зависимость описывается линейной моделью вида:

где... и... - неизвестные постоянные коэффициенты, а ? - случайное отклонение, вызванное влиянием неучтённых факторов и погрешностями измерений.

Аналогично, между ценой автомобиля y и мощностью двигателя... зависимость прямая, т.е. с увеличением мощности двигателя цена автомобиль возрастает. И зависимость описывается моделью:

1.2. Найдем уравнения линейной регрессии

и...

неизвестные коэффициенты находятся по формулам (используя метод наименьших квадратов (МНК)):

Вычисления поясним с помощью таблицы, которую составим с помощью Microsoft Excel:

1 4 90 10,5 16 8100 42 945 360 110,25

2 3,5 170 17 12,25 28900 59,5 2890 595 289

3 5 105 10,2 25 11025 51 1071 525 104,04

4 4 165 16,5 16 27225 66 2722,5 660 272,25

5 5,5 88 8,4 30,25 7744 46,2 739,2 484 70,56

6 4 145 15,1 16 21025 60,4 2189,5 580 228,01

7 7 95 5,7 49 9025 39,9 541,5 665 32,49

8 5 130 11,9 25 16900 59,5 1547 650 141,61

9 5 165 14,9 25 27225 74,5 2458,5 825 222,01

10 3,5 112 12,7 12,25 12544 44,45 1422,4 392 161,29

11 3 120 14,2 9 14400 42,6 1704 360 201,64

12 4,5 145 13,5 20,25 21025 60,75 1957,5 652,5 182,25

13 3,5 140 14,6 12,25 19600 51,1 2044 490 213,16

14 7 145 9,8 49 21025 68,6 1421 1015 96,04

15 5,5 120 10,3 30,25 14400 56,65 1236 660 106,09

16 5 130 11,5 25 16900 57,5 1495 650 132,25

сумма 75 2065 196,8 372,5 277063 880,65 26384,1 9563,5 2562,94

средние 4,6875 129,063 12,3 23,28125 17316,44

Тогда...

Таким образом...

Аналогично находятся оценки коэффициентов модели

Тогда...

Таким образом....

1.3. Коэффициент парной корреляции находится по формуле:

Подставляя соответствующие значения, получим

Так как...-0,7670, то связь между признаками прямая, т.е. с ростом...возрастает y. Используя таблицу Чедока при...0,804 определяем, что связь между признаками средняя.

Проверим значимость коэффициента корреляции...с помощью критерия Стьюдента. При уровне значимости 0,9 табличное значение...=1,76. Тогда

значит... существенно отличается от 0 и существует средняя линейная положительная связь между y и....

1.4. Проверим статистическую значимость параметров и уравнений регрессии с надежностью 0,9 с помощью t - статистики Стьюдента и путем расчета доверительного интервала для каждого из показателей. Выдвигаем гипотезу...о статистически незначимом отличии показателей от нуля:...уравнения....

Табличное значение... для числа степеней свободы...и...составляет....

Определим случайные ошибки..........

Составим расчетную таблицу

13,674 -3,174 10,075 -0,688

14,674 2,326 5,412 -1,188

11,675 -1,475 2,177 0,313

13,674 2,826 7,985 -0,688

10,676 -2,276 5,180 0,813

13,674 1,426 2,033 -0,688

7,678 -1,978 3,912 2,313

11,675 0,225 0,050 0,313

11,675 3,225 10,398 0,313

14,674 -1,974 3,895 -1,188

15,673 -1,473 2,170 -1,688

12,675 0,825 0,681 -0,188

14,674 -0,074 0,005 -1,188

7,678 2,122 4,504 2,313

10,676 -0,376 0,141 0,813

11,675 -0,175 0,031 0,313

сумма 58,650 20,938

Тогда

Тогда

Так как...