Вариант 16. На основе имеющейся базы данных магазина, торгующего подержанными автомобилям и требуется провести анализ

  • ID: 17678 
  • 16 страниц

Фрагмент работы:

Вариант № 16

На основе имеющейся базы данных магазина, торгующего подержанными автомобилям и требуется провести анализ зависимости цены автомобиля У от его возраста Х1 и мощности двигателя Х2 из базы данных.

1.Парные зависимости.

Построим поля рассеяний для цены У и возраста автомобиля Х1, а так же для цены У и мощности двигателя Х2. На основе их визуального анализа выдвинем гипотезы о виде статистической зависимости у от х1 и у от х2 и запишем их математически.

Построим поля рассеяния для зависимости y(x1) и y(x2):

[image]

[image]

На основе анализа полей рассеяния выдвигаем гипотезы о том, что зависимость цены автомобиля У от его возраста Х1 и мощности двигателя Х2 описывается линейной регрессионной моделью [image] и [image] соответственно.

1.2. Методом наименьших квадратов найдём оценки уравнений регрессии:

[image] и [image]

Найдем точечные оценки параметров модели. Для этого составим вспомогательную расчетную таблицу

Для нахождения параметров уравнения регрессии составляется система линейных уравнений

[image]

Коэффициенты этой системы находятся по формулам:

[image], [image], [image], [image]

[image], [image], [image]

[image], [image]

[image]

[image], [image]

[image]

1.3. С помощью коэффициентов парной корреляции, проанализируем тесноту линейной связи между ценой и возрастом автомобиля, а также между ценой и мощностью двигателя. Проверим их значимость с надёжностью 0,9:

Коэффициенты парной корреляции вычисляются по формуле

[image]

Рассчитаем матрицу парных коэффициентов корреляции

[image]

[image]

Проверим значимость парных коэффициентов корреляции. Для этого рассчитаем значения выражения [image] для каждого значения ij.

[image]

[image]

Т.к. условие [image] > t0,95;14=1,761 выполняется, то коэффициенты парной корреляции статистически значимы, т.е. они существенно отличны от нуля.

Проверим статистическую значимость параметров и уравнений регрессии с надёжностью 0,9: