Вариант 12. Построить линейную регрессию 2 от 1

  • ID: 29746 
  • 8 страниц
x

Часть текста скрыта. После покупки Вы получаете полную версию

Фрагмент работы:

Вариант 12. Построить линейную регрессию 2 от 1

ЗАДАНИЕ 2

1. Построить линейную регрессию X2 от X1. Найти доверительные интервалы для параметров при.... Построить эллипс рассеяния. Проверить гипотезу независимости X2 и X1 при уровне значимости 0,1.

2. Построить разделяющую кривую для двух классов в предположении нормальности распределений, j - номер выборки для второго класса.

№ 12

j 14

i X1 X2

1 1,64 5,12

2 0,13 1,74

3 1,63 3,75

4 0,04 2,33

5 0,45 2,63

6 5,57 -0,15

7 6,43 -1,05

8 -3,40 6,77

9 -3,20 6,87

10 -0,49 2,04

11 2,73 3,15

12 3,47 1,32

13 0,91 2,96

14 3,14 3,59

15 2,98 1,80

16 2,57 3,52

17 5,31 -1,53

18 0,46 1,64

19 1,48 2,37

20 6,12 -1,92

21 5,13 -0,97

22 -0,56 5,16

23 2,41 0,80

РЕШЕНИЕ:

1. Обозначим переменные.......

Модель строим в виде:

Находим..........

График оцененной зависимости приведен на рисунке.

Оценим доверительные интервалы для параметров. Поскольку модель включает параметр b, вводим фиктивную переменную.... Учитывая, что..., а..., получаем....

По таблице критических точек для распределения... находим критические значения величины... для вероятностей 0,05 и 0,95, разность которых есть доверительная вероятность..., которая задана равной 0,9.

Имеем......, откуда получаем... - доверительный для ?.

Из распределения... при доверительной вероятности 0,9 находим критическое значение....

Вычислив..., получаем... и находим... - доверительный интервал для ?.

Из соотношения... находим... - доверительный интервал для b.

Найдем главную компоненту. Проведя центрирование выборки, вычисляем

Отсюда..., либо.... Полученные углы задают направления главных осей эллипса рассеяния.

Из двух полученных углов непосредственной проверкой выбираем тот, который доставляет минимум суммы квадратов от точек выборки до прямой. Находим искомую прямую

Чтобы от центрированных переменных вернуться к исходным, достаточно сделать соответствующий сдвиг по осям.

На рисунке изображены линии регрессий X по Y и Y по X, а также эллипс рассеяния и главная компонента.

Рассчитываем:

и.... Таким образом, гипотеза независимости переменных в данном примере отвергается при любых разумных уровнях значимости.

2. На рисунке приведена разделяющая кривая между первым и вторым классами для задания из варианта 0. Темными маркерами отмечены точки первого, светлыми - второго класса. Сплошная линия - разделяющая кривая (гипербола), пунктирные - асимптоты.

Оценки векторов средних:

Оценки ковариационных матриц:

Параметры разделяющей кривой:

Уравнение кривой:

ЗАДАНИЕ 3

1. Диагонализовать матрицу выборочных ковариаций в пространстве переменных..........

2. Вычислить координаты всех точек выборки в базисе собственных векторов ковариационной матрицы.

3. Изобразить выборку и эллипс рассеяния в пространстве двух главных компонент.

№ j1 j2 j3

12 2 3 10

i Z2 Z3 Z10

1 2,76 4,53 -3,58

2 -0,21 2,91 -3,31

3 1,53 7,72 -5,13

4 0,58 2,55 0,41

5 2,28 5,80 0,34

6 2,23 5,29 -3,36

7 0,19 8,76 -0,70

8 2,97 2,45 -0,99

9 -1,24 7,06 0,35

10 -0,76 7,79 -2,37

11 -2,58 6,75 -1,85

12 -0,39 3,93 -7,28

13 2,90 7,03 -2,31

14 1,37 4,56 -1,26

15 1,99 8,31 -4,78

16 -0,31 6,84 -0,10

17 0,61 2,57 0,84

18 -0,28 8,05 1,84

19 1,43 2,95 -0,27

20 3,16 5,61 -1,79

21 -2,74 6,56 -0,34

22 2,08 4,01 4,86

23 2,66 1,47 -5,12

24 3,48 5,89 -3,68

25 -2,84 5,26 0,50

Для вычисления ковариаций центрируем выборку, т.е. вычтем по каждой переменной среднее значение. Обозначим........., где...... - значение из i-й строки и j-го столбца таблицы данных.

Получаем новую таблицу.

i X1 X2 X3

1 1,9252 -0,856 -2,0168

2 -1,0448 -2,476 -1,7468

3 0,6952 2,334 -3,5668

4 -0,2548 -2,836 1,9732

5 1,4452 0,414 1,9032

6 1,3952 -0,096 -1,7968

7 -0,6448 3,374 0,8632

8 2,1352 -2,936 0,5732

9 -2,0748 1,674 1,9132

10 -1,5948 2,404 -0,8068

11 -3,4148 1,364 -0,2868

12 -1,2248 -1,456 -5,7168

13 2,0652 1,644 -0,7468

14 0,5352 -0,826 0,3032

15 1,1552 2,924 -3,2168

16 -1,1448 1,454 1,4632

17 -0,2248 -2,816 2,4032

18 -1,1148 2,664 3,4032

19 0,5952 -2,436 1,2932

20 2,3252 0,224 -0,2268

21 -3,5748 1,174 1,2232

22 1,2452 -1,376 6,4232

23 1,8252 -3,916 -3,5568

24 2,6452 0,504 -2,1168

25 -3,6748 -0,126 2,0632

Вычисляем ковариационную матрицу

3,471 -0,990 -1,030

A -0,990 4,281 -0,038

-1,030 -0,038 6,604

Решаем характеристическое уравнение

После приведения подобных (раскрывая определитель по формуле......) имеем

Решением этого уравнения являются корни

Решим теперь систему уравнений......, для найденных....

Подставляя..., получаем систему

Поскольку уравнение линейно зависимы, любое из них можно исключить, например, третье. Так как решение определено с точностью до произвольного множителя, положим.... Если в процессе решения возникнет деление на близкие к нулю величины, то единице положим равной другую компоненту.

Решая систему двух уравнений, находим.......

Вычислим норму вектора.... Разделив каждую компоненту на норму, получаем нормированный первый собственный вектор....

Аналогичным образом находим остальные собственные векторы.......

Используя полученные векторы в качестве столбцов, образуем матрицу

-0,310 0,450 0,837

=...

0,945 0,240 0,221

На рисунке изображен эллипсоид рассеяния и единичная сфера, на которой отмечены собственные вектора. Также показаны сечения сферы и эллипсоида координатными плоскостями системы переменных....

Эллипсоидом рассеяния мы называем поверхность, задаваемую уравнением....

При замене переменных... имеем.... В том, что..., легко убедиться:..., учитывая ортогональность матрицы T. Получаем, что эллипсоид рассеяния инвариантен к ортогональной замене переменных и является функцией только взаимного расположения выборочных точек, поэтому его можно использовать для графической иллюстрации характерной формы рассеяния.

Поверхности, задаваемые уравнением...... - константа, являются в случае нормального закона распределения поверхностями равной плотности, поэтому эллипсоид рассеяния может служить для наглядного представления "формы" распределения.

Вычислим координаты всех выборочных точек в пространстве... по формуле.... Данное пространство называют также пространством главных компонент.

Результаты приведены в таблице.

i Y1 Y2 Y3

1 -2,590 1,118 0,739

2 -1,580 1,238 -2,499

3 -3,349 -2,551 0,963

4 1,655 2,798 -1,197

5 1,393 0,753 1,837

6 -2,141 0,279 0,724

7 1,360 -2,984 1,338

8 -0,420 3,624 0,445

9 2,622 -1,914 -0,478

10 -0,023 -2,979 -0,311

11 0,926 -2,780 -2,240

12 -5,173 -0,675 -3,015

13 -1,178 -0,663 2,387

14 0,036 1,024 0,102

15 -3,100 -2,767 1,721

16 1,886 -1,414 0,092

17 2,054 2,898 -1,067

18 3,834 -1,974 1,150

19 0,789 2,674 -0,435

20 -0,912 0,800 2,009

21 2,384 -2,325 -2,136

22 5,545 3,289 1,771

23 -4,327 3,334 -1,215

24 -2,769 0,249 2,000

25 3,076 -1,051 -2,685

Выборочные ковариации для полученных переменных равны нулю.

Выделение главных компонент используют как метод сокращения размерности данных, оставляя заданное число переменных, соответствующих наибольшим собственным значениям.

Также переход в пространство собственных векторов используется при визуализации данных. На рисунке изображена выборка в пространстве... и эллипс рассеяния.