Вариант 16. Определить, присутствуют ли в выборке аномальные наблюдения. В случае обнаружения указать их номер и значения

  • ID: 41225 
  • 6 страниц

Фрагмент работы:

Вариант 16. Определить, присутствуют ли в выборке аномальные наблю…

Задание для контрольной работы

1. По имеющимся результатам наблюдений определить основные статистические характеристики (среднее, смещенную и несмещенную дисперсии, коэффициент вариации, центральные и начальные моменты до четвертого порядка включительно, коэффициенты асимметрии и эксцесса), сделать предварительные выводы о свойствах выборки.

2. Определить, присутствуют ли в выборке аномальные наблюдения. В случае обнаружения указать их номер и значения.

3. Провести разбивку выборки на классы, построить кумулятивную линию эмпирического распределения, гистограмму и полигон частот выборки.

4. Сформулировать и проверить гипотезу о нормальном распределении выборочных данных на основе критериев:

* коэффициентов асимметрии и эксцесса

* ?2-Пирсона.

Решение:

1. Определим основные статистические характеристики выборки:

Среднее значение наблюдаемого признака

Дисперсию

Несмещенную дисперсию

Среднеквадратическое отклонение:

Исправленное среднеквадратическое отклонение:

Коэффициент вариации

Центральные и начальные моменты до 4 порядка включительно по формулам:

Величины рассчитанных моментов запишем в таблицу:

Моменты Начальные Центральные

1 10,000 0,0000

2 100,234 0,2373

3 1007,073 -0,0003

4 10141,917 0,1671

Коэффициент асимметрии

Коэффициент эксцесса

Несмещенные оценки коэффициентов асимметрии и эксцесса

Вывод:

2. Проверим наличие в выборке аномальных явлений. Для этого рассчитываем статистику

где...

Максимальное отклонение равно 1,255. Ему соответствует x*=8,745. Тогда расчетное значение статистики будет равно:

Рассчитываем критические значения...:

=...

=...

Т.к....>2,56, то наблюдение с максимальным отклонением попадает в третью группу, следовательно, его следует признать аномальным. Также аномальным признаем 140 наблюдение. Таким образом, удаляем из выборки наблюдения 140 и 150.

Рассчитаем заново все характеристики выборки:

Среднее значение наблюдаемого признака

Дисперсию

Несмещенную дисперсию

Среднеквадратическое отклонение:

Исправленное среднеквадратическое отклонение:

Коэффициент вариации

Центральные и начальные моменты до 4 порядка включительно по формулам:

Величины рассчитанных моментов запишем в таблицу:

Моменты Начальные Центральные

1 10,000 0,0000

2 100,216 0,2193

3 1006,535 -0,0003

4 10131,113 0,1359

Коэффициент асимметрии

Коэффициент эксцесса

Несмещенные оценки коэффициентов асимметрии и эксцесса

3. Проведем разбивку выборки на классы. Для этого рассчитаем число классов по правилу Штюргеса:

Определяем величину одного интервала

Получим следующее распределение:

Номер класса

Граница интервала Частота......

1 8,878 9,161 6 0,143

2 9,161 9,444 15 0,358

3 9,444 9,727 19 0,454

4 9,727 10,010 38 0,907

5 10,010 10,293 34 0,812

6 10,293 10,576 19 0,454

7 10,576 10,859 12 0,287

8 10,859 11,142 5 0,119

Построим гистограмму и полигон:

Построим кумулятивную линию эмпирического распределения

4. Проверим гипотезу о нормальном распределении выборочных данных на основе критерия коэффициентов асимметрии и эксцесса. Для этого рассчитываем среднеквадратические отклонения для показателей асимметрии и эксцесса:

Т.к.... (0,003