Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- /*
- Задание
- Открыть таблицу данных trees из библиотеки datasets, содержащую замеры диаметра, высоты и объема вишневых деревьев.
- Выведите имена столбцов таблицы trees.
- С помощью теста Шапиро-Уилка проверьте на нормальность каждый столбец таблицы. Сделайте выводы.
- Откройте фрейм данных randu из библиотеки datasets, содержащий 400 троек псевдослучайных чисел из интервала [1;0]. Значения записаны в матрицу с тремя столбцами, называемыми именами x, y, z.
- С помощью двувыборочного теста Колмогорова-Смирнова проверьте гипотезы о том, что x, y, z принадлежат одному и тому же непрерывному распределению. Объясните полученные результаты.
- С помощью критерия согласия Пирсона проверьте гипотезы о независимости x, y, z. Сделайте выводы.
- Проверьте гипотезу о равенстве средних x, y,z с помощью t-теста Стьюдента.
- Откройте таблицу данных HairEyeColor из библиотеки datasets, содержащую информацию о поле, цвете волос и глаз у 592 студентов.
- Проверьте гипотезу о том, что для мужчин цвет глаз не зависит от цвета волос. Для этого сначала постройте таблицу сопряженных признаков по данным для мужчин (male). Затем, с помощью критерия согласия Пирсона проверьте гипотезу. Сделайте вывод.
- Проведите аналогичное исследование для женщин (female). Проанализируйте полученные результаты.
- Постройте мозаичные диаграммы зависимости цвета волос и глаз для мужчин и для женщин (по таблицам сопряженных признаков male и female) с помощью функции mosaicplot().
- Пример использования функции mosaicplot().
- >mosaicplot(x, col=c("royalblue","purple","sienna","mediumblue"))
- link https://yadi.sk/d/VWibq8HEYESNoQ
- */
- #I. Тест Шапиро-Уилка
- #Пример 1
- x1<-rnorm(100,2,5)
- shapiro.test(x1)
- #Пример 2
- shapiro.test(runif(100,min=-10,max=10))
- #II. Критерий Колмогорова-Смирнова
- #Пример 3
- x=2
- y=10
- z=5
- ks.test(y,z)
- #Пример 4
- ks.test(z,punif)
- #III. Критерий согласия хи-квадрат Пирсона используется
- #Пример 5
- x<-c(1,2,3,4,5)
- y<-c(5,4,3,3,3)
- chisq.test(x,y)
- #IV. t-тест Стьюдента
- #Пример 6
- t.test(x,y)
- #Задание
- trees<-datasets::trees
- names_trees<-names(trees)
- names(trees)
- trees
- shapiro.test(trees$Girth) #Уровень значимости >0,05, гипотеза принята
- shapiro.test(trees$Height) #Уровень значимости >0,05, гипотеза принята
- shapiro.test(trees$Volume) #Уровень значимости <0,05, гипотеза не принята
- randu<-datasets::randu
- ks.test(randu$x,randu$y) #>0,05, нулевую гипотезу о принадлежности двух выборок x и y к одному распределению принимаем
- ks.test(randu$x,randu$z) #>0,05, нулевую гипотезу о принадлежности двух выборок x и z к одному распределению принимаем
- ks.test(randu$y,randu$z) #>0,05, нулевую гипотезу о принадлежности двух выборок y и z к одному распределению принимаем
- chisq.test(randu$x,randu$y)
- chisq.test(randu$x,randu$z)
- chisq.test(randu$y,randu$z)
- #т.к. p-value>0,05, то гипотезу о независимости случайных признаков можно принять
- t.test(randu$x,randu$y)
- #Найдено значение t = 1.9731-статистики, число степеней свободы df = 797.28, величина p-value = 0.04883.
- #Указаны границы 95% доверительного интервала для разности математических ожиданий распределений первой и второй выборки.
- #Приведены оценки математических ожиданий распределений для каждого распределения.
- #Так как p-value = 0.04883<0.05, то гипотезу о том, что средние двух выборок равны, не принимаем.
- t.test(randu$x,randu$z)
- t.test(randu$y,randu$z)
- datasets::HairEyeColor
- Tmale<-HairEyeColor[,,"Male"]
- chisq.test(Tmale)
- #p-value<0,05 , гипотезу о независимости случайных признаков не принимаем
- Tfemale<-HairEyeColor[,,"Female"]
- chisq.test(Tfemale)
- #p-value<0,05 , гипотезу о независимости случайных признаков не принимаем
- mosaicplot(Tmale, col=c("black","darkgrey","grey","lightgrey"))
- mosaicplot(Tfemale, col=c("black","darkgrey","grey","lightgrey"))
Add Comment
Please, Sign In to add comment