통계 > 비모수 검정 > Kruskal-Wallis 검정...
Statistics > Nonparametric tests > Kruskal-Wallis test...

Linux 사례 (MX 21)

carData 패키지에 있는 Friendly 데이터셋을 활용한다. https://rcmdr.tistory.com/153

Friendly 데이터셋

carData > Friendly data(Friendly, package="carData") help("Friendly")

rcmdr.kr

Linux 사례 (MX 21)
data(Friendly, package="carData")
Tapply(correct ~ condition, median, na.action=na.omit, data=Friendly) # medians by group
kruskal.test(correct ~ condition, data=Friendly)
Linux 사례 (MX 21)

'Statistics > Nonparametric tests' 카테고리의 다른 글

3. Paired-samples Wilcoxon test...  (0) 2022.03.21
2. Single-sample Wilcoxon test...  (0) 2022.03.21
1. Two-sample Wilcoxon test...  (0) 2022.03.21
5. Friedman rank-sum test...  (0) 2022.03.20

통계 > 적합성 모델 > 다항 로짓 모델...
Statistics > Fit models > Multinomial logit model...

Linux 사례 (MX 21)

MASS 패키지에 있는 birthwt 데이터셋을 활용해보자. 먼저 birthwt 데이터셋을 활성화 시킨다. https://rcmdr.kr/149

birthwt 데이터셋

MASS > birthwt data(birthwt, package="MASS") birthwt 데이터셋이 활성화된 후, <데이터셋 보기> 버튼을 누르면 아래와 같이 내부 구성을 볼 수 있다: help("birthwt")

rcmdr.kr

이후 일부 변수의 특징을 변화시켜 bwt라는 새로운 데이터셋을 만들자.아래의 <일반화 선형 모델> 연습 중간에 bwt를 만드는 스크립트가 있다. https://rcmdr.tistory.com/150

3. Generalized linear model...

통계 > 적합성 모델 > 일반화 선형 모델... Statistics > Fit models > Generalized linear model... MASS 패키지에 있는 birthwt 데이터셋을 활용하자. https://rcmdr.tistory.com/149 birthwt data(birthwt, pa..

rcmdr.kr

아래 화면은 bwt 데이터셋을 활용한 사례이다. low 변수를 반응변수로, 다른 나머지 변수를 설명변수군에 모두 포함시키자.

Linux 사례 (Mx 21)
MLM.1 <- multinom(low ~ ., data=bwt, trace=FALSE)
summary(MLM.1, cor=FALSE, Wald=TRUE)
Linux 사례 (MX 21)

MLM.1 이라는 모형이 만들어졌다면, '모델 > 가설 검정 > 분산분석표...' 메뉴 기능을 이용할 수 있다.

Linux 사례 (MX 21)

'Statistics > Fit models' 카테고리의 다른 글

5. Ordinal regression model...  (0) 2022.06.24
6. Linear mixed model...  (0) 2022.06.23
3. Generalized linear model...  (0) 2022.03.09
2. Linear model...  (0) 2022.03.07
1. Linear regression...  (0) 2022.03.07

통계 > 적합성 모델 > 일반화 선형 모델...
Statistics > Fit models > Generalized linear model...

Linux 사례 (MX 21)

MASS 패키지에 있는 birthwt 데이터셋을 활용하자. https://rcmdr.tistory.com/149

birthwt 데이터셋

MASS > birthwt data(birthwt, package="MASS") birthwt 데이터셋이 활성화된 후, <데이터셋 보기> 버튼을 누르면 아래와 같이 내부 구성을 볼 수 있다: help("birthwt")

rcmdr.kr

birthwt 데이터셋을 <일반화 선형 모델> 분석을 위하여 변형시켜서 bwt라는 데이터셋으로 만들자.

bwt <- with(birthwt, {
race <- factor(race, labels = c("white", "black", "other"))
ptd <- factor(ptl > 0)
ftv <- factor(ftv)
levels(ftv)[-(1:2)] <- "2+"
data.frame(low = factor(low), age, lwt, race, smoke = (smoke > 0),
           ptd, ht = (ht > 0), ui = (ui > 0), ftv)
})

options(contrasts = c("contr.treatment", "contr.poly"))

bwt 데이터셋을 활성화시키자.

Linux 사례 (MX 21)
GLM.3 <- glm(low ~ ., family=binomial(logit), data=bwt)
summary(GLM.3)
Linux 사례 (MX 21) - R Markdown 에서
exp(coef(GLM.3))  # Exponentiated coefficients ("odds ratios")
Linux 사례 (MX 21)

## an example with offsets from Venables & Ripley (2002, p.189)
utils::data(anorexia, package = "MASS")

GLM.2 <- glm(Postwt ~ Prewt + Treat + offset(Prewt), 
	family=gaussian(identity), data=anorexia)
summary(GLM.2)
Linux 사례 (MX 21)

data(Cowles, package="carData")
Linux 사례 (MX 21)
GLM.1 <- glm(volunteer ~ sex + neuroticism*extraversion, family=binomial(logit), data=Cowles)
summary(GLM.1)
exp(coef(GLM.1))  # Exponentiated coefficients ("odds ratios")
Linux 사례 (MX 21)

'Statistics > Fit models' 카테고리의 다른 글

5. Ordinal regression model...  (0) 2022.06.24
6. Linear mixed model...  (0) 2022.06.23
4. Multinomial logit model...  (0) 2022.03.09
2. Linear model...  (0) 2022.03.07
1. Linear regression...  (0) 2022.03.07

통계 > 차원 분석 > 요인 분석...

Statistics > Dimensional analysis > factor analysis...

Linux 사례 (MX 21)

통계 > 차원 분석 > 주-성분 분석...

Statistics > Dimensional analysis > Principal-components analysis...

Linux 사례 (MX 21)

<주성분 분석> 메뉴 창에서 <변수 (두개 이상 선택)> 에서 4개의 변수를 모두 선택해보자.

Linux 사례 (MX 21)

<선택기능> 창에서 기본 설정되어 있는 기능을 기억하자.

Linux 사례 (MX 21)

local({
  .PC <- princomp(~Assault+Murder+Rape+UrbanPop, cor=TRUE, data=USArrests)
  cat("\nComponent loadings:\n")
  print(unclass(loadings(.PC)))
  cat("\nComponent variances:\n")
  print(.PC$sd^2)
  cat("\n")
  print(summary(.PC))
})

 

Linux 사례 (MX 21)


.PC <- princomp(~Assault+Murder+Rape+UrbanPop, cor=TRUE, data=USArrests)
plot(.PC)

Linux 사례 (MX 21)

biplot(.PC)

Linux 사례(MX 21)

'Statistics > Dimensional analysis' 카테고리의 다른 글

5.3. Summarize hierarchical clustering...  (0) 2022.03.20
5.2. Hierarchical cluster analysis...  (0) 2022.03.20
5.1. k-means cluster analysis...  (0) 2022.03.18
3. factor analysis...  (0) 2022.03.08
1. Scale reliability...  (0) 2022.03.08

통계 > 차원 분석 > 척도 신뢰성...

Statistics > Dimensional analysis > Scale reliability...

Linux 사례 (MX 21)

carData 패키지에서 제공하는 DavisThin 데이터셋을 활성화시키자. DavisThin 데이터셋에는 DT1, DT2, DT3, ..., DT7 이라는 7개의 수치형 변수가 있다. 이 변수들은 "drive for thinness" 척도를 구성한다.

 

<척도 신뢰성> 창에서 <변수 (세개 이상 선택)> 기능에서 DT1부터 DT7까지 일곱개의 변수를 선택하고,  예(OK) 버튼을 누른다.

Linux 사례(MX 21)

reliability(cov(DavisThin[,c("DT1","DT2","DT3","DT4","DT5","DT6","DT7")], 
	use="complete.obs"))

Linux 사례 (MX 21)

 

통계 > 분산 > Levene의 검정...

Statistics > Variances > Levene's test...

Linux 사례 (MX 21)

carData 패키지에서 제공하는 Prestige 데이터셋을 활성화 시키자. Prestige 데이터셋에는 type 이라는 세개의 수준을 가진 요인형 변수가 있다. 그 수준 이름은 bc, prof, wc 이다. 직업유형(type)별로 사회적인 권위가 다른지를 확인하는 문제의식이 있다고 하자. 집단별(직업유형, type)로 직업의 사회적 권위(prestige)에 대한 분산의 차이가 있는지를 통계적으로 살펴본다. <중앙(센터)>에서 중앙값과 평균을 선택할 수 있다. 중앙값이 기본 설정이다.

Linux 사례 (MX 21)

Tapply(prestige ~ type, var, na.action=na.omit, data=Prestige) # variances by group
leveneTest(prestige ~ type, data=Prestige, center="median")

Linux 사례 (MX 21)

'Statistics > Variances' 카테고리의 다른 글

2. Bartlett's test  (0) 2022.03.08
1. Two variances F-test...  (0) 2022.03.07

통계 > 분산 > Bartlett의 검정...

Statistics > Variances > Bartlett's test...

Linux 사례 (MX 21)

carData 패키지에서 제공하는 Prestige 데이터셋을 활성화 시키자. Prestige 데이터셋에는 type 이라는 세개의 수준을 가진 요인형 변수가 있다. 그 수준 이름은 bc, prof, wc 이다. 직업유형(type)별로 사회적인 권위가 다른지를 확인하는 문제의식이 있다고 하자. 집단별(직업유형, type)로 직업의 사회적 권위(prestige)에 대한 분산의 차이가 있는지를 통계적으로 살펴본다.

Linux 사례 (MX 21)

Tapply(prestige ~ type, var, na.action=na.omit, data=Prestige) # variances by group
bartlett.test(prestige ~ type, data=Prestige)

Linux 사례 (MX 21)

'Statistics > Variances' 카테고리의 다른 글

3. Levene's test...  (0) 2022.03.08
1. Two variances F-test...  (0) 2022.03.07

통계 > 평균 > 일원 분산 분석...

Statistics > Means > One-way ANOVA...

Linux 사례 (MX 21)

datasets 패키지에 있는 sleep 데이터셋을 활용해보자.

https://rcmdr.tistory.com/132

 

sleep

Datasets > sleep data(sleep, package="datasets") summary(sleep) str(sleep) 데이터셋의 내부는 다음과 같다:

rcmdr.kr

<집단 (하나 선택)>에 요인형 변수 group을, <반응 변수 (하나 선택)>에 수치형 변수 extra를 선택한다. 통계 > 분산 > 이-분산 F-검정을 통하여 비교되는 두 집단의 extra 변수의 사례 분포는 등분산임을 알고 있는 상황이다.

https://rcmdr.tistory.com/136

 

1. Two variances F-test...

통계 > 분산 > 이-분산 F-검정... Statistics > Variances > Two variances F-test... datasets 패키지에 포함된 sleep 데이터셋을 활용해보자. https://rcmdr.tistory.com/132 sleep data(sleep, package="datas..

rcmdr.kr

Linux 사례 (MX 21)

AnovaModel.1 <- aov(extra ~ group, data=sleep)
summary(AnovaModel.1)
with(sleep, numSummary(extra, groups=group, statistics=c("mean", "sd")))

일원 분산 분석의 명령문 작성과 분석 결과는 아래와 같다.

Linux 사례 (MX 21)

추가로  carData 패키지의 Prestige 데이터셋을 이용하여 일원 분산 분석을 연습해보자. Prestige 데이터셋에는 type 이라는 요인형 변수가 있다. 그러나 앞서 연습한 sleep 데이터셋의 group 변수처럼 요인 수준이 두개가 아니라 요인의 수준이 셋이다. 직업의 사회적 권위에 대한 직업 유형별 (bc, prof, wc) 평균의 차이가 있는가를 점검한다.

Linux 사례 (MX 21)

AnovaModel.3 <- aov(prestige ~ type, data=Prestige)
summary(AnovaModel.3)
with(Prestige, numSummary(prestige, groups=type, statistics=c("mean", "sd")))

직업유형 (bc, prof, wc)에 따른 직업의 사회적 권위는, 각 유형별 평균을 비교할 때, 차이가 있다는 결과를 얻는다.

Linux 사례 (MX 21)


?anova  # stats 패키지의 anova 도움말 보기

'Statistics > Means' 카테고리의 다른 글

6. One-factor repeated-measures ANOVA/ANCOVA...  (0) 2022.06.23
5. Multi-way ANOVA...  (0) 2022.03.13
3. Paired t-test...  (0) 2022.03.07
2. Independent samples t-test...  (0) 2022.03.07
1. Single-sample t-test...  (0) 2022.03.07

통계 > 분산 > 이-분산 F-검정...

Statistics > Variances > Two variances F-test...

Linux 사례 (MX 21)

datasets 패키지에 포함된 sleep 데이터셋을 활용해보자.

https://rcmdr.tistory.com/132

 

sleep

Datasets > sleep data(sleep, package="datasets") summary(sleep) str(sleep) 데이터셋의 내부는 다음과 같다:

rcmdr.kr

<이-분산 F-검정> 메뉴창에서 요인형 변수 group을 <집단 (하나 선택)>에, 수치형 변수 extra를 <반응 변수 (하나 선택)>으로 결정하자. Two variances F-test (이-분산 F-검정)은 두 개의 집단 비교로 반응 변수의 분산을 점검하는 기법이다.

Linux 사례 (MX 21)

Tapply(extra ~ group, var, na.action=na.omit, data=sleep) # variances by group
var.test(extra ~ group, alternative='two.sided', conf.level=.95, data=sleep)

alternative 이후 선택 사항들은 기본 선택을 사용하였다. 변화를 준 것은 없다. 따라서 아래의 명령문과 같은 의미이기도 하다.

var.test(extra ~ group, data=sleep)

sleep 데이터셋에 있는 extra 변수의 요인 수준 (group1, group2)별 분산은 차이가 있다고 통계적으로 말하기 어렵다는 결론을 얻는다. 줄여서 거칠게 말하면, 두 분산의 차이가 없다고 할 수 있다.

Linux 사례 (MX 21)

 

'Statistics > Variances' 카테고리의 다른 글

3. Levene's test...  (0) 2022.03.08
2. Bartlett's test  (0) 2022.03.08

+ Recent posts