데이터 > 활성 데이터셋의 변수 관리하기 > 새로운 변수 계산하기...

Data > Manage variables in active data set > Compute new variable...

 

Linux 사례 (Ubuntu 18.04)

 

활성 데이터셋에 있는 변수들을 활용하여 새로운 변수를 생성하는 많은 방법이 있다. <Compute new variable...>은 일반적으로 수치형 사례를 갖고 있는 변수(들)을 사칙연산, log, 제곱근 등의 계산기법을 활용하여 새롭게 만드는 것이다. 계산에 의해서 새롭게 생성되는 사례들을 새로운 변수이름으로 저장할 수 있다. variable 이라는 추천된 변수 이름이 있지만, 사용자가 직접 지정할 수 있다.

 

Prestige 데이터셋에 있는 income 변수를 log를 이용하여 변환해보자. 

Linux 사례 (Ubuntu 18.04)

다음과 같은 명령문으로, income.log라는 변수가 새롭게 생성된다.

Prestige$income.log <- with(Prestige, log(income))

?Compute  # Rcmdr 패키지에서 Compute 도움말 보기

'Data > Manage variables in active data set' 카테고리의 다른 글

7. Bin a numeric variable...  (0) 2020.03.21
5. Convert numeric variable to factor...  (0) 2020.03.18
4. Standardize variables...  (0) 2019.09.08
3. Add observation number to data set  (0) 2019.09.08
1. Recode variables...  (0) 2019.09.08

데이터 > 활성 데이터셋의 변수 관리하기 > 변수를 다시 코딩하기...

Data > Manage variables in active data set > Recode variables...

 

Linux 사례 (Ubuntu 18.04)

 

기존 변수를 이용하여 새로운 변수를 만들 수 있다. R Commander에서 이 기능은 일반적으로 수치형 변수를 요인형으로 바꾸는데 사용된다. <(각각의) 새로운 변수를 요인으로 만들기>에 선택이 되어 있는 것은 요인형으로 만드는 과정이다.

 

물론 수치형 변수의 사례값들을 다른 값으로 변환시킬수도 있다. 이 기능을 이해하기 위해서는 <"다시 코딩하기" 지시문 입력하기>에 대한 정확한 사용법을 익히는 것이 필수적이다. 초보자에게는 쉽지 않다. 하지만, 논리적으로 이해한다면 차후에 큰 어려움은 없을 것이다.

 

Linux 사례 (Ubuntu 18.04)

 

예를 들어 연령과 같은 수치 정보를 담은 변수가 있다고 하자.

10세 구간으로 바꾸려고 할 때, 10대, 20대, 30대, 40대, 50대, 60대, 70대 이상 등으로 사용할 수 있다. 때로는 65세이상으로 마지막 구간을 사용할 수 있다. 태어난 후 10세가 아닌 아이들을 배제시키기도 한다. 선거와 같은 정치적인 이슈에 대한 입장에서 20대 이상부터 시작하기도 한다. 이 경우 수치형 정보를 구간으로 바꾸어 요인화 시키는 과정이 필요하다.

 

때로는 소득과 관련하여 상-중-하 등의 3구간으로 나누는 것도 흔하다. 아래의 예와 같이 사용할 수 있다.

1:10000 = "low"

10001:20000 = "middle"

20001:max(데이터셋$변수) = "high" 

else = NA

 

Prestige 데이터셋에 있는 수치형 변수 education의 구간을 만들어 사례값들을 넣고 요인형로 변수로 만들고자 한다. 아래와 같이 <'다시 코딩하기' 지시문 입력하기>에 입력할 수 있다. 1부터 6까지는 elementary로, 6.01에서 9까지는 middle로 , 9.01에서 12까지는 high로, 12.01에서 16까지 univ라는 구간명을 만들어 넣을 수 있다.

Linux 사례 (Ubuntu 18.04)

주의점으로, '다시코딩하기'지시문에 오직 큰 따옴표(" ")를 사용해야 한다. 작은 따옴표를 사용하면 알림글에 오류가 뜬다:  오류: '다시코딩하기'지시문에 오직 큰 따옴표(" ") 사용하기

 

Prestige 데이터셋에 있는 수치형 변수 education, income을 구간을 정해서 나누고 요인형으로 바꿔서 education.level, income.level 이라고 변수명을 만든 명령문의 출력 결과이다. 

Linux 사례 (Ubuntu 18.04)


?RecodeDialog  # Rcmdr 패키지에서 RecodeDialog 도움말 보기

변수 다시 코딩하기 사례:  https://rcmdr.tistory.com/157

 

1. Single-sample proportion test...

통계 > 비율 > 일-표본 비율 검정... Statistics > Proportions > Single-sample proportion test... 요인형 변수를 두개 이상 가지고 있는 데이터셋이 활성화되어 있다면, '통계 > 비율 > 이-표본 비율 검정..'..

rcmdr.kr

 

+ Recent posts