데이터 > 활성 데이터셋의 변수 관리하기 > 변수를 다시 코딩하기...
Data > Manage variables in active data set > Recode variables...
기존 변수를 이용하여 새로운 변수를 만들 수 있다. R Commander에서 이 기능은 일반적으로 수치형 변수를 요인형으로 바꾸는데 사용된다. <(각각의) 새로운 변수를 요인으로 만들기>에 선택이 되어 있는 것은 요인형으로 만드는 과정이다.
물론 수치형 변수의 사례값들을 다른 값으로 변환시킬수도 있다. 이 기능을 이해하기 위해서는 <"다시 코딩하기" 지시문 입력하기>에 대한 정확한 사용법을 익히는 것이 필수적이다. 초보자에게는 쉽지 않다. 하지만, 논리적으로 이해한다면 차후에 큰 어려움은 없을 것이다.
예를 들어 연령과 같은 수치 정보를 담은 변수가 있다고 하자.
10세 구간으로 바꾸려고 할 때, 10대, 20대, 30대, 40대, 50대, 60대, 70대 이상 등으로 사용할 수 있다. 때로는 65세이상으로 마지막 구간을 사용할 수 있다. 태어난 후 10세가 아닌 아이들을 배제시키기도 한다. 선거와 같은 정치적인 이슈에 대한 입장에서 20대 이상부터 시작하기도 한다. 이 경우 수치형 정보를 구간으로 바꾸어 요인화 시키는 과정이 필요하다.
때로는 소득과 관련하여 상-중-하 등의 3구간으로 나누는 것도 흔하다. 아래의 예와 같이 사용할 수 있다.
1:10000 = "low"
10001:20000 = "middle"
20001:max(데이터셋$변수) = "high"
else = NA
Prestige 데이터셋에 있는 수치형 변수 education의 구간을 만들어 사례값들을 넣고 요인형로 변수로 만들고자 한다. 아래와 같이 <'다시 코딩하기' 지시문 입력하기>에 입력할 수 있다. 1부터 6까지는 elementary로, 6.01에서 9까지는 middle로 , 9.01에서 12까지는 high로, 12.01에서 16까지 univ라는 구간명을 만들어 넣을 수 있다.
주의점으로, '다시코딩하기'지시문에 오직 큰 따옴표(" ")를 사용해야 한다. 작은 따옴표를 사용하면 알림글에 오류가 뜬다: 오류: '다시코딩하기'지시문에 오직 큰 따옴표(" ") 사용하기
Prestige 데이터셋에 있는 수치형 변수 education, income을 구간을 정해서 나누고 요인형으로 바꿔서 education.level, income.level 이라고 변수명을 만든 명령문의 출력 결과이다.
?RecodeDialog # Rcmdr 패키지에서 RecodeDialog 도움말 보기
변수 다시 코딩하기 사례: https://rcmdr.tistory.com/157
'Data > Manage variables in active data set' 카테고리의 다른 글
7. Bin a numeric variable... (0) | 2020.03.21 |
---|---|
5. Convert numeric variable to factor... (0) | 2020.03.18 |
4. Standardize variables... (0) | 2019.09.08 |
3. Add observation number to data set (0) | 2019.09.08 |
2. Compute new variable... (0) | 2019.09.08 |