사례 이름 정하기...

Data > Active data set > Set case names...

Linux 사례 (MX 21)

활성 데이터셋으로 사용되는 데이터프레임은 행과 열을 갖는다. 변수이름이 열을 대표한다. 행의 경우, 일련번호로 사례를 대표하기도하고 고유한 이름을 붙이기도 한다. 이 기능은 행의 이름을 지정하는 것이다.

 

그런데, 이 기능을 사용하기 위해서는 R의 특징을 알아야 한다. 첫째, 사례 이름은 유일해야 한다. 동일한 행의 이름을 넣을 수 없다는 것이다. 이 원칙은 행의 이름으로 사용하기 위해서 변수들에서 하나를 선택해야하는 이 기능 <사례 이름 정하기>에서 많은 변수들이 이 원칙을 위배하기 때문에 오류문을 생산하는 경우가 흔하다. 행이름은 흔히 key 값이라 부르는 고유성을 가져야 하는데, 이 고유성이 어느 변수의 사례값에서 발견되기는 쉽지 않다.

 

<사례 이름 설정하기> 메뉴창에서, Prestige의 어떤 변수를 선택하더라도 알림글에 '오류: 사례 이름은 유일해야 합니다.'는 메세지를 볼 것이다. 숫자 형태의 일련번호 또는 개별화된 문자형 사례 이름에는 중복되는 이름을 넣을 수 없다는 뜻이다. 

Windows 사례

Prestige 데이터셋의 변수이름은 아래와 같이 문자형 정보를 담고 있다. 만약 숫자 형태의 일련번호가 있었다면, 직업 이름을 담고 있는 변수의 사례들을 행 이름으로 바꿀 수 있었을 것이다.

Windows 사례

row.names(데이터셋이름)

?row.names # base 패키지의 row.names 도움말 보기

## To illustrate the note:
df <- data.frame(x = c(TRUE, FALSE, NA, NA), y = c(12, 34, 56, 78))
row.names(df) <- 1 : 4
attr(df, "row.names")
deparse(df)
## (Compact storage, not regarded as automatic.)
row.names(df) <- NULL
attr(df, "row.names")
deparse(df)
## (Compact storage, regarded as automatic.)

 

'Data > Active data set' 카테고리의 다른 글

8. Sort active data set...  (0) 2019.09.08
7. Subset active data set...  (0) 2019.09.08
5. Variables in active data set  (0) 2019.09.08
4. Help on active data set (if available)  (0) 2019.09.08
3. Refresh active data set  (0) 2019.05.13

활성 데이터셋의 변수

Data > Active data set > Variables in active data set

 

활성 데이터셋으로 불러온 데이터프레임에는 사례값들을 가지는 변수가 있을 것이다. 변수이름을 목록화시켜 보여주는 기능이다. 예제용 데이터셋은 핵심적인 목적을 위하여 정제된 경우가 대부분이기 때문에 이 기능이 큰 효과를 가지지 않는다. 하지만, 백 개 이상의 변수를 가진 데이터들도 흔한 상황에서 분석을 위한 데이터셋을 불러온 경우, 그리고 변수들이 많은 경우, 이 기능은 효과적으로 사용될 수 있다.

 

Linux 사례 (MX 21)

활성 데이터셋에 있는 변수들의 목록이 출력된다. Prestige 데이터셋에는 있는 변수 목록은 다음과 같다:

Windows 사례

 

> names(데이터셋)

'Data > Active data set' 카테고리의 다른 글

7. Subset active data set...  (0) 2019.09.08
6. Set case names...  (0) 2019.09.08
4. Help on active data set (if available)  (0) 2019.09.08
3. Refresh active data set  (0) 2019.05.13
2. Select active data set...  (0) 2019.05.13

활성 데이터셋에 관한 도움말 (만약 이용가능하다면)

Data > Active data set > Help on active data set (if available)

 

R에서 이용가능한 많은 패키지에는 예제용 데이터셋이 많이 포함되어 있다. 이러한 예제용 데이터셋은 대부분 도움말을 갖고 있다. 내장된 예제용 데이터셋을 활성 데이터로 불러온 경우는 이 명령을 유용하게 사용할 수 있다.

 

Linux 사례 (MX 21)

carData 패키지의 Prestige 데이터셋이 활성화되었다면, 도움말을 볼 수 있다:

Windows 사례

 

help("Prestige")

help(Prestige)

?(Prestige) 등으로 입력창에 직접 입력할 수 도 있다.

 

help("데이터셋이름")

 

아래의 참고사항은 Prestige 데이터셋과 유사하게, carData 패키지에 담겨있는 DavisThin 데이터셋이다. 같은 방식으로 연습할 수 있다.

https://rcmdr.tistory.com/141

 

DavisThin 데이터셋

carData > DavisThin help("DavisThin")

rcmdr.kr

 

'Data > Active data set' 카테고리의 다른 글

6. Set case names...  (0) 2019.09.08
5. Variables in active data set  (0) 2019.09.08
3. Refresh active data set  (0) 2019.05.13
2. Select active data set...  (0) 2019.05.13
1. View data...  (0) 2019.05.13

+ Recent posts