datasets::airquality()

Linux 사례 (MX 21)

R이 시작될 때, datasets 패키지가 자동으로 호출된다. 따라서 R Commander를 실행할 때, datasets 패키지는 첨부 패키지화되어 메뉴창을 통해서 내부 데이터셋을 찾고 불러올 수 있다.

메뉴창에서 순서대로 데이터 > 패키지에 있는 데이터 > 첨부된 패키지에서 데이터셋 읽기... 를 선택하면 다음과 같은 창이 등장한다.

Windows 사례

출력창을 보면, airquality라는 데이터셋에는 6개의 변수가 있고, 각 변수는 수치형 정보를 담고 있다.

Windows 사례

Month 변수는 최소 5에서 최대 9로 값이 있는데, 정확히는 5월부터 9월까지일 것이다. 한달 한달을 뜻하는 월(month)은 5월이 9월보다 크다고 할 수 없고, 5월, 6월, 7월, 8월, 9월 등으로 개체화되어 분리된다. 다시 말하면, 요인형 변수가 되어야 한다는 뜻이다.

그럼 왜, airqualty 데이터셋의 Month 변수는 수치형으로 되어 있을까. 원자료를 R의 데이터셋으로 불러오는 과정에서 해당 변수의 요인화과정이 생략되었을 것이다.


airquality {datasets} R Documentation

New York Air Quality Measurements

Description

Daily air quality measurements in New York, May to September 1973.

Usage

airquality

Format

A data frame with 153 observations on 6 variables.

[,1] Ozone numeric Ozone (ppb)
[,2] Solar.R numeric Solar R (lang)
[,3] Wind numeric Wind (mph)
[,4] Temp numeric Temperature (degrees F)
[,5] Month numeric Month (1--12)
[,6] Day numeric Day of month (1--31)

Details

Daily readings of the following air quality values for May 1, 1973 (a Tuesday) to September 30, 1973.

  • Ozone: Mean ozone in parts per billion from 1300 to 1500 hours at Roosevelt Island
  • Solar.R: Solar radiation in Langleys in the frequency band 4000–7700 Angstroms from 0800 to 1200 hours at Central Park
  • Wind: Average wind speed in miles per hour at 0700 and 1000 hours at LaGuardia Airport
  • Temp: Maximum daily temperature in degrees Fahrenheit at La Guardia Airport.

Source

The data were obtained from the New York State Department of Conservation (ozone data) and the National Weather Service (meteorological data).

References

Chambers, J. M., Cleveland, W. S., Kleiner, B. and Tukey, P. A. (1983) Graphical Methods for Data Analysis. Belmont, CA: Wadsworth.

Examples

require(graphics)
pairs(airquality, panel = panel.smooth, main = "airquality data")

[Package datasets version 4.0.4 Index]

'Dataset_info > airquality' 카테고리의 다른 글

airquality 데이터셋 예제  (0) 2022.06.24

carData 패키지에 있는 Prestige 데이터셋을 .csv로 저장하여 내보낼 수 있다.

 

Prestige.csv
0.00MB

 

https://rcmdr.tistory.com/52

 

17. Export active data set...

활성 데이터셋 내보내기... Data > Active data set > Export active data set... 작업을 마친/ 또는 다른 업무를 위하여 일시적으로 작업한 자료를 하드디스크에 저장하는 경우가 흔하다. .RData로 자료를 저장

rcmdr.tistory.com

 

'Dataset_info > Prestige' 카테고리의 다른 글

Prestige 데이터셋  (0) 2022.03.08

Rcmdr_2.7-2.tar.gz
5.50MB


간혹, 데이터셋의 요약정보를 보려고 할 때 오류가 나는 경우가 있다. (설치된 Rcmdr 2.7-2 의 한글메뉴 경우)

예를 들어, OBrienKaiser 데이터셋은 R Commander에서 활성 데이터셋으로 이용할 수 있다. 그러나 '통계 > 요약 > 활성데이터셋' 기능은 사용할 수 없다. 다음과 같은 오류문을 Rgui 창에서 보게된다.

Error in sprintf(gettextRcmdr("There are %d variables in the data set %s.\nDo you want to proceed?"), :
'%d'는 유효하지 않은 포맷입니다; 문자형 객체들에는 포맷 %s를 사용해주세요

Rcmdr 한글화 번역자의 입장에서 사용자에게 사과해야할 상황이다. 한글 번역 과정에서 발생한 오류이기 때문이다. R의 공식 소스에는 다음의 한글 내용이 포함되어 있다.

Linux 사례 (Ubuntu 18.04)

다음과 같이 바꾸면, OBrienKaiser 데이터셋의 요약정보를 보는데 오류를 출력하지 않는다. 소스 파일이 변경되는 것이라, 다시 컴파일을 해야한다. 이 화면 상단의 소스 압축파일은 한글 관련 .po / .mo 파일이 수정된 것이다. 내려받아 install.packages(소스압축파일, repo=NULL, type="source") 등으로 컴파일 설치를 해야한다.

Linux 사례 (Ubuntu 18.04)
Linux 사례 (Ubuntu 18.04)

아래의 오류 이해와 대응 방식을 참조할 수 있다:
https://rcmdr.tistory.com/m/64

 

Data > Import data > from Excel file... 오류 발생 및 상황 이해하기

R Commander에서 엑셀파일을 불러올 때가 있다. 이 때 사용하는 기능이다. 그런데  Rcmdr 2.7-x  에서 엑셀파일을 불러오는데 오류가 발생한다. 메뉴 한글화 담당자로서 이 상황을 설명하려고 한다.

rcmdr.kr

+ Recent posts