그래프 > 산점도 행렬...
Graphs > Scatterplot matrix...

Windows 사례 (10 Pro)

산점도(Scatterplot)는 두개의 수치형 변수 사이의 관계성을 시각적으로 보면서 통찰력을 얻고자 하는 기법이다. 그런데 세개 이상의 수치형 변수들을 함께 점검하면서 관계성을 시각화하고자 할 때, 산점도의 이용은 다소 불편함이 생긴다. 이 때 산점도 행렬(Scatterplot matrix)을 사용한다.
Prestige 데이터셋에서 네개의 수치형 변수를 점검한다고 하자. 교육연수, 연소득, 직업권위의식, 여성참여율 등과 관련된 변수들 네개를 선택하자.

Windows 사례 (10 Pro)

<선택기능> 창에서 <대각선에서>는 <밀도그림>을 선택하고, <다른 선택 기능>에서는 <최소-제곱 선>, <평활선>을 선택하고, 그래프 제목을 추가한다.

Windows 사례 (10 Pro)

scatterplotMatrix(~education+income+prestige+women, regLine=TRUE, 
  smooth=list(span=0.5, spread=FALSE), diagonal=list(method="density"), 
  data=Prestige, main="Prestige 데이터셋 주요변수들의 산점도 행렬")

아래와 같은 그래픽장치 창에 산점도 행렬이 등장한다. education, income, prestige, women 이라는 네개의 변수 각각의 밀도함수가 변수 이름과 함께 작성되어 있으며, 행렬 매 칸마다 두개의 변수 사이의 산점도가 제공된다. 행렬 칸 바깥에 있는 숫자들은 수치형 변수들의 사례 값 범위를 요약해서 보여준다.

Windows 사례 (10 Pro)

산점도행렬에는 많은 정보가 담겨있다. 확인하고자 하는 정보만을 부각시키고자 산점도행렬을 단순화시키는 노력이 요구된다.


?scatterplotMatrix  #  car 패키지의 scatterplotMatrix 도움말 보기

scatterplotMatrix(~ income + education + prestige | type, data=Duncan)
scatterplotMatrix(~ income + education + prestige | type, data=Duncan,
    regLine=FALSE, smooth=list(span=1))
scatterplotMatrix(~ income + education + prestige,
    data=Duncan, id=TRUE, smooth=list(method=gamLine))

+ Recent posts