eda(9)
-
'색상' 표현에 대해 자세히 알아보자 - RcolorBrewer(출처: R내 swirl package)
# # swirl()내 탐색적 데이터 분석(Exploratory Data Course)를 실행해보자. # # library("swirl") swirl() Exploratory Graphs 과정에서 7번 플로팅 시스템(7. Working with Colors)을 선택한다. 탐색적 분석 과정의 일곱번째 섹션 '색상' 표현 - RcolorBrewer(요약) RcolorBrewer는 CRAN에 있는 패키지로, 3가지 형태 순차적(sequential), 분기적(divergent), 질적(qualitative)으로 표현 가능하다. RcolorBrewer RcolorBrewer는 CRAN에 있는 패키지로, 3가지 형태로 표현 가능하다. - 순차적(sequential): 아래 그림에서 제일 윗 부분. 왼쪽에서 오른쪽으..
2020.02.23 -
'색상' 표현에 대해 자세히 알아보자 - alpha값 불투명 설정(출처: R내 swirl package)
# # swirl()내 탐색적 데이터 분석(Exploratory Data Course)를 실행해보자. # # library("swirl") swirl() Exploratory Graphs 과정에서 7번 플로팅 시스템(7. Working with Colors)을 선택한다. 탐색적 분석 과정의 일곱번째 섹션 '색상' 표현 - alpha값 불투명 설정(요약) - 데이터 표현시, alpha값을 통해 데이터 표현을 보다 명확히 할 수 있다. alpha값을 통해 불투명도 설정 > p1 # p1을 실행해보자. function (n) { x ?rgb # rgb 값을 실행해보자. rgb(red, green, blue, alpha, names = NULL, maxColorValue = 1) rgb값은 6개 변수를 가지며,..
2020.02.17 -
'색상' 표현에 대해 자세히 알아보자 - colorRampPalette (출처: R내 swirl package)
# # swirl()내 탐색적 데이터 분석(Exploratory Data Course)를 실행해보자. # # library("swirl") swirl() Exploratory Graphs 과정에서 7번 플로팅 시스템(7. Working with Colors)을 선택한다. 탐색적 분석 과정의 일곱번째 섹션 '색상' 표현 - colorRampPalette (요약) - colorRampPalette도 colorRamp와 마찬가지로 색상의 조합으로 새로운 색상을 만든다. 리턴값으로 정수값을 갖고, 색상별 벡터값을 갖는다. - 각 리턴값은 24비트로 구성되며, 0에서 F값을 갖는다. 6개의 헥사값은 빨간색, 파란색, 파란색 강도를 표현한다. colorRampPalette colorRampPalette도 color..
2020.02.16 -
'색상' 표현에 대해 자세히 알아보자 - colorRamp (출처: R내 swirl package)
# # swirl()내 탐색적 데이터 분석(Exploratory Data Course)를 실행해보자. # # library("swirl") swirl() Exploratory Graphs 과정에서 7번 플로팅 시스템(7. Working with Colors)을 선택한다. 탐색적 분석 과정의 일곱번째 섹션 '색상' 표현 - colorRamp (요약) - 색상 표현은 데이터 분석 결과 표현 또는 강조하는 등 의사결정 표현에 좀 더 도움을 준다. - colorRamp는 RGB(red, green, blue)에 대한 값들을 통해 색상을 생성한다. 기본 색상 표현 기본적으로, R은 Col 값을 통해 색상을 표현한다. 기본 값 3가지는 다음과 같다. col = 1 : 검정 col = 2 : 빨강 col = 3 : ..
2020.02.15 -
'Lattice' 시스템에 대해 자세히 알아보자 - 그래픽 예시 (출처: R내 swirl package)
# # swirl()내 탐색적 데이터 분석(Exploratory Data Course)를 실행해보자. # # library("swirl") swirl() Exploratory Graphs 과정에서 6번 플로팅 시스템(6. Lattice Plotting System)을 선택한다. 탐색적 분석 과정의 여섰번째 섹션: 'Lattice' 시스템 - 그래픽 예시(요약) - ggplot2내의 diamonds 데이터를 통해 xyplot 그래프 표현 예시를 살펴본다. 그래픽 예시 ggplot2에 담긴 diamonds 데이터를 통해 Lattice 그래프를 확인해보자. > str(diamonds) # diamonds 데이터의 구성을 살펴보자 > table(diamonds$color) # diamonds 데이터의 칼라를 살..
2020.02.14 -
'Lattice' 시스템에 대해 자세히 알아보자 - xyplot (출처: R내 swirl package)
# # swirl()내 탐색적 데이터 분석(Exploratory Data Course)를 실행해보자. # # library("swirl") swirl() Exploratory Graphs 과정에서 6번 플로팅 시스템(6. Lattice Plotting System)을 선택한다. 탐색적 분석 과정의 여섰번째 섹션: 'Lattice' 시스템 - xyplot(요약) - Lattice 시스템은 'Trellis' 그래픽을 R에 구현한 시스템이다. - 크게 'Lattice', 'Grid' 패키지로 구성된다. - Lattice 시스템은 그래픽을 표현할 때 기본 플로팅 시스템과 달리 한번에 표현한다. - xyplot은 스캐터플롯(x, y값) 표현할 떄 쓰이는 Lattice 함수이다. Lattice 시스템이란 Latti..
2020.02.12 -
R의 기본 플로팅 시스템에 대해 좀 더 자세히 알아보자 - scatterplot(출처: R내 swirl package)
# # swirl()내 탐색적 데이터 분석(Exploratory Data Course)를 실행해보자. # # library("swirl") swirl() Exploratory Graphs 과정에서 5번 플로팅 시스템(5. Base Plotting System)을 선택한다. 탐색적 분석 과정의 다섯번째 섹션: 기본 플로팅 시스템 - scatterplot (요약) with(데이터명, plot(x축 변수명, y축 변수명))을 통해 2개 변수에 대해 그래프를 그린다. 간단한 2개 변수 그리기 작업 예시 with(airquality, plot(Wind, Ozone)) # airquality 데이터에 대해 Wind와 Ozone간의 관계를 그래프로 보여준다. 대소문자에 유의한다. title(main="Ozone an..
2020.02.06 -
R의 기본 플로팅 시스템에 대해 좀 더 자세히 알아보자- plot, boxplot (출처: R내 swirl package)
# # swirl()내 탐색적 데이터 분석(Exploratory Data Course)를 실행해보자. # # library("swirl") swirl() Exploratory Graphs 과정에서 5번 플로팅 시스템(5. Base Plotting System)을 선택한다. 탐색적 분석 과정의 다섯번째 섹션: 기본 플로팅 시스템 - plot, hist, boxplot(요약) 기본 플로팅 함수는 단계별로 기본함수(plot, hist, boxplot 등)를 그리고, 추가 작업(text, abline, points)을 그래프에 더해 보고자 하는 그래프를 완성한다. 기본 플로팅 시스템은 크게 'graphics' 패키지, 'grDevices' 패키지가 있다. 'graphics' 패키지에는, plot, hist, b..
2020.02.05 -
탐색적 데이터 분석 코스를 배워보자 : 분석적 그래프의 기본 원칙(출처: R내 swirl package)
# # swirl()내 탐색적 데이터 분석(Exploratory Data Course)를 실행해보자. # jpeg 나 ggplot2 패키지가 안깔려있으면 함께 설치해준다. # install.packages("jpeg") install.ggplot2("ggplot2") library("swirl") swirl() 탐색적 분석 과정의 첫번째 섹션: 분석적 그래프의 기본 원칙(요약) 1. 첫번째 원칙: 비교하기 2. 두번째 원칙: 데이터 비교 결과에 대한 메커니즘을 보여준다. 3. 세번째 원칙: 다변수(multivariate)를 그래프로 보여준다. 4. 네번째 원칙: "증거(evidence)"를 다양한 방법(글, 숫자, 도형 등)으로 표현한다. 5. 다섯번째 원칙: "증거(evidence)"에 대한 출처, 적..
2020.01.31