data(10)
-
'색상' 표현에 대해 자세히 알아보자 - RcolorBrewer(출처: R내 swirl package)
# # swirl()내 탐색적 데이터 분석(Exploratory Data Course)를 실행해보자. # # library("swirl") swirl() Exploratory Graphs 과정에서 7번 플로팅 시스템(7. Working with Colors)을 선택한다. 탐색적 분석 과정의 일곱번째 섹션 '색상' 표현 - RcolorBrewer(요약) RcolorBrewer는 CRAN에 있는 패키지로, 3가지 형태 순차적(sequential), 분기적(divergent), 질적(qualitative)으로 표현 가능하다. RcolorBrewer RcolorBrewer는 CRAN에 있는 패키지로, 3가지 형태로 표현 가능하다. - 순차적(sequential): 아래 그림에서 제일 윗 부분. 왼쪽에서 오른쪽으..
2020.02.23 -
홈페이지 라인내 캐릭터 숫자 파악 시 R 코드
# # 특정 홈페이지 라인 숫자의 캐릭터 숫자 파악 시 쓰는 R 코드 # con = url("http://특정주소.html") Code = readLines(con, 10) # 특정주소내 라인 10번째 읽기 Code2 = readLines(con, 20) # 특정주소내 라인 20번째 읽기 Code3 = readLines(con, 30) # 특정주소내 라인 30번째 읽기 Code4 = readLines(con, 100) # 특정주소내 라인 100번째 읽기 close(con) nchar(Code[10]) # 특정주소내 라인 10의 캐릭터 숫자 출력 nchar(Code2[20]) # 특정주소내 라인 20의 캐릭터 숫자 출력 nchar(Code3[30]) # 특정주소내 라인 30의 캐릭터 숫자 출력 nchar(..
2020.01.22 -
'데이터 3법', '가격 급등새 비트코인' 관련 뉴스
■ 데이터 분야 - 데이터 3법 등 민생법안 국회서 '발목'…우회로 찾는 정부, 뉴스핌 ==> 개인정보보호법, 정보통신망법, 신용정보보호법 데이터 활용을 위한 3가지 법이 국회에 머물고 있다고 한다. 우리나라 같이 개인정보에 대해 민감하게 반응하는 곳이 또 있을까. ■ 암호자산 분야 - 비트코인도 안전자산? 미-이란 충돌에 가격 껑충, 머니투데이 ==> 비트코인 가격이 최근 오름새다. 미국 - 이란 충돌에 따른 안전자산 선호의 영향이 있다고 하는데... 과연 앞으로 어떤 행보를 보일까. ★ 의견 댓글로 환영합니다. Any comment is welcome.★
2020.01.08 -
'데이터', '암호자산' 관련 뉴스 큐레이션
뉴스 정보는 트렌드를 파악하기 위해 직접 검색해 정리한 최신 정보입니다. 1주일에 한번씩 '데이터', '암호자산' 관련 탑뉴스 업데이트 예정입니다. 좋은 밤 되십시오. ■ 데이터 분야 - 빅데이터 플랫폼 1400여종 데이터 전면 개방, 이데일리 ==> 과기정통부가 1,400여종의 데이터를 2월까지 전면 개방한다고 한다. 오픈이 되면 한번 찾아가 봐야겠다. ■ 암호자산 분야 - [블록체인 오딧세이]세계 암호자산 日거래 80조…4차위 "제도권 편입해야", 뉴시스 ==> 블록체인 거래량이 하루 80조라고 한다. 우리나라는 아직도 제도권에 들어오고 있지는 못하지만, 이미 막을 수 없는 흐름으로 보인다. ★ 의견 댓글로 환영합니다. Any comment is welcome.★
2020.01.05 -
Statistical Learning 챕터3: 선형회귀 - 가설검증 부분 노트(진행율 16%)
계속해서 3장 선형 회귀 분야입니다.앞으로 여유시간이 많지 않을거 같은데… 끝까지 달려보겠습니다.3.2 내용을 요약 및 제가 아는 부분을 포함해 정리했습니다. 이번 강의내용은 저에게 큰 의미가 있는 내용입니다. Ch3 선형 회귀3.1 단순선형회귀3.2 가설 검증 및 신뢰 구간3.3 다중선형회귀3.4 주요 질문들3.5 선형모델 확장3.R R에서의 선형회귀(출처: Statistical Learning, Stanford Online Lagunita) 강의 내용 요약가설검증을 통해 계수에 대해 통계적으로 적합(유의)한지 판단할 수 있다. 이를 위해, 계수에 대한 신뢰구간이나, t 검정통계량에 대한 p값을 통해 계수가 적합한지 판단한다. 회귀 모델 자체에 대해서는 RSE(잔차표준오차)나, R^2 값을 이용해 정확..
2019.03.05 -
Statistical Learning 챕터3: 선형회귀 수강노트(강의수강 진행 14%)
드디어 개요 부분을 지나 3장 선형 회귀 분야에 들어갑니다. 이번에도 두번째 강의수강노트 올리고, 약 2주 정도 흘렀군요. 먼저 3.1 내용을 요약 정리했습니다. 점점 양이 많아지는 듯하네요. Ch3 선형 회귀 3.1 단순선형회귀 3.2 가설 검증 및 신뢰 구간 3.3 다중선형회귀 3.4 주요 질문들 3.5 선형모델 확장 3.R R에서의 선형회귀 (출처: Statistical Learning, Stanford Online Lagunita) 강의 내용 요약 선형회귀는 특정 값에 대한 예측을 선형식으로 표현한다. 복잡한 분석 기법을 이해하기 위해 개념을 잘 이해할 필요가 있다. 회귀분석 식은 RSS(잔차제곱합)을 최소로 하는 계수값들을 통해 구성하며, 계수값들의 정확도는 보통 계수에 대한 95% 신뢰구간을 ..
2019.03.04 -
Statistical Learning 챕터2: 통계적 학습 개요 수강노트(강의수강 진행 12%)
지난 포스트에 이어 스탠포드 Statistical Learning 두번째 챕터 내용입니다. 첫 강의내용 올리고, 시간이 벌써 2주이상 흘렀습니다. 너무 늦어지면 안될거 같아 오늘 올립니다. 이중 2.4~2.R, 및 인터뷰 내용을 다루겠습니다. 수식은 되도록 배제하고, 의미를 이해하는데 집중하겠습니다. Ch2 통계적 학습 개요 2.1 회귀분석 입문 2.2 차원 및 구조적 모델(structured models) 2.3 모델 선정 및 편향-분산 트레이드오프 2.4 분류분석 2.R R 소개 존 챔버와의 인터뷰 (출처: Statistical Learning, Stanford Online Lagunita) 강의 내용 요약 분류(Classification)는 질적 변수(qualitative)인 목표값을 찾는 분석으로..
2019.02.19 -
Statistical Learning 챕터2: 통계적 학습 개요 수강노트(강의수강 진행: 8%)
스탠포드 Statistical Learning 두번째 챕터 내용이다.이중 2.1~2.3 내용을 다루겠다. 강의 내용을 적절히 재구성 및 요약했다. Ch2 통계적 학습 개요 2.1 회귀분석 입문 2.2 차원 및 구조적 모델(structured models) 2.3 모델 선정 및 편향-분산 트레이드오프 2.4 분류분석 2.R R 소개 존 챔버와의 인터뷰 (출처: Statistical Learning, Stanford Online Lagunita) 강의 내용 요약 회귀분석에 대한 정의, 차원의 저주, 그리고 회귀분석 외에 쓰이는 다양한 분석 기법 종류의 예측정확도와 해석가능성의 관계, 그리고 MSE(평균제곱오차), 분산, 편향에 대해 설명한다. 1. 회귀(regression)이란 무엇일까? 예를 들어, 매출이..
2019.02.01 -
분석의 목표, 맞춤형 서비스 개발 및 제공 – 어떤 데이터가 필요할까?
맞춤형 서비스 개발하기 위해서는 어떤 데이터가 필요할까? 분석은 패턴을 발견하여 미래에 적합한, 적절한 '어떤'것을 찾기 위해 행한다. 의사결정 도구인 것이다. 적절한 분석을 수행하기 위해서는 먼저 데이터가 필요하다. 이러한 데이터에는 무엇이 있을까? 기업 사례를 통해 데이터 종류에 대해 알아보자. 타깃사 먼저 예전글(Target(타깃): "How Companies Learn Your Secrets')을 보면, 미국 타깃(Target)사가 있다. 타깃사는 고객을 "Guest ID number"를 통해 관리하며, 고객 행동정보와 인구통계학적 정보를 수집 또는 구매하여 분석한다. 행동정보로 보는 것은, - 구매 물품 종류 - 신용카드 사용 여부 - 쿠폰 사용 여부 - 설문조사 작성 여부 - 환불 요구 여부 ..
2019.01.27 -
Statistical Learning 챕터1: 입문 강의 수강노트(강의수강 진행: 3%)
강의 내용 설명에 앞서 이 내용을 게재 및 다시 공부하게 된 이유는,데이터 분석에 대해 제대로 공부하지도 않고 못했던 점들이 항상 걸렸기 때문이다.이에, 기본부터 다시 시작하려고 한다.궁금한 점이 있으면 댓글로 달아주시면 아는 범위 내에서 답변 및 공유드리겠다.강의 내용을 적절히 재구성 및 요약한 점을 밝힌다. 스탠포드 Statistical Learning 첫번째 챕터 내용이다. 챕터1 소개1.1 오프닝 인사1.2 예제 및 프레임워크(출처: Statistical Learning, Stanford Online Lagunita) 한줄요약Statistical Learning 정의부터, Statistical Learning을 통해 수행가능한 것들, 지도학습 및 비지도학습에 대한 개요, 분석을 대하는 자세에 대해..
2019.01.25