데이터 분석 프로젝트 '한국인의 삶을 파악하라'

‘한국복지패널데이터’ 분석 준비하기 데이터 분석 준비하기 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 # 데이터 준비하기 # [한국복지패널데이터 다운로드](bit.ly/doit_rb) # 패키지 설치 및 로드하기 install.packages("foreign") # foreign 패키지 설치 library(foreign) # SPSS 파일 불러오기 library(dpl
Read More

그래프 만들기

R로 만들 수 있는 그래프 살펴보기 * ggplot2 : 그래프를 만들 때 가장 많이 사용하는 패키지 * ggplot2 레이어 : 배경 설정(축) - 그래프 추가(점, 막대, 선) - 설정 추가(축 범위, 색, 표식) 산점도 - 변수 간 관계 표현하기 * 산점도(Scater Plot) : 데이터를 x축과 y축에 점으로 표현한 그래프 * 나이와 소득처럼 연속 값으로 된 두 변수의 관계를 표현할 때 사용 산점도 만들기 1 2 3 4 5 6 7 8 9 10 11 12 13 ' x축 y축 지정 ' ggplot(data =
Read More

R 데이터 정제

빠진 데이터 처리 결측치(Missing Value) * 누락된 값, 비어있는 값 * 함수 적용 불가, 분석 결과 왜곡 * 제거 후 분석 실시 결측치 찾기 결측치 만들기 * 결측치 표기 - 대문자 NA 1 2 3 4 5 6 7 8 9 df <- 1 2 3 4 5 data.frame(sex="c(" m"," "f", na, "m", "f"), score="c(5," 4, 3, na)) df ## sex m f 3 ## 4 M
Read More

R 데이터 가공하기

데이터 전처리 원하는 형태로 데이터 가공하기 * 데이터 전처리(Preprocessing) - dplyr 패키지 함수기능filter()행 추출select()열(변수) 추출arrange()정렬mutate()변수 추가summarise()통계치 산출group_by()집단별로 나누기left_join()데이터 합치기(열)bind_rows()데이터 합치기(행)조건에 맞는 데이터만 추출하기 (행) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 library(dplyr) exam <- read.csv("cs< div>Read More

R 데이터 분석 기초

데이터 파악하기 * head() : 데이터 앞부분 출력 * tail() : 데이터 뒷부분 출력 * View() : 뷰어 창에서 데이터 확인 * dim() : 데이터 차원 출력 (Dimension) * str() : 데이터 속성 출력 (Structure) * summary() : 요약통계량 출력 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46
Read More

R 데이터 프레임

데이터 프레임 이해하기 이름영어 점수수학 점수김지훈9050이유진8060박동현60100김민지7020‘열’ 속성 / ‘행’ 한 사람의 정보 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 english <- 1 20 50 60 70 80 90 100 c(90, 80, 60, 70) english ## [1] math <- c(50, 100, 20) class c(1, 1, 2, 2) 1< div>Read More

R 시작하기

* 통계와 그래픽을 위한 소프트웨어 * 무료 변수 (Variable) * 변하는 수 소득성별학점국적1,000만 원남자3.8대한민국2,000만 원남자4.2대한민국3,000만 원여자2.6대한민국4,000만 원여자4.5대한민국소득, 성별 : 독립 변수 ( Independent Variable )학점 : 종속 변수 ( Dependent Variable ) 국적 : 상수 ( Constant ) 변수 생성 1 2 3 4 5 6 7 8 9 10 11 a <- 1 2 a ## [1] b <- c 3.< div>Read More

Hello, R!

R 이해하기 R이란? ‘데이터를 분석하는 데 사용되는 소프트웨어’ ‘뉴질랜드 오클랜드 대학교 통계학과 교수인 로스 이하카(Ross Ihaka), 로버트 젠틀맨(Robert Gentleman)’ 개발자가 아닌 수학자가 만들었다 R의 쓰임 * 통계분석 * 데이터에 특성을 살펴보는 기초 통계분석부터 가설검정에 사용되는 고급 통계 분석 기법까지 다양하게 활용 * 머신러닝 모델링 * Machine Learning : 다량의 데이터를 이용해 특정 예측 모형을 만드는 기법 * R에서는 랜덤 포레스트, SVM, 딥러
Read More