R 데이터 프레임

데이터 프레임 이해하기

이름 영어 점수 수학 점수
김지훈 90 50
이유진 80 60
박동현 60 100
김민지 70 20

‘열’ 속성 / ‘행’ 한 사람의 정보

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
english <- c(90, 80, 60, 70)
english
## [1] 90 80 60 70

math <- c(50, 60, 100, 20)
math
## [1] 50 60 100 20

class <- c(1, 1, 2, 2)
class
## [1] 1 1 2 2

df_midterm <- data.frame(english, math, class)
df_midterm
## english math class
## 1 90 50 1
## 2 80 60 1
## 3 60 100 2
## 4 70 20 2

mean(df_midterm$english)
mean(df_midterm$math)

df_midterm <- data.frame(english = c(90, 80, 60, 70),
math = c(50, 60, 100, 20),
class = c(1, 1, 2, 2))
df_midterm

외부 데이터 가져오기

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
install.packages("readxl")
library(readxl)

getwd() # 웨킹 디렉토리 확인

df_exam <- read_excel("excel_exam.xlsx")
df_exam

mean(df_exam$english)
mean(df_exam$science)

df_exam_novar <- read_excel("excel_exam_novar.xlsx", col_names = F)
df_exam_novar

df_exam_sheet <- read_excel("excel_exam_sheet.xlsx", sheet = 3)
df_exam_sheet

df_csv_exam <- read.csv("csv_exam.csv")
df_csv_exam <- read.csv("csv_exam.csv", stringsAsFactors = F)
df_csv_exam

데이터 내보내기

1
2
3
4
5
6
df_midterm <- data.frame(english = c(90, 80, 60, 70),
math = c(50, 60, 100, 20),
class = c(1, 1, 2, 2))
df_midterm

write.csv(df_midterm, file = "df_midterm.csv")

RData파일 활용하기

  • R 전용 데이터 파일
  • 용량 작고 빠름
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
save(df_midterm, file = "df_midterm.rda")

rm(df_midterm)

df_midterm
## 에러: 객체 'df_midterm'를 찾을 수 없습니다

load("df_midterm.rda")

df_midterm
## english math class
## 1 90 50 1
## 2 80 60 1
## 3 60 100 2
## 4 70 20 2

'
변수에 할당
'
df_exam <- read_excel("excel_exam.xlsx")
df_csv_exam <- read.csv("csv_exam.csv")

'
Rda 파일 : 데이터 프레임 자동 생성
'
load("df_midterm.rda")

Comments