Hello, R!
R 이해하기
R이란?
‘데이터를 분석하는 데 사용되는 소프트웨어’
‘뉴질랜드 오클랜드 대학교 통계학과 교수인 로스 이하카(Ross Ihaka), 로버트 젠틀맨(Robert Gentleman)’
개발자가 아닌 수학자가 만들었다
R의 쓰임
- 통계분석
- 데이터에 특성을 살펴보는 기초 통계분석부터 가설검정에 사용되는 고급 통계 분석 기법까지 다양하게 활용
- 머신러닝 모델링
- Machine Learning : 다량의 데이터를 이용해 특정 예측 모형을 만드는 기법
- R에서는 랜덤 포레스트, SVM, 딥러닝 등 최신 머신러닝 알고리즘을 쉽게 활용
- 텍스트 마이닝
- 소셜 네트워크 분석
- 지도 시각화
- 주식 분석
- 이미지 분석
- 사운드 분석
- 웹 애플리케이션 개발
R 사용자
데이터 분석가
연구자
기업
데이터 분석 대회 참가자
- 캐글(www.kaggle.com)
R이 강력한 이유
오픈 소스
- 무료로 사용 가능 Free
오픈 소스 생태계 - 다양한 패키지, 최신 분석 기법
- CRAN : R패키지 공유 사이트
다양한 교육 재료
다양한 그래프 구현
프로그래밍 방식
- 프로그래밍 방식 <-> GUI(Graphic User Interface) 방식
- 재현성 확보
- 오류 감소
- 공동 작업 가능
R과 파이썬
R | Python |
---|---|
데이터 분석용으로 만들어진 언어 | 소프트웨어를 개발하는데 사용하는 언어 |
쉽고 간단한 문법으로 데이터 분석 가능 | 다른 프로그래밍 언어에 비해 데이터 분석 기능이 잘 구축되어 있음 (TensorFlow, 딥러닝 활용 라이브러리) |
데이터 분석이 목적일때 권장 | 웹 서비스나 소프트웨어를 개발하는데 데이터 분석을 활용할때 권장 |