출판사 제이펍
저자명 권재명
출판일 2017년 8월 4일
페이지 364쪽
ISBN 979-11-85890-86-9 (93000)
책 웹사이트: https://dataninja.me/ipds-kr/
- 데이터 과학이란?
- 데이터 분석 환경 구성하기
- 데이터 취득과 데이터 가공: SQL과 dplyr
- 데이터 시각화 I: ggplot2
- 코딩 스타일
- 통계의 기본 개념 복습
- 데이터 종류에 따른 분석 기법
- 빅데이터 분류분석 I: 기본개념과 로지스틱 모형
- 빅데이터 분류분석 II: 라쏘와 랜덤 포레스트
- 빅데이터 분류분석 III: 암 예측
- 빅데이터 분류분석 IV: 스팸 메일 예측
- 분석결과 정리와 공유, R 마크다운
- 빅데이터 회귀분석 I. 부동산 가격 예측
- 빅데이터 회귀분석 II. 와인 품질 예측
- 데이터 시각화 II: 단어 구름을 사용한 텍스트 데이터의 시각화
- 실리콘 밸리에서 데이터 과학자 되기
- R https://www.r-project.org/
- R스튜디오 (RStudio) https://www.rstudio.com/
- 컴퓨터에 git clone 클론해서 사용하세요.
- 각 서브디렉토리는 RStudio 프로젝트입니다.
- 각 서브디렉토리 안에 있는 *.Rproject 파일을 열면 R스튜디오 프로젝트가 열립니다.
- *.R 파일들을 열어서 책을 따라 실행해 보세요.