목차정보
![목차정보](/Users/maf/K/Images/sub/ElevenTitleSearch_content.gif)
서명 : (비즈니스를 위한) 데이터 과학 : 빅데이터를 바라보는 데이터 마이닝과 분석적 사고 지은이ㆍ옮긴이 소개 = 4 이 책에 쏟아진 찬사 = 5 옮긴이의 말 = 8 서문 = 9 감사의 글 = 15 CHAPTER 1 개요 : 데이터 분석적 사고 방식 1.1 데이터가 제공하는 무한한 기회 = 27 1.2 예 : 허리케인 프란시스 = 29 1.3 예제 : 고객 이탈 예측 = 30 1.4 데이터 과학, 데이터 공학, 데이터 주도 의사 결정 = 31 1.5 데이터 처리와 '빅 데이터' = 34 1.6 빅 데이터 1.0에서 빅 데이터 2.0으로 = 35 1.7 전략적 자산으로서의 데이터 및 데이터 과학 능력 = 36 1.8 데이터 분석적 사고 = 40 1.9 이 책에 대하여 = 42 1.10 다시 보는 데이터 마이닝과 데이터 과학 = 42 1.11 데이터 과학과 데이터 과학자의 일은 화학과 시험관의 관계 = 43 1.12 요약 = 44 CHAPTER 2 비즈니스 문제와 데이터 과학 해결책 2.1 비즈니스 문제에서 시작해 데이터 마이닝 작업으로 = 48 2.2 감독 방법과 자율 방법 = 51 2.3 데이터 마이닝과 그 결과 = 53 2.4 데이터 마이닝 프로세스 = 55 2.4.1 비즈니스 이해 = 56 2.4.2 데이터 이해 = 57 2.4.3 데이터 준비 = 58 2.4.4 모델링 = 59 2.4.5 평가 = 60 2.4.6 배치 = 61 2.5 데이터 과학팀을 관리한다는 것은? = 63 2.6 그 외 분석 기법 및 기술 = 64 2.6.1 통계학 = 65 2.6.2 데이터베이스 쿼리 = 67 2.6.3 데이터 웨어하우스 = 68 2.6.4 회귀 분석 = 68 2.6.5 기계 학습과 데이터 마이닝 = 69 2.6.6 이 기법들을 이용해 비즈니스 질문에 답하기 = 70 2.7 요약 = 71 CHAPTER 3 예측 모델링 개요 : 연관성에서 감독 세분화까지 3.1 모델, 유도, 예측 = 75 3.2 감독 세분화 = 78 3.2.1 정보를 전달하는 속성의 선택 = 79 3.2.2 사례 : 정보량을 증가시키는 속성 선택 = 87 3.2.3 트리 구조 모델을 이용한 감독 세분화 = 94 3.3 세분화 과정의 시각화 = 101 3.4 규칙 집합으로서의 트리 = 103 3.5 확률 추정 = 104 3.6 사례 : 트리 유도로 고객 이탈 문제 해결하기 = 107 3.7 요약 = 110 CHAPTER 4 데이터에 대한 모델 적합화 4.1 수학 함수를 통한 분류 = 115 4.1.1 선형 판별 함수 = 117 4.1.2 목적 함수의 최적화 = 120 4.1.3 데이터에서 선형 판별식을 찾아내는 예 = 120 4.1.4 객체를 점수화하고 순위 매기는 선형 판별 함수 = 122 4.1.5 지원 벡터 기계 개요 = 123 4.2 수학 함수를 이용한 회귀 분석 = 126 4.3 계층 확률 추정과 로지스틱 회귀 분석 = 129 4.3.1 로지스틱 회귀 분석 : 수학적 세부 사항 = 132 4.4 사례 : 로지스틱 회귀 분석과 트리 유도 비교 = 134 4.5 비선형 함수, 지원 벡터 기계, 신경망 = 139 4.6 요약 = 141 CHAPTER 5 과적합화 문제 해결 5.1 일반화 = 143 5.2 과적합화 = 145 5.3 과적합화 검사 = 146 5.3.1 예비 데이터와 적합도 그래프 = 146 5.3.2 트리 유도에서의 과적합화 = 148 5.3.3 수학 함수에서의 과적합화 = 151 5.4 사례 : 선형 함수 과적합화 = 152 5.5 사례 : 왜 과적합화가 문제인가? = 155 5.6 예비 데이터 평가에서 교차 검증까지 = 158 5.7 다시 모델링한 고객 이탈 문제 = 161 5.8 학습 곡선 = 162 5.9 과적합화 회피와 복잡도 제어 = 164 5.9.1 트리 유도에서 과적합화 회피 = 164 5.9.2 과적합화를 피하기 위한 일반적인 방법 = 166 5.9.3 파라미터 최적화에서 과적합화 피하기 = 168 5.10 요약 = 172 CHAPTER 6 유사도, 이웃, 군집 6.1 유사도와 거리 = 176 6.2 최근접 이웃 추론 = 178 6.2.1 사례 : 위스키 분석 = 179 6.2.2 예측 모델링하기 위한 최근접 이웃 = 181 6.2.3 얼마나 많은 이웃이 얼마나 많은 영향을 미칠까? = 184 6.2.4 기하 해석, 과적합, 복잡도 제어 = 186 6.2.5 최근접 이웃 방법의 문제점 = 190 6.3 유사도 및 이웃에 관한 주요 세부 사항 = 193 6.3.1 이질적인 속성 = 193 6.3.2 그 외 거리 함수들 = 194 6.3.3 혼합 함수 : 이웃 점수 매기기 = 197 6.4 군집화 = 199 6.4.1 사례 : 위스키 분석 다시 보기 = 200 6.4.2 계층적 군집화 = 200 6.4.3 다시 보는 최근접 이웃 : 중점 주변의 군집화 = 205 6.4.4 예제 : 비즈니스 뉴스 기사 군집화 = 210 6.4.5 군집화 결과의 이해 = 214 6.4.6 군집을 설명하기 위해 감독 학습법 적용하기 = 216 6.5 비즈니스 문제 해결과 데이터 탐사 문제 = 219 6.6 요약 = 222 CHAPTER 7 결정 분석적 사고 1 : 좋은 모델은? 7.1 분류자 평가 = 224 7.1.1 널리 사용되는 정확도가 가진 문제 = 225 7.1.2 혼동 행렬 = 226 7.1.3 편중된 계층 문제 = 226 7.1.4 비용대비 효과의 불균형 문제 = 230 7.2 모델 평가에 대한 일반적인 원리 = 230 7.3 핵심 분석 프레임워크 : 기댓값 = 231 7.3.1 기댓값을 사용한 분류자 사용 = 232 7.3.2 기댓값을 이용한 분류자 평가 = 234 7.4 평가, 기준선 성능, 데이터 투자의 영향 = 242 7.5 요약 = 246 CHAPTER 8 모델 성능 시각화 8.1 분류 대신 서열화하기 = 250 8.2 수익 곡선 = 252 8.3 ROC 그래프와 곡선 = 255 8.4 ROC 곡선 하위 영역(AUC) = 260 8.5 누적 응답 곡선과 향상도 곡선 = 260 8.6 예제 : 고객 이탈 모델링에 대한 성능 분석 = 263 8.7 요약 = 272 CHAPTER 9 증거와 확률 9.1 예제 : 온라인 고객 광고 타겟팅 = 275 9.2 증거의 통계적 조합 = 278 9.2.1 결합 확률과 독립 = 279 9.2.2 베이즈 규칙 = 280 9.3 데이터 과학에 베이즈 규칙 응용 = 282 9.3.1 조건부 독립과 나이브 베이즈 = 283 9.3.2 나이브 베이즈의 장단점 = 285 9.4 증거 '향상도' 모델 = 287 9.5 예제 : 페이스북 '좋아요'의 증거 향상도 = 288 9.5.1 증거의 활용 : 타겟 광고 = 290 9.6 요약 = 291 CHAPTER 10 텍스트 표현 및 마이닝 10.1 텍스트가 중요한 이유 = 294 10.2 텍스트가 어려운 이유 = 295 10.3 텍스트 표현법 = 296 10.3.1 단어 주머니 = 296 10.3.2 단어 빈도 = 297 10.3.3 희박성 측정 : 역문서 빈도(IDF) = 299 10.3.4 단어 빈도와 역문서 빈도의 결합(TFIDF) = 301 10.4 예제 : 재즈 음악가 = 302 10.5 IDF와 엔트로피의 관계 = 306 10.6 단어 주머니보다 복잡한 표현들 = 309 10.6.1 n-그램 순열 = 309 10.6.2 개체명 추출 = 310 10.6.3 주제 모델 = 310 10.7 예제 : 주가 변동을 예측하기 위한 뉴스 기사 마이닝 = 312 10.7.1 작업 = 312 10.7.2 데이터 = 314 10.7.3 데이터 전처리 = 317 10.7.4 결과 = 318 10.8 요약 = 322 CHAPTER 11 결정 분석적 사고 2 : 분석 공학 11.1 자선 단체 후원할 가능성이 높은 후원자 타겟팅 = 326 11.1.1 기댓값 프레임워크 : 문제 분할과 부분 해결책 재조합 = 326 11.1.2 표본 편중에 대한 여담 = 329 11.2 훨씬 더 복잡한 고객 이탈 문제 = 330 11.2.1 기댓값 프레임워크 : 더욱 복잡한 문제의 구조화 = 330 11.2.2 혜택의 영향 평가 = 332 11.2.3 기댓값 분할에서 데이터 과학 해결책으로 = 333 11.3 요약 = 337 CHAPTER 12 기타 데이터 과학 작업과 기법 12.1 동시 발생과 연관성의 발견 = 340 12.1.1 놀라운 발견 : 향상도와 영향도 = 341 12.1.2 예제 : 맥주와 로또 = 342 12.1.3 페이스북 '좋아요' 간의 연관성 = 343 12.2 프로파일링 : 전형적인 행동의 발견 = 347 12.3 연결 예측과 친구 추천 = 352 12.4 데이터 축소, 잠재 정보, 영화 추천 = 354 12.5 편중, 편차, 조합 기법 = 358 12.6 데이터 주도 인과 관계 설명과 바이럴 마케팅 예제 = 361 12.7 요약 = 363 CHAPTER 13 데이터 과학과 비즈니스 전략 13.1 돌아온 데이터 분석적 사고 = 366 13.2 데이터 과학으로 경쟁 우위 획득 = 368 13.3 데이터 과학으로 경쟁 우위 유지 = 369 13.3.1 강력한 역사적 유산 = 370 13.3.2 고유한 지적 재산 = 370 13.3.3 고유한 무형의 담보 자산 = 371 13.3.4 최고의 데이터 과학자 = 371 13.3.5 초우량 데이터 과학 관리 = 373 13.4 데이터 과학자 및 팀의 영입과 육성 = 375 13.5 데이터 과학 사례 연구 조사 = 377 13.6 모든 창조적인 아이디어의 수용 = 378 13.7 데이터 과학 프로젝트 제안서 평가 = 379 13.7.1 데이터 마이닝 제안서 예제 = 379 13.7.2 빅레드 제안서의 결합 = 380 13.8 기업의 데이터 과학 성숙도 = 381 CHAPTER 14 결론 14.1 데이터 과학의 기본 개념 = 385 14.1.1 기본 개념을 새로운 문제에 적용하기 : 휴대 기기 데이터 마이닝 = 388 14.1.2 비즈니스 문제의 해결책에 대한 사고 방식의 전환 = 391 14.2 데이터가 할 수 없는 일 : 사람이 중심에 = 392 14.3 개인 정보 보호, 윤리, 데이터 마이닝 = 396 14.4 데이터 과학에 대한 남은 이야기 = 397 14.5 마지막 사례 : 크라우드 소싱에서 클라우드 소싱으로 = 398 14.6 책을 마치며 = 399 APPENDIX 부록 A.1 제안서 검토 가이드 = 401 A.2 또 다른 제안서 예제 = 404 A.3 용어 정리 = 406 찾아보기 = 414 |