상세정보

HOME > 상세정보

(비즈니스를 위한) 데이터 과학 : 빅데이터를 바라보는 데이터 마이닝과 분석적 사고 / 포스터 ...
  • 국적:한국
자료유형
단행본
ISBN
9788968481093 13000\28000
언어부호
본문언어 - kor, 원저작언어 - eng
KDC
005.7-5
청구기호
005.7 프235ㅂ
저자명
프로보스트, 포스터
서명/저자
(비즈니스를 위한) 데이터 과학 : 빅데이터를 바라보는 데이터 마이닝과 분석적 사고 / 포스터 프로보스트 ; 톰 보셋 [같이] 지음 ; 강권학 옮김
발행사항
서울 : 한빛미디어, 2014
형태사항
419 p. : 삽화, 도표 ; 24 cm
주기사항
권말부록으로 "제안서 검토 가이드", "또 다른 제안서 예제", "용어 정리" 수록
서지주기
색인수록
원서명/원저자명
Data science for business: what you need to know about data mining and data-analytic thinking
원서명/원저자명
Foster Provost /
원서명/원저자명
Tom Fawcett /
키워드
데이터관리 데이터마이닝 빅데이터
기타저자
Provost, Foster
기타저자
Fawcett, Tom
기타저자
강권학
기타저자
포셋, 톰
가격
\28000
Control Number
maf:37886

소장정보

 
소장자료
서가번호 등록번호 청구기호 소장처 대출가능여부 대출정보
0023866 005.7 프235ㅂ   농림축산식품부 자료실 대출가능    
* 대출중인 자료에 한하여 예약이 가능합니다. 예약을 원하시면 예약버튼을 클릭하십시오.
신규검색 간략정보이동 상세정보출력 마크정보

 008150708s2014    ulkad         991a  kor
 020  ▼a9788968481093▼g13000▼c\28000
 0411 ▼akor▼heng
 056  ▼a005.7▼25
 090  ▼a005.7▼b프235ㅂ
 1001 ▼a프로보스트, 포스터
 24520▼a(비즈니스를 위한) 데이터 과학▼b빅데이터를 바라보는 데이터 마이닝과 분석적 사고▼d포스터 프로보스트▼e톰 보셋 [같이] 지음▼e강권학 옮김
 260  ▼a서울▼b한빛미디어▼c2014
 300  ▼a419 p.▼b삽화, 도표▼c24 cm
 50010▼a권말부록으로 "제안서 검토 가이드", "또 다른 제안서 예제", "용어 정리" 수록
 504  ▼a색인수록
 50710▼tData science for business: what you need to know about data mining and data-analytic thinking
 50710▼aFoster Provost
 50710▼aTom Fawcett
 653  ▼a데이터관리▼a데이터마이닝▼a빅데이터
 7001 ▼aProvost, Foster
 7001 ▼aFawcett, Tom
 7001 ▼a강권학
 90010▼a포셋, 톰
 9500 ▼b\28000
목차정보보기
지은이ㆍ옮긴이 소개 = 4
이 책에 쏟아진 찬사 = 5
옮긴이의 말 = 8
서문 = 9
감사의 글 = 15

CHAPTER 1 개요 : 데이터 분석적 사고 방식 
  1.1 데이터가 제공하는 무한한 기회 = 27
  1.2 예 : 허리케인 프란시스 = 29
  1.3 예제 : 고객 이탈 예측 = 30
  1.4 데이터 과학, 데이터 공학, 데이터 주도 의사 결정 = 31
  1.5 데이터 처리와 '빅 데이터' = 34
  1.6 빅 데이터 1.0에서 빅 데이터 2.0으로 = 35
  1.7 전략적 자산으로서의 데이터 및 데이터 과학 능력 = 36
  1.8 데이터 분석적 사고 = 40
  1.9 이 책에 대하여 = 42
  1.10 다시 보는 데이터 마이닝과 데이터 과학 = 42
  1.11 데이터 과학과 데이터 과학자의 일은 화학과 시험관의 관계 = 43
  1.12 요약 = 44

CHAPTER 2 비즈니스 문제와 데이터 과학 해결책 
  2.1 비즈니스 문제에서 시작해 데이터 마이닝 작업으로 = 48
  2.2 감독 방법과 자율 방법 = 51
  2.3 데이터 마이닝과 그 결과 = 53
  2.4 데이터 마이닝 프로세스 = 55
    2.4.1 비즈니스 이해 = 56
    2.4.2 데이터 이해 = 57
    2.4.3 데이터 준비 = 58
    2.4.4 모델링 = 59
    2.4.5 평가 = 60
    2.4.6 배치 = 61 
  2.5 데이터 과학팀을 관리한다는 것은? = 63
  2.6 그 외 분석 기법 및 기술 = 64
    2.6.1 통계학 = 65
    2.6.2 데이터베이스 쿼리 = 67
    2.6.3 데이터 웨어하우스 = 68
    2.6.4 회귀 분석 = 68
    2.6.5 기계 학습과 데이터 마이닝 = 69
    2.6.6 이 기법들을 이용해 비즈니스 질문에 답하기 = 70
  2.7 요약 = 71

CHAPTER 3 예측 모델링 개요 : 연관성에서 감독 세분화까지 
  3.1 모델, 유도, 예측 = 75
  3.2 감독 세분화 = 78
    3.2.1 정보를 전달하는 속성의 선택 = 79 
    3.2.2 사례 : 정보량을 증가시키는 속성 선택 = 87
    3.2.3 트리 구조 모델을 이용한 감독 세분화 = 94
  3.3 세분화 과정의 시각화 = 101
  3.4 규칙 집합으로서의 트리 = 103
  3.5 확률 추정 = 104
  3.6 사례 : 트리 유도로 고객 이탈 문제 해결하기 = 107
  3.7 요약 = 110

CHAPTER 4 데이터에 대한 모델 적합화 
  4.1 수학 함수를 통한 분류 = 115
    4.1.1 선형 판별 함수 = 117
    4.1.2 목적 함수의 최적화 = 120
    4.1.3 데이터에서 선형 판별식을 찾아내는 예 = 120
    4.1.4 객체를 점수화하고 순위 매기는 선형 판별 함수 = 122
    4.1.5 지원 벡터 기계 개요 = 123
  4.2 수학 함수를 이용한 회귀 분석 = 126 
  4.3 계층 확률 추정과 로지스틱 회귀 분석 = 129
    4.3.1 로지스틱 회귀 분석 : 수학적 세부 사항 = 132
  4.4 사례 : 로지스틱 회귀 분석과 트리 유도 비교 = 134
  4.5 비선형 함수, 지원 벡터 기계, 신경망 = 139
  4.6 요약 = 141

CHAPTER 5 과적합화 문제 해결 
  5.1 일반화 = 143
  5.2 과적합화 = 145
  5.3 과적합화 검사 = 146
    5.3.1 예비 데이터와 적합도 그래프 = 146
    5.3.2 트리 유도에서의 과적합화 = 148
    5.3.3 수학 함수에서의 과적합화 = 151
  5.4 사례 : 선형 함수 과적합화 = 152
  5.5 사례 : 왜 과적합화가 문제인가? = 155
  5.6 예비 데이터 평가에서 교차 검증까지 = 158
  5.7 다시 모델링한 고객 이탈 문제 = 161
  5.8 학습 곡선 = 162
  5.9 과적합화 회피와 복잡도 제어 = 164
    5.9.1 트리 유도에서 과적합화 회피 = 164
    5.9.2 과적합화를 피하기 위한 일반적인 방법 = 166
    5.9.3 파라미터 최적화에서 과적합화 피하기 = 168
  5.10 요약 = 172

CHAPTER 6 유사도, 이웃, 군집 
  6.1 유사도와 거리 = 176
  6.2 최근접 이웃 추론 = 178
    6.2.1 사례 : 위스키 분석 = 179
    6.2.2 예측 모델링하기 위한 최근접 이웃 = 181
    6.2.3 얼마나 많은 이웃이 얼마나 많은 영향을 미칠까? = 184
    6.2.4 기하 해석, 과적합, 복잡도 제어 = 186
    6.2.5 최근접 이웃 방법의 문제점 = 190
  6.3 유사도 및 이웃에 관한 주요 세부 사항 = 193
    6.3.1 이질적인 속성 = 193
    6.3.2 그 외 거리 함수들 = 194
    6.3.3 혼합 함수 : 이웃 점수 매기기 = 197
  6.4 군집화 = 199
    6.4.1 사례 : 위스키 분석 다시 보기 = 200
    6.4.2 계층적 군집화 = 200
    6.4.3 다시 보는 최근접 이웃 : 중점 주변의 군집화 = 205
    6.4.4 예제 : 비즈니스 뉴스 기사 군집화 = 210
    6.4.5 군집화 결과의 이해 = 214
    6.4.6 군집을 설명하기 위해 감독 학습법 적용하기 = 216
  6.5 비즈니스 문제 해결과 데이터 탐사 문제 = 219
  6.6 요약 = 222

CHAPTER 7 결정 분석적 사고 1 : 좋은 모델은? 
  7.1 분류자 평가 = 224
    7.1.1 널리 사용되는 정확도가 가진 문제 = 225
    7.1.2 혼동 행렬 = 226
    7.1.3 편중된 계층 문제 = 226
    7.1.4 비용대비 효과의 불균형 문제 = 230
  7.2 모델 평가에 대한 일반적인 원리 = 230
  7.3 핵심 분석 프레임워크 : 기댓값 = 231
    7.3.1 기댓값을 사용한 분류자 사용 = 232
    7.3.2 기댓값을 이용한 분류자 평가 = 234
  7.4 평가, 기준선 성능, 데이터 투자의 영향 = 242
  7.5 요약 = 246

CHAPTER 8 모델 성능 시각화 
  8.1 분류 대신 서열화하기 = 250
  8.2 수익 곡선 = 252 
  8.3 ROC 그래프와 곡선 = 255
  8.4 ROC 곡선 하위 영역(AUC) = 260
  8.5 누적 응답 곡선과 향상도 곡선 = 260
  8.6 예제 : 고객 이탈 모델링에 대한 성능 분석 = 263
  8.7 요약 = 272

CHAPTER 9 증거와 확률 
  9.1 예제 : 온라인 고객 광고 타겟팅 = 275
  9.2 증거의 통계적 조합 = 278
    9.2.1 결합 확률과 독립 = 279
    9.2.2 베이즈 규칙 = 280
  9.3 데이터 과학에 베이즈 규칙 응용 = 282
    9.3.1 조건부 독립과 나이브 베이즈 = 283
    9.3.2 나이브 베이즈의 장단점 = 285
  9.4 증거 '향상도' 모델 = 287
  9.5 예제 : 페이스북 '좋아요'의 증거 향상도 = 288
    9.5.1 증거의 활용 : 타겟 광고 = 290
  9.6 요약 = 291

CHAPTER 10 텍스트 표현 및 마이닝 
  10.1 텍스트가 중요한 이유 = 294
  10.2 텍스트가 어려운 이유 = 295
  10.3 텍스트 표현법 = 296
    10.3.1 단어 주머니 = 296
    10.3.2 단어 빈도 = 297
    10.3.3 희박성 측정 : 역문서 빈도(IDF) = 299
    10.3.4 단어 빈도와 역문서 빈도의 결합(TFIDF) = 301
  10.4 예제 : 재즈 음악가 = 302
  10.5 IDF와 엔트로피의 관계 = 306
  10.6 단어 주머니보다 복잡한 표현들 = 309
    10.6.1 n-그램 순열 = 309
    10.6.2 개체명 추출 = 310
    10.6.3 주제 모델 = 310
  10.7 예제 : 주가 변동을 예측하기 위한 뉴스 기사 마이닝 = 312
    10.7.1 작업 = 312
    10.7.2 데이터 = 314
    10.7.3 데이터 전처리 = 317
    10.7.4 결과 = 318
  10.8 요약 = 322

CHAPTER 11 결정 분석적 사고 2 : 분석 공학 
  11.1 자선 단체 후원할 가능성이 높은 후원자 타겟팅 = 326
    11.1.1 기댓값 프레임워크 : 문제 분할과 부분 해결책 재조합 = 326
    11.1.2 표본 편중에 대한 여담 = 329
  11.2 훨씬 더 복잡한 고객 이탈 문제 = 330
    11.2.1 기댓값 프레임워크 : 더욱 복잡한 문제의 구조화 = 330
    11.2.2 혜택의 영향 평가 = 332
    11.2.3 기댓값 분할에서 데이터 과학 해결책으로 = 333
  11.3 요약 = 337

CHAPTER 12 기타 데이터 과학 작업과 기법 
  12.1 동시 발생과 연관성의 발견 = 340
    12.1.1 놀라운 발견 : 향상도와 영향도 = 341
    12.1.2 예제 : 맥주와 로또 = 342
    12.1.3 페이스북 '좋아요' 간의 연관성 = 343
  12.2 프로파일링 : 전형적인 행동의 발견 = 347
  12.3 연결 예측과 친구 추천 = 352
  12.4 데이터 축소, 잠재 정보, 영화 추천 = 354
  12.5 편중, 편차, 조합 기법 = 358 
  12.6 데이터 주도 인과 관계 설명과 바이럴 마케팅 예제 = 361
  12.7 요약 = 363

CHAPTER 13 데이터 과학과 비즈니스 전략 
  13.1 돌아온 데이터 분석적 사고 = 366
  13.2 데이터 과학으로 경쟁 우위 획득 = 368
  13.3 데이터 과학으로 경쟁 우위 유지 = 369
    13.3.1 강력한 역사적 유산 = 370
    13.3.2 고유한 지적 재산 = 370
    13.3.3 고유한 무형의 담보 자산 = 371
    13.3.4 최고의 데이터 과학자 = 371
    13.3.5 초우량 데이터 과학 관리 = 373
  13.4 데이터 과학자 및 팀의 영입과 육성 = 375
  13.5 데이터 과학 사례 연구 조사 = 377
  13.6 모든 창조적인 아이디어의 수용 = 378
  13.7 데이터 과학 프로젝트 제안서 평가 = 379
    13.7.1 데이터 마이닝 제안서 예제 = 379
    13.7.2 빅레드 제안서의 결합 = 380
  13.8 기업의 데이터 과학 성숙도 = 381

CHAPTER 14 결론 
  14.1 데이터 과학의 기본 개념 = 385
    14.1.1 기본 개념을 새로운 문제에 적용하기 : 휴대 기기 데이터 마이닝 = 388
    14.1.2 비즈니스 문제의 해결책에 대한 사고 방식의 전환 = 391
  14.2 데이터가 할 수 없는 일 : 사람이 중심에 = 392
  14.3 개인 정보 보호, 윤리, 데이터 마이닝 = 396
  14.4 데이터 과학에 대한 남은 이야기 = 397
  14.5 마지막 사례 : 크라우드 소싱에서 클라우드 소싱으로 = 398 
  14.6 책을 마치며 = 399 

APPENDIX 부록
  A.1 제안서 검토 가이드 = 401 
  A.2 또 다른 제안서 예제 = 404 
  A.3 용어 정리 = 406

찾아보기 = 414