도서소개
저자소개
목차소개
머리말 4
제1장 Data Lake 개요
1. Data Lake의 등장 배경15
2. Data Lake의 중요성22
3. Data Lake의 개념27
4. Data Lake 구성요소29
제2장 Data Lake 참조 아키텍처
1. 빅데이터 참조 아키텍처39
1-1. 람다 아키텍처39
1-2. 카파 아키텍처43
1-3. 참조 아키텍처 간 비교47
2. 빅데이터 솔루션 아키텍처51
2-1. Cloudera Hadoop52
2-2. Cloudera Data Platform59
2-3. AWS Data Lake65
2-4. Azure Data Lake73
2-5. 솔루션 아키텍처 간 비교81
제3장 Data Lake 아키텍처 설계
1. 아키텍처 설계 기본 원칙94
2. 아키텍처 설계 방향99
2-1. 단기 아키텍처100
2-2. 장기 아키텍처107
2-3. 설계 시 주요 의사결정 사항113
3. 구성요소별 아키텍처 설계139
3-1. 데이터 수집 Layer140
3-2. 데이터 적재 Layer149
3-3. 데이터 처리 Layer158
3-4. 데이터 제공 Layer195
3-5. 사용자 Self-Service Layer203
3-6. 데이터 거버넌스 Layer221
맺음말 230
참고자료 239
색인 241