머리말 4
제1장 Data Catalog란 무엇인가?
1. Data Lake 플랫폼19
2. Data Lake 플랫폼에서 Data Catalog의 역할24
3. Data Catalog vs. 상품 카탈로그27
4. Data Catalog의 정의31
5. Data Catalog의 주요 기능32
6. 기존 ‘메타데이터 관리 시스템’과의 차이점38
제2장 Data Catalog는 왜 중요한가?
1. Data Lake 플랫폼의 출발점이자 관문42
2. 전사 데이터의 자산화43
3. 데이터 도구의 활용성 향상45
4. Data Catalog의 실패는 ‘데이터 늪’46
제3장 Data Catalog 주요 기능 만들기
1. 사용자 Front-End 기능51
1-1. 카탈로그 검색51
1-2. 카탈로그 조회62
1-3. 데이터 수집 요청(VoC)82
1-4. 데이터 질의응답84
1-5. 카탈로그 큐레이션85
1-6. 실데이터 조회87
1-7. 실행 스케줄러91
1-8. 데이터 전처리 도구와의 연계92
1-9. 데이터 분석 도구와의 연계93
1-10. 용어사전 관리95
1-11. My Catalog97
2. Back-End 기능98
2-1. 메타데이터 수집98
2-2. 메타데이터 추천(M/L)104
2-3. 검색엔진 색인 생성107
2-4. 쿼리 로그 수집/파싱108
2-5. 데이터 프로파일링113
2-6. 데이터 활용 현황 집계118
2-7. 데이터 배치 처리120
2-8. 데이터 보안 처리121
3. 관리자 기능126
3-1. 데이터 활용 현황판(대시보드)127
3-2. 카테고리 관리129
3-3. 데이터 요청(VoC) 처리132
3-4. 데이터 Life Cycle 관리134
3-5. 데이터 품질 관리139
3-6. 플랫폼 보안 관리143
3-7. 플랫폼 모니터링146
제4장 Data Catalog 개발 절차
1. 자체 개발 vs. 솔루션 도입 의사결정155
2. 단계별 구현 로드맵 수립163
3. 메타데이터 구축 모듈170
3-1. 대상 ‘데이터 객체’ 범위 정의171
3-2. ‘데이터 Steward’ 지정176
3-3. ‘데이터 객체’ 유형별 메타데이터 관리 항목 정의177
3-4. 항목별 메타데이터 수집 방법 및 기능 설계179
3-5. 메타데이터 관련 Back-End 기능 개발181
3-6. 카탈로그 큐레이션184
4. Data Pipeline 구축 모듈188
4-1. 원천 데이터 수집 범위 정의188
4-2. ‘데이터 오너’ 지정190
4-3. Data Pipeline 설계191
4-4. Data Pipeline 개발194
4-5. 원천 데이터 수집195
5. Front-End 구축 모듈196
5-1. Data Catalog Front-End 요건 정의196
5-2. Data Catalog Front-End 기능 설계198
5-3. Data Catalog Front-End 기능 개발199
6. 변화관리 모듈200
6-1. 변화관리 계획 수립201
6-2. 사용자 그룹별 커뮤니케이션203
6-3. 사용자 변화관리205
7. 통합 테스트207
제5장. Data Catalog의 미래 발전 방향
1. 전사 통합 데이터 포털212
2. ‘지식 포털’과의 통합213
3. 데이터 분석 관련 모든 기능의 통합215
4. ‘전사 DA 시스템’과의 통합217
5. AI 기반 카탈로그 큐레이션219
6. 개인화된 콘텐츠 추천221
참고자료 223