모니터링의 새로운 미래 관측 가능성

프로메테우스, 그라파나, 오픈텔레메트리까지 마이크로서비스와 인공지능 중심의 옵저버빌리티 구현

정현석, 진미란 | 제이펍 | 2024년 03월 15일 | PDF

이용가능환경 : Windows/Android/iOS 구매 후, PC, 스마트폰, 태블릿PC에서 파일 용량 제한없이 다운로드 및 열람이 가능합니다.

구매

종이책 정가 38,000원

전자책 정가 26,600원

판매가 26,600원

도서소개

마이크로서비스와 인공지능 사례 중심의 관측 가능성 실무 가이드

클라우드 네이티브 기술이 고도화되고 시스템이 복잡해질수록 근본 원인 분석을 위한 관측 가능성이 필수다. 이 책은 분산 서비스에서 빼놓을 수 없는 쿠버네티스를 기반으로 관측 가능성을 다룬다. 프로메테우스부터 그라파나, 오픈텔레메트리까지 다양하게 다루고 있어 관측 가능성에 대한 폭넓은 지식을 얻을 수 있다. 직접 실습할 수 있도록 Go 언어와 파이썬으로 개발한 마이크로서비스를 제공하며, 다양한 예제를 통해 시스템을 구축해보면서 근본 원인에 대한 분석 방법을 이해하도록 구성했다. 예제는 실무에 가깝게 구성되어 현장에서 바로 적용이 가능한 기술을 익힐 수 있다.

저자소개

정현석
액센츄어(Accenture), IBM에서 소프트웨어 엔지니어로 근무했고, 현재 호주 시드니에 있는 맥쿼리그룹에서 SRE로 근무하고 있다. 비용 절감을 위해 다양한 관측 가능성 설루션을 하나로 통합하고 있으며, USED/RED 대시보드와 알람을 표준화해서 배포를 자동화했다. 실사용자 모니터링을 사용하여 프런트엔드부터 백엔드까지 관측 가능성을 적용하고, 비즈니스적인 가치를 찾고 기술적으로 구현하기 위해 지원하고 있다. 또한, 관측 가능성을 고도화해서 근본 원인 분석과 IT 운영 자동화를 이루고, 나아가 AIOps가 구현될 수 있도록 협업 중이다.

 진미란
클라우드 엔지니어로 근무하며 데이터, ML 분야의 여러 베스트 프랙티스를 경험했다. 머신러닝의 프로세스 자동화, 재현 가능성 및 지속성이 중요하다고 생각하고, 머신러닝 모델을 서비스화하여 UX에 도움을 주거나 수익을 창출하는 등의 실용성에 대해 고민하고 있다. 현재는 MLOps 엔지니어로 근무하며 관련 설루션을 개발하고 있다. 새로운 것에 도전하고 값진 경험으로 성장하기를 희망하는 미래의 나와, 실제로 그것을 해내야 하는 현실 속의 나 사이의 괴리로 인해 갈등하지만, ‘이것도 그냥 나인가 보다’ 하고 받아들이는 수행 과정에 있다.

목차소개

추천사 x
베타리더 후기 xiii
머리말 xv
이 책에 대하여 xvii

CHAPTER 1 관측 가능성의 개념과 방향성 1

1.1 관측 가능성의 세 가지 요소 2
__1.1.1 모니터링과 차이점 2
__1.1.2 관측 가능성 구성 요소 51.2 메트릭 6
__1.2.1 가용성 6
__1.2.2 구글의 골든 시그널 7
__1.2.3 메트릭 유형 12
__1.2.4 시계열 데이터 13
__1.2.5 프로메테우스의 히스토그램 16
__1.2.6 메트릭 관리 방안 21
1.3 추적 25
__1.3.1 추적 구성 요소 25
__1.3.2 추적 데모 29
1.4 로그 37
__1.4.1 로그 관리 37
__1.4.2 로그 표준화 40
1.5 상관관계 44
__1.5.1 상관관계의 필요성 44
__1.5.2 상관관계 구현 방안 46
1.6 관측 가능성 데모 52
__1.6.1 데모의 방향성 52
__1.6.2 관측 가능성 데모 목록 54
1.7 관측 가능성 목표 59
__1.7.1 레퍼런스 아키텍처 59
__1.7.2 핵심 목표 60
1.8 관측 가능성 오픈소스 64
1.9 관측 가능성 방향성 65

CHAPTER 2 관측 가능성 기반 기술 69

2.1 트래픽 관리 69
__2.1.1 단일 장애점 69
__2.1.2 로드 밸런서 70
__2.1.3 복원성 패턴 73
__2.1.4 가시성 78
__2.1.5 서비스 메시 79
2.2 쿠버네티스 오토스케일링 81
__2.2.1 오토스케일링 오픈소스 85
__2.2.2 메트릭 측정 90
__2.2.3 메트릭 선정 91
2.3 관측 가능성 프로세스 96
__2.3.1 관측 가능성 운영 프로세스 96
__2.3.2 관측 가능성 장애 프로세스 97
2.4 수평 샤딩 99
2.5 마이크로서비스 102
__2.5.1 마이크로서비스 개발 흐름 103
__2.5.2 관측 가능성의 마이크로서비스 105
__2.5.3 읽기와 쓰기를 분리하기 106
2.6 일관된 해시 108
2.7 관측 가능성 시각화 113
2.8 키-값 저장소 119
2.9 객체 스토리지 120
2.10 안정적 데이터 관리 121
2.11 시계열 데이터 집계 128

CHAPTER 3 관측 가능성의 시작, 프로메테우스 131

3.1 프로메테우스 바이너리 구성 131
3.2 프로메테우스 시계열 데이터베이스 138
__3.2.1 데이터 형식 138
__3.2.2 데이터 관리 139
__3.2.3 블록 관리 141
3.3 프로메테우스 쿠버네티스 구성 144
3.4 프로메테우스 오퍼레이터 146
3.5 프로메테우스 오토스케일링 154
__3.5.1 프로메테우스 어댑터 154
__3.5.2 KEDA 오토스케일 159
3.6 프로메테우스 알람 162
3.7 프로메테우스 운영 아키텍처 170
__3.7.1 샤딩 아키텍처 170
__3.7.2 페더레이션 아키텍처 173
3.8 타노스 운영 175
__3.8.1 타노스 아키텍처 175
__3.8.2 타노스 사이드카 방식 178
__3.8.3 타노스 리시버 방식 181
__3.8.4 타노스 구성 183
__3.8.5 타노스 테스트 186

CHAPTER 4 오픈소스 관측 가능성, 그라파나 189

4.1 그라파나 관측 가능성 190
__4.1.1 목적과 범위 190
__4.1.2 인프라 구성 191
__4.1.3 애플리케이션 구성 193
4.2 로키 로그 관리 202
__4.2.1 로키 기능 202
__4.2.2 로키 바이너리 구성 213
__4.2.3 프롬테일 쿠버네티스 구성 214
__4.2.4 로키 쿠버네티스 구성 215
__4.2.5 로키 테스트 221
4.3 미미르 메트릭 관리 224
__4.3.1 미미르 기능 224
__4.3.2 미미르 구성 232
__4.3.3 미미르 쿠버네티스 구성 236
__4.3.4 미미르 업무 규칙 238
4.4 템포 추적 관리 245
__4.4.1 템포 기능 245
__4.4.2 템포 바이너리 구성 249
__4.4.3 템포 쿠버네티스 구성 250
__4.4.4 템포 쿠버네티스 테스트 252
4.5 예거 추적 관리 254
__4.5.1 예거 쿠버네티스 구성 254
__4.5.2 예거 데이터 모델 257

CHAPTER 5 그라파나 관측 가능성 데모 259

5.1 상관관계 261
__5.1.1 메트릭에서 추적으로 262
__5.1.2 추적에서 메트릭으로 263
__5.1.3 로그에서 추적으로 270
__5.1.4 추적에서 로그로 271
__5.1.5 메트릭에서 로그로 272
5.2 뉴 스택 278
__5.2.1 뉴 스택 소개 279
__5.2.2 뉴 스택 구성 284
__5.2.3 뉴 스택 상관관계 287
5.3 라이드 온디맨드 294
__5.3.1 시스템 설정 296
__5.3.2 소스 설명 309
__5.3.3 HotROD 개선 방향 328
5.4 그라파나 관측 가능성 330
__5.4.1 시스템 개요 330
__5.4.2 소스 설명 333
__5.4.3 시스템 구성 336
__5.4.4 그라파나 데이터 소스 설정 341

CHAPTER 6 관측 가능성의 표준, 오픈텔레메트리 343

6.1 오픈텔레메트리 소개 344
6.2 오픈텔레메트리 컴포넌트 345
__6.2.1 신호의 구성 요소 347
__6.2.2 콘텍스트 전파 358
__6.2.3 파이프라인 359
6.3 추적 361
__6.3.1 오픈텔레메트리 추적 소개 361
__6.3.2 추적 파이프라인 구성 367
6.4 메트릭 374
__6.4.1 오픈텔레메트리 메트릭 소개 374
__6.4.2 메트릭 파이프라인 구성 378
6.5 로그 384
__6.5.1 오픈텔레메트리 로그 소개 384
__6.5.2 로그 파이프라인 구성 391
6.6 컬렉터 397
__6.6.1 오픈텔레메트리 컬렉터 소개 397
__6.6.2 컬렉터 파이프라인 구성 400
6.7 오픈텔레메트리 데모 404

CHAPTER 7 관측 가능성을 넘어 자동화로 425

7.1 IT 운영 자동화 425
7.2 AIOps의 발전 단계 427
__7.2.1 지능형 경고 429
__7.2.2 상관관계 429
__7.2.3 이상 탐지 430
7.3 AIOps의 기술들 431
7.4 앞으로 더 배울 내용 433
__7.4.1 다섯 가지 텔레메트리 433
__7.4.2 이상 탐지 434
__7.4.3 근본 원인 분석 435
__7.4.4 데이터 파이프라인 436
__7.4.5 오픈서치 관측 가능성 436
__7.4.6 멀티 클러스터와 멀티 테넌트 437
__7.4.7 자동 계측 439
__7.4.8 SLO 규칙과 시각화 439


용어 설명 440
찾아보기 445

회원리뷰 (0)

현재 회원리뷰가 없습니다.

첫 번째 리뷰를 남겨주세요!