심층 학습

이안 굿펠로, 요슈아 벤지오, 에런 쿠빌 | 제이펍 | 2020년 03월 26일 | PDF

이용가능환경 : Windows/Android/iOS 구매 후, PC, 스마트폰, 태블릿PC에서 파일 용량 제한없이 다운로드 및 열람이 가능합니다.

구매

종이책 정가 42,000원

전자책 정가 29,400원

판매가 29,400원

도서소개

심층 학습을 위한 완벽한 참고서이자 바이블!

심층 학습의 다양한 주제를 소개하는 책이다. 심층 학습과 관련된 선형대수, 확률론, 정보 이론, 수치 계산, 기계 학습의 여러 주요 개념을 소개한 다음, 심층 순방향 신경망, 정칙화, 최적화 알고리즘, 합성곱 신경망, 순차열 모형화 등등 업계 실무자들이 사용하는 여러 심층 학습 기법들을 설명하고, 현실적인 심층 학습 실천 방법론도 소개한다. 또한 자연어 처리, 음성 인식, 컴퓨터 시각, 온라인 추천 시스템, 생물정보학, 비디오 게임을 위해 심층 학습을 응용하는 방법들도 개괄한다. 마지막으로는 연구의 관점에서 심층 학습을 살펴보는데, 이를테면 선형 인자 모형, 자동부호기, 표현 학습, 구조적 확률 모형, 몬테카를로 방법 같은 이론 연구 주제들을 소개한다.

저자소개

저 : 이안 굿펠로 (Ian Goodfellow)
구글의 연구 과학자이다.

저 : 요슈아 벤지오 (Yoshua Bengio)
몬트리올 대학교의 컴퓨터 과학 교수이다.

저 : 에런 쿠빌 (Aaron Courville)
몬트리올 대학교의 컴퓨터 과학 조교수이다.

역 : 류광
25년 이상의 번역 경력을 가진 전문 번역가로, 커누스 교수의 『컴퓨터 프로그래밍의 예술』(The Art of Computer Programming) 시리즈와 스티븐스의 『UNIX 고급 프로그래밍』(Advanced Programming in UNIX Environment) 제2판 및 제3판을 포함하여 60여 권의 다양한 IT 전문서를 번역했다.

번역과 프로그래밍 외에 소프트웨어 문서화에도 많은 관심이 있으며, 수많은 오픈소스 프로젝트의 표준 문서 형식으로 쓰이는 DocBook의 국내 사용자 모임인 닥북 한국(docbook.kr)의 일원이다. 홈페이지 occam’s Razor(occamsrazr.net)와 게임 개발 사이트 GpgStudy(www.gpgstudy.com)를 운영한다.

목차소개

1장 소개

1.1 이 책의 대상 독자

1.2 심층 학습의 역사적 추세



제1부 응용 수학과 기계 학습의 기초

2장 선형대수

2.1 스칼라, 벡터, 행렬, 텐서

2.2 행렬과 벡터의 곱셈

2.3 단위행렬과 역행렬

2.4 일차종속과 생성공간

2.5 노름

2.6 특별한 종류의 행렬과 벡터

2.7 고윳값 분해

2.8 특잇값 분해

2.9 무어-펜로즈 유사역행렬

2.10 대각합 연산자

2.11 행렬식

2.12 예: 주성분분석



3장 확률론과 정보 이론

3.1 확률의 필요성

3.2 확률변수

3.3 확률분포

3.4 주변확률

3.5 조건부 확률

3.6 조건부 확률의 연쇄법칙

3.7 독립과 조건부 독립

3.8 기댓값, 분산, 공분산

3.9 흔히 쓰이는 확률분포들

3.10 흔히 쓰이는 함수들의 유용한 성질들

3.11 베이즈 법칙

3.12 연속 변수의 특별한 세부 사항

3.13 정보 이론

3.14 구조적 확률 모형



4장 수치 계산

4.1 넘침과 아래넘침

4.2 나쁜 조건화

4.3 기울기 벡터 기반 최적화

4.4 제약 있는 최적화

4.5 예제: 선형 최소제곱 문제



5장 기계 학습의 기초

5.1 학습 알고리즘

5.2 수용력, 과대적합, 과소적합

5.3 초매개변수와 검증 집합

5.4 추정량, 편향, 분산

5.5 최대가능도 추정

5.6 베이즈 통계학

5.7 지도 학습 알고리즘

5.8 비지도 학습 알고리즘

5.9 확률적 경사 하강법

5.10 기계 학습 알고리즘 만들기

5.11 심층 학습의 개발 동기가 된 기존 문제점들



제2부 현세대 심층 신경망의 실제

6장 심층 순방향 신경망

6.1 예제: XOR의 학습

6.2 기울기 기반 학습

6.3 은닉 단위

6.4 아키텍처 설계

6.5 역전파와 기타 미분 알고리즘들

6.6 역사적 참고사항



7장 심층 학습을 위한 정칙화

7.1 매개변수 노름 벌점

7.2 제약 있는 최적화로서의 노름 벌점

7.3 정칙화와 과소제약 문제

7.4 자료 집합의 증강

7.5 잡음에 대한 강인성

7.6 준지도 학습

7.7 다중 과제 학습

7.8 조기 종료

7.9 매개변수 묶기와 매개변수 공유

7.10 희소 표현

7.11 배깅과 기타 앙상블 학습법

7.12 드롭아웃

7.13 대립 훈련

7.14 접선 거리, 접선 전파, 다양체 접선 분류기



8장 심층 모형의 훈련을 위한 최적화 기법

8.1 학습과 순수한 최적화의 차이점

8.2 신경망 최적화의 난제들

8.3 기본 알고리즘

8.4 매개변수 초기화 전략

8.5 학습 속도를 적절히 변경하는 알고리즘들

8.6 근사 2차 방법들

8.7 최적화 전략과 메타알고리즘



9장 합성곱 신경망

9.1 합성곱 연산

9.2 동기

9.3 풀링

9.4 무한히 강한 사전분포로서의 합성곱과 풀링

9.5 기본 합성곱 함수의 여러 변형

9.6 구조적 출력

9.7 자료 형식

9.8 효율적인 합성곱 알고리즘

9.9 무작위 특징 또는 비지도 특징 학습

9.10 합성곱 신경망의 신경과학적 근거

9.11 합성곱 신경망으로 본 심층 학습의 역사



10장 순차열 모형화를 위한 순환 신경망과 재귀 신경망

10.1 계산 그래프 펼치기

10.2 순환 신경망

10.3 양방향 순환 신경망

10.4 부호기-복호기 순차열 대 순차열 아키텍처

10.5 심층 순환 신경망

10.6 재귀 신경망

10.7 장기 의존성의 어려움

10.8 반향 상태 신경망

10.9 누출 단위 및 여러 다중 시간 축척 전략

10.10 장단기 기억과 기타 게이트 제어 RNN들

10.11 장기 의존성을 위한 최적화

10.12 명시적 기억



11장 실천 방법론

11.1 성과 측정

11.2 기준 모형

11.3 추가 자료 수집 여부 결정

11.4 초매개변수 선택

11.5 디버깅 전략

11.6 예제: 여러 자리 수의 인식



12장 응용

12.1 대규모 심층 학습

12.2 컴퓨터 시각

12.3 음성 인식

12.4 자연어 처리

12.5 기타 응용들



제3부 심층 학습 연구

13장 선형 인자 모형

13.1 확률적 PCA와 인자분석

13.2 독립성분분석(ICA)

13.3 느린 특징 분석

13.4 희소 부호화

13.5 PCA의 다양체 해석



14장 자동부호기

14.1 과소완전 자동부호기

14.2 정칙화된 자동부호기

14.3 표현력, 층의 크기, 모형의 깊이

14.4 확률적 부호기와 복호기

14.5 잡음 제거 자동부호기

14.6 자동부호기로 다양체 배우기

14.7 축약 자동부호기

14.8 예측 희소 분해

14.9 자동부호기의 응용



15장 표현 학습

15.1 탐욕적 층별 비지도 사전훈련

15.2 전이 학습과 영역 적응

15.3 준지도 학습 기법을 이용한 원인 분리

15.4 분산 표현

15.5 깊이의 지수적 이득

15.6 바탕 원인을 발견하기 위한 단서 제공



16장 심층 학습을 위한 구조적 확률 모형

16.1 비구조적 모형화의 문제점

16.2 그래프를 이용한 모형 구조의 서술

16.3 그래프 모형의 표본추출

16.4 구조적 모형화의 장점

16.5 종속관계의 학습

16.6 추론과 근사 추론

16.7 구조적 확률 모형에 대한 심층 학습 접근 방식



17장 몬테카를로 방법

17.1 표본추출과 몬테카를로 방법

17.2 중요도 표집

17.3 마르코프 연쇄 몬테카를로 방법

17.4 기브스 표집

17.5 분리된 모드 사이의 혼합과 관련된 어려움들



18장 분배함수 공략

18.1 로그가능도의 기울기

18.2 확률적 최대가능도와 대조 발산

18.3 유사가능도

18.4 점수 부합과 비 부합

18.5 잡음 제거 점수 부합

18.6 잡음 대조 추정

18.7 분배함수의 추정



19장 근사 추론

19.1 최적화로서의 추론

19.2 기댓값 최대화

19.3 MAP 추론과 희소 부호화

19.4 변분 추론과 변분 학습

19.5 학습된 근사 추론



20장 심층 생성 모형

20.1 볼츠만 기계

20.2 제한 볼츠만 기계

20.3 심층 믿음망

20.4 심층 볼츠만 기계

20.5 실숫값 자료에 대한 볼츠만 기계

20.6 합성곱 볼츠만 기계

20.7 구조적 출력 또는 순차열 출력을 위한 볼츠만 기계

20.8 기타 볼츠만 기계

20.9 확률적(무작위) 연산에 대한 역전파

20.10 유향 생성망

20.11 자동부호기의 표본추출

20.12 생성 확률적 신경망

20.13 기타 생성 방안들

20.14 생성 모형의 평가

20.15 결론



참고문헌

찾아보기

출판사 서평

심층 학습을 위한 완벽한 참고서이자 바이블!

기계 학습의 한 형태인 심층 학습을 이용하면 컴퓨터가 개념들의 계통구조를 통해서 세계를 경험하고 이해하게 만들 수 있다. 심층 학습에서는 컴퓨터가 경험에서 지식을 수집하므로, 컴퓨터에 필요한 모든 지식을 사람(컴퓨터 운영자)이 일일이 지정할 필요가 없다. 그리고 개념들의 계통구조 덕분에 컴퓨터는 간단한 개념들을 조합해서 좀 더 복잡한 개념을 배우게 된다. 그러한 계통구조의 그래프는 다수의 층으로 이루어진 ‘심층’ 구조를 가질 수 있다. 이 책은 심층 학습의 다양한 주제를 소개한다.

독자가 이 책을 읽는 데 필요한 수학적, 개념적 토대를 마련할 수 있도록, 이 책은 우선 심층 학습과 관련된 선형대수, 확률론, 정보 이론, 수치 계산, 기계 학습의 여러 주요 개념을 소개한다. 그런 다음에는 심층 순방향 신경망, 정칙화, 최적화 알고리즘, 합성곱 신경망, 순차열 모형화 등등 업계 실무자들이 사용하는 여러 심층 학습 기법들을 설명하고, 현실적인 심층 학습 실천 방법론도 소개한다. 또한 자연어 처리, 음성 인식, 컴퓨터 시각, 온라인 추천 시스템, 생물정보학, 비디오 게임을 위해 심층 학습을 응용하는 방법들도 개괄한다. 마지막으로는 연구의 관점에서 심층 학습을 살펴보는데, 이를테면 선형 인자 모형, 자동부호기, 표현 학습, 구조적 확률 모형, 몬테카를로 방법 같은 이론 연구 주제들을 소개한다.

《심층 학습》은 업계 또는 학계에서 연구자로서의 경력을 준비하는 학부생이나 대학원생은 물론이고 자신의 제품이나 플랫폼에서 심층 학습을 사용하고자 하는 소프트웨어 기술자들을 위한 책이다. 독자와 강사에게 도움이 될 보충 자료는 부록 웹사이트에 올려 두었다.

회원리뷰 (0)

현재 회원리뷰가 없습니다.

첫 번째 리뷰를 남겨주세요!