Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
Tags
- java
- oracle
- Position
- rnn
- 메서드
- 반응형웹
- ObjectOutputStream
- html 프로젝트
- FileWriter
- 미디어쿼리
- 사전학습
- inline
- 파이썬
- 반응형 웹 프로젝트
- Database
- g검정
- FFT
- html 기초
- iframe 태그
- css 기초
- CSS
- 푸리에 변환
- GridLayout
- 상속
- FlowLayout
- 퍼셉트론
- Codility
- HTML
- BorderLayout
- 예제
Archives
- Today
- Total
도라에몽주머니
[G검정/4장] 기울기 소실 문제 본문
誤差逆伝播法 (오차역전파법 ; Backpropagation)
: 출력에 가까운 순으로 연쇄적으로 기울기를 구하는 학습법
오차역전파법에서 발생한 문제
역전파 알고리즘에서 처음 입력층으로 진행할 수록 기울기가 점차적으로 작아지다가 나중에는 거의 기울기의 변화가 없어지는 문제 (기울기 소실 문제) 가 발생했다.
문제의 원인
문제의 원인은 역전파 알고리즘의 활성화 함수로 시그모이드 함수를 사용했기 때문이다.
시그모이드 함수의 특성 때문에 기울기 소실 문제가 발생한다.
시그모이드 함수의 특성
아래 사진은 시그모이드 함수의 그래프이다.
0~1 사이의 값을 가지며 x = 0일 때 0.5의 값을 가진다는 특징이 있다.

이러한 시그모이드 함수를 미분해보면 어떻게 될까?
아래와 같이 최대값이 0.25이고 최소가 0에 수렴하게 된다.

시그모이드 함수의 미분값은 시그모이드 함수의 기울기라고 할 수 있다.
즉, 기울기가 0 ~ 0.25 사이의 값을 가진다는 의미이다.
역전파는 입력층에 가까운 앞쪽 layer로 갈수록 시그모이드 함수의 미분(기울기) 을 연쇄적으로 곱하는데, 기울기가 0 ~ 0.25 사이의 작은 값이므로 미분값이 거듭 곱해지면서 출력층과 멀어질수록 값이 점점 작아지게 된다.
해결책
이러한 문제들을 해결하기 위해 활성화 함수에 시그모이드가 아닌 다른 함수들을 활용하기 시작했다.
'Certificate > G検定' 카테고리의 다른 글
| [G검정/4장] 다양한 법칙들 (지프의 법칙, 파레토 법칙, 무어의 법칙, Uncle Bernie's rule) (0) | 2024.05.31 |
|---|---|
| [G검정/4장] 적층 오토 인코더 (0) | 2024.05.31 |
| [G검정/4장] 오토 인코더 (0) | 2024.05.31 |
| [G검정/4장] 제한된 볼츠만 머신 (0) | 2024.05.31 |
| [G검정/4장] 단층 퍼셉트론 (0) | 2024.05.30 |