Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
Tags
- html 기초
- HTML
- html 프로젝트
- 상속
- Database
- css 기초
- iframe 태그
- oracle
- FileWriter
- FlowLayout
- CSS
- 예제
- 미디어쿼리
- 푸리에 변환
- BorderLayout
- Position
- 파이썬
- rnn
- FFT
- g검정
- 반응형웹
- ObjectOutputStream
- 퍼셉트론
- java
- 반응형 웹 프로젝트
- GridLayout
- Codility
- inline
- 사전학습
- 메서드
Archives
- Today
- Total
도라에몽주머니
[G검정/5장] 강화학습 (모델 베이스, 모델 프리, Q학습) 본문
강화학습
: 주어진 환경과 상호작용하여 좋은 점수를 얻는 방향으로 성장하는 머신러닝 분야
요소
- 에이전트(agent): 인공지능 플레이어
- 환경(state): 에이전트가 솔루션을 찾기 위한 무대
- 행동(action): 에이전트가 환경 안에서 실행하는 상호작용
- 보상(reward): 에이전트의 행동에 따른 점수, 결과
알고리즘

모델 프리 알고리즘(Model-Free)
- モデルフリー 方策ベース (Policy-Based)
- モデルフリー 価値関数ベース (Value-Based)
모델 베이스 알고리즘(Model-Based)
- モデルベース
Q 학습
: Value-Based Model Free 알고리즘으로서 Q 함수를 최대로 하는 방향으로 학습하는 알고리즘
- Q 함수: 상태와 행동을 입력하면 이에 대한 가치를 출력으로 주는 함수

'Certificate > G検定' 카테고리의 다른 글
| [G검정/5장] 심층 생성 모델 (GAN, VAE) (0) | 2024.07.09 |
|---|---|
| [G검정/5장] Deep Q Network (DQN) (0) | 2024.07.09 |
| [G검정/5장] Attention (0) | 2024.06.14 |
| [G검정/5장] BiRNN, seq2seq (1) | 2024.06.13 |
| [G검정/5장] LSTM, GRU (1) | 2024.06.12 |