Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
Tags
- FileWriter
- 사전학습
- iframe 태그
- 파이썬
- CSS
- rnn
- Codility
- FlowLayout
- css 기초
- HTML
- g검정
- inline
- html 프로젝트
- FFT
- oracle
- 상속
- 퍼셉트론
- 반응형 웹 프로젝트
- 예제
- 푸리에 변환
- 반응형웹
- Database
- ObjectOutputStream
- html 기초
- Position
- 메서드
- 미디어쿼리
- GridLayout
- BorderLayout
- java
Archives
- Today
- Total
도라에몽주머니
[G검정/6장] word2vec 본문
word2vec
: 워드 임베딩(word embedding) 중 하나로, 분포 가설(distributional hypothesis) 을 가정 하에 표현한 분산 표현을 따름. 단어들을 분포 가설에 맞추어 벡터화 함으로서 의미적으로 가까운 단어들은 유사한 값을 가지도록 함.
학습 방법
- CBOW(Continuous Bag of Words) : 주변에 있는 단어들로 중심 단어를 예측하는 방법.
- Skip-Gram : 중심 단어를 보고 주변에 어떤 단어가 존재하는지 예측하는 방법.
CBOW (Continuous Bag of Words)
예측해야 하는 단어는 중심 단어(Center Word) 라고 하고, 예측에 사용되는 단어들을 주변 단어(Context Word) 라고 함. 중심 단어를 예측하기 위해 앞・뒤로 몇 개의 단어를 볼지 결정하게 되는데, 그 크기를 윈도우(Window) 라고 하며 학습을 위한 데이터셋을 만들기 위해 슬라이딩 윈도우(Sliding Window) 를 사용함.


Skip-Gram
: CBOW와 정반대의 모델. 중심 단어에서 주변 단어들을 구하는 모델이며, Skip-Gram과 CBOW의 성능을 비교했을 때, 전반적으로 Skip-Gram이 성능이 더 좋다고 알려져 있음.

'Certificate > G検定' 카테고리의 다른 글
| [G검정/6장] 자율주행 자동차 레벨 (1) | 2024.07.16 |
|---|---|
| [G검정/6장] TF-IDF (Term Frequency-Inverse Document Frequency) (3) | 2024.07.16 |
| [G검정/6장] LDA 토픽 모델링 (0) | 2024.07.16 |
| [G검정/6장] BERT(Bidirectional Encoder Representations from Transformers) (0) | 2024.07.16 |
| [G검정/6장] 화상 인식의 종류 (AlexNet, GoogLeNet, VGG16, ResNet) (0) | 2024.07.10 |