[NLP] Seq-to-Seq

본 내용은 보아즈 NLP 1팀 김정호씨의 발표를 토대로 작성되었습니다.

들어가기에 앞서

NLP 분야에는 다양한 task들이 존재하지만 그 중 가장 중추가 되는 것은 번역이다. 기존의 Machine Translation은 통계적 모델에 기반하거나, 전부 라벨된 데이터를 이용하는데 그쳤고, 성능의 한계가 명확했다. 하지만 2014년부터 Neural Net을 기계 번역에 적용하면서 그 성능이 비약적으로 향상되었다. 상기 언급한 Neral Net을 Machine Translation에 적용한 모델 중 하나인 Sequence-to-sequence에 대해 알아보자.

Seq2seq

기본적으로 seq2seq 모델은 아래 그림과 같이 인코더와 디코더로 구성된다. 인코더의 마지막 Hidden state가 CONTEXT Vector가 되고 이는 디코더의 Initial Hidden state가 된다.

이를 좀 더 확장해서 살펴보면, 아래 그림과 같다.

인코더와 디코더에는 RNN, LSTM, GRU 등 다양한 RNN 계열 모델이 들어갈 수 있는데 이 중 LSTM이 가장 성능이 좋다고 한다. 여기서 task는 I am a student라는 input data를 je suis etudiant 로 번역하는 것이다. input data는 그림에서와 같이 각각 임배딩 된 벡터로 들어가게 된다.(보통 한 단어당 300차원) 임배딩은 Word2Vec or Glove를 사용한다. 주목할만한 부분은 seq2seq 모델 train 시, 디코더에 정답 label을 input data로 넣어준다는 점이다. <sos>는 문장의 시작을 알리고 <eos>는 끝을 알린다.

Training Time

'ML & DL' 카테고리의 다른 글

[머신러닝] Boosting Algorithm (3)	2020.01.26
[강화학습] Lec.1 Introduction to Reinforcement learning (0)	2020.01.19
[딥러닝]RNN과 LSTM (0)	2019.11.18
[머신러닝]SVM(Support Vector Machine) by MIT (0)	2019.11.16
[머신러닝]Machine Learning(standford) 2강 - feature scaling/learning rate/polynomial regression (5)	2019.11.01

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

현토리

[NLP] Seq-to-Seq

Seq2seq

'ML & DL' 카테고리의 다른 글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

[NLP] Seq-to-Seq

Seq2seq

'ML & DL' 카테고리의 다른 글

'ML & DL' 관련글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역