HMM Audio & Speech 2020. 4. 8. [음성인식] 5.2 Gaussian Mixture Model(GMM) [음성인식] 5.1 Vector Quantization(VQ)에서 이어지는 글입니다. HMM을 음성인식에 적용하기 위해 방출 확률(emission probability)을 모델링하는 방법을 알아보고 있습니다. 지난 글에서 알아본 VQ에 이어 이번에는 Gaussian Mixture Model(GMM)입니다. Guassian Mixture Model은 대표적인 비지도학습(unsupervised learning) 알고리즘 중 하나로 clustering과 유사한 논리 과정을 보인다. 비지도 학습은 라벨링이 안 된 데이터로 어떤 특성이나 규칙성을 찾아가는 머신러닝 학습 방법이다. GMM 공부에 선행되는 내용들을 정리한 뒤 다음 순서에 따라 논의를 전개하겠다. 1. Mulitnomial Distribution(다항.. Audio & Speech 2020. 4. 2. [음성인식] 4.2 Hidden Markov Model [음성인식] Lec.4_1 Acousitc Model (HMM-GMM)에서 살펴본 acousitc model은 HMM-GMM 기반 모델입니다. 그 중 HMM에 대해서 공부한 것을 정리했습니다. HMM을 이용해 특정 word를 pronunciation에 해당하는 phone들의 sequence로 나타낼 수 있다. 이를 통해 라벨링 되어있지 않은 speech data로 speech tagging이라는 supervised learning이 가능하게 된다. HMM 전에 근간이 되는 Markov chain부터 알아보자. Markov Chains 연속적인(sequential) 랜덤 변수의 확률에 대한 논의. 위 그림에서 파란색 동그라미가 state, 화살표는 transition probability(전이 확률 ; 다.. Audio & Speech 2020. 2. 8. [음성인식] 4.1 Acousitc Model (HMM-GMM) 모두의 연구소 음성인식 풀잎스쿨에서 공부한 내용을 정리했습니다. 공부에 사용한 교재는 Speech and Language Processing 3rd Edition Appendix A: Hidden Markov Models, Speech and Language Processing 2nd Edition 9.1 ~ 9.2: The Hidden Markov Model Applied to Speech입니다. Speech Recognition Architecture Large-Vocabulary Continuous Speech Recognition(LVCSR) ; vocab이 크고 continuous한 발화를 기준으로 한다. 음성인식은 waveform을 input으로 받아 output으로 word sequence를.. 이전 1 다음