audio feature extraction Audio & Speech 2020. 3. 25. 오디오 데이터 전처리 (4) Mel Filter Bank 오디오 데이터 전처리 (3)에서 이어지는 4번째 글입니다. 지난 글에서는 잠깐 전체 흐름을 벗어나 cepstrum 분석에 대해 간단히 알아보았습니다. Cepstrum은 주파수 대역 간의 변동 특성을 파악하기 위한 Fundamatal frequencey, harmonic peak 등을 구할 수 있었습니다. 이는 spectrum보다 음성 신호를 더 잘 설명하기에 cepstrum-level에서 feature를 구할 겁니다. 이번 글에서는 잠시 떠났던 전처리 흐름으로 다시 돌아가 Mel filter bank를 통과시키는 scaling 과정에 대해 알아보겠습니다. Index 오디오 데이터 전처리 (1) Waveform 오디오 데이터 전처리 (2) Fourier Transform & Spectrogram 오디오 데.. Audio & Speech 2020. 3. 25. 오디오 데이터 전처리 (3) Cepstrum Analysis 오디오 데이터 전처리 (2)에서 이어지는 글입니다. 2편에서는 waveform에 푸리에 변환을 통해 spectrum을 뽑고, 각 frame을 옆으로 쌓아 시간 정보를 살려주는 spectrogram에 대해 알아봤습니다. 3편에서는 지난 푸리에 변환 단계에 이어서 audio feature extraction 과정을 설명하기 전에 잠깐 전처리 흐름에서 벗어나 cepstrum analysis에 대해 알아보겠습니다. Index 오디오 데이터 전처리 (1) Waveform 오디오 데이터 전처리 (2) Fourier Transform & Spectrogram 오디오 데이터 전처리 (4) Mel Filter Bank 오디오 데이터 전처리 (5) MFCC 다시 전체적인 흐름에서 보면 우리는 FFT를 통한 spectrum.. 이전 1 다음