오디오 데이터 Audio & Speech 2020. 4. 2. 오디오 데이터 전처리 (1) Waveform 모두의 연구소 음성인식 풀잎스쿨에서 Introduction to Speech Processing(2E) 중 acousitc featrure extraction 부분 공부한 내용을 정리한 글입니다. 또한 한국 인공지능협회 오디오 처리 세션에서 공부한 내용도 함께 정리했음을 밝힙니다. Index 오디오 데이터 전처리 (1) Waveform 오디오 데이터 전처리 (2) Fourier Transform & Spectrogram 오디오 데이터 전처리 (3) Cepstrum Analysis 오디오 데이터 전처리 (4) MFCC 오디오 데이터 전처리 (5) MFCC Audio? Audio 데이터를 다루기 위해선, audio가 무엇인지 어떻게 표현되는지 알아야한다. 기본적으로, audio는 어떤 물체가 진동하면서 발생.. Audio & Speech 2020. 3. 25. 오디오 데이터 전처리 (4) Mel Filter Bank 오디오 데이터 전처리 (3)에서 이어지는 4번째 글입니다. 지난 글에서는 잠깐 전체 흐름을 벗어나 cepstrum 분석에 대해 간단히 알아보았습니다. Cepstrum은 주파수 대역 간의 변동 특성을 파악하기 위한 Fundamatal frequencey, harmonic peak 등을 구할 수 있었습니다. 이는 spectrum보다 음성 신호를 더 잘 설명하기에 cepstrum-level에서 feature를 구할 겁니다. 이번 글에서는 잠시 떠났던 전처리 흐름으로 다시 돌아가 Mel filter bank를 통과시키는 scaling 과정에 대해 알아보겠습니다. Index 오디오 데이터 전처리 (1) Waveform 오디오 데이터 전처리 (2) Fourier Transform & Spectrogram 오디오 데.. 이전 1 다음