介紹
Voicebox是壹個語音處理工具箱,包括MATLAB例程,大部分是由英國倫敦sw7 2bt展覽路帝國理工學院電氣電子工程系Mike Brooks編寫的。幾個例程需要MATLAB的V5。
這個例程可以作為壓縮的tar文件或ZIP文件使用,並根據合同條款提供GNU中的許可。
請發送任何意見、建議、錯誤報告等。至mike.brookes @ ic.ac.uk
目錄
音頻文件輸入/輸出
讀寫WAV和其他語音文件格式
頻率表
在赫茲、梅爾、雇員再培訓委員會和MIDI頻率表之間轉換
傅立葉/離散余弦變換/哈特萊變換
各種相關變換
隨機數發生
產生隨機向量和噪聲信號。
向量距離
計算向量列表之間的距離。
語言分析
活動水平估計,以聲譜圖表示
LPC分析演講
線性預測編碼程序
話音合成
聲門波形模式
語音增強
光譜噪聲減法
語音編碼
脈碼調制,矢量量化。
語音識別
前端處理批準
效用函數
雜項實用功能
音頻文件輸入/輸出
例程可以被讀取,在某些情況下,可以以各種文件格式編寫:
讀寫後綴
readwav writewav .WAV等。這些例程允許任何數量的通道,也可以處理線性PCM(任何精度高達32位)、常規PCM和wood PCM。大文件可以小塊讀寫。
補充問題:readhtk writehtk。HTK liquid用來讀寫波形文件的熵隱馬爾可夫工具箱。
readsfs .自力更生支持語音歸檔系統文件,由馬克哈克瓦爾在UCL。
readsph .NIST手機領域的格式文件(包括timit)。
readaif .Mac用戶使用的AIF音頻交換文件格式。
大規模頻率重建
Mel表是基於人對正弦波足球場的感知。mel2frq和frq2mel轉換之間的這個例程的標度和頻率是在Hz。
雇員再培訓局,大規模,是基於等效矩形帶寬。例行erb2frq和frq2erb轉換再培訓委員會的規模和頻率赫茲之間的利率。
使用MIDI標準,也明確規定C在半音數上是加60。該例程用於在frq2midi和midi2frq之間進行轉換,以及音樂頻率範圍和赫茲之間進行轉換。除了輸出之外,Frq2midi還會註意到名稱中的字符格式。Midi2frq可以使用相同音階的練習,否則畢達哥拉斯音階只是壹個音。