當前位置:商標查詢大全網 - 教育培訓 - 為語音識別尋找語音盒文件。

為語音識別尋找語音盒文件。

語音處理工具箱的MATLAB

介紹

Voicebox是壹個語音處理工具箱,包括MATLAB例程,大部分是由英國倫敦sw7 2bt展覽路帝國理工學院電氣電子工程系Mike Brooks編寫的。幾個例程需要MATLAB的V5。

這個例程可以作為壓縮的tar文件或ZIP文件使用,並根據合同條款提供GNU中的許可。

請發送任何意見、建議、錯誤報告等。至mike.brookes @ ic.ac.uk

目錄

音頻文件輸入/輸出

讀寫WAV和其他語音文件格式

頻率表

在赫茲、梅爾、雇員再培訓委員會和MIDI頻率表之間轉換

傅立葉/離散余弦變換/哈特萊變換

各種相關變換

隨機數發生

產生隨機向量和噪聲信號。

向量距離

計算向量列表之間的距離。

語言分析

活動水平估計,以聲譜圖表示

LPC分析演講

線性預測編碼程序

話音合成

聲門波形模式

語音增強

光譜噪聲減法

語音編碼

脈碼調制,矢量量化。

語音識別

前端處理批準

效用函數

雜項實用功能

音頻文件輸入/輸出

例程可以被讀取,在某些情況下,可以以各種文件格式編寫:

讀寫後綴

readwav writewav .WAV等。這些例程允許任何數量的通道,也可以處理線性PCM(任何精度高達32位)、常規PCM和wood PCM。大文件可以小塊讀寫。

補充問題:readhtk writehtk。HTK liquid用來讀寫波形文件的熵隱馬爾可夫工具箱。

readsfs .自力更生支持語音歸檔系統文件,由馬克哈克瓦爾在UCL。

readsph .NIST手機領域的格式文件(包括timit)。

readaif .Mac用戶使用的AIF音頻交換文件格式。

大規模頻率重建

Mel表是基於人對正弦波足球場的感知。mel2frq和frq2mel轉換之間的這個例程的標度和頻率是在Hz。

雇員再培訓局,大規模,是基於等效矩形帶寬。例行erb2frq和frq2erb轉換再培訓委員會的規模和頻率赫茲之間的利率。

使用MIDI標準,也明確規定C在半音數上是加60。該例程用於在frq2midi和midi2frq之間進行轉換,以及音樂頻率範圍和赫茲之間進行轉換。除了輸出之外,Frq2midi還會註意到名稱中的字符格式。Midi2frq可以使用相同音階的練習,否則畢達哥拉斯音階只是壹個音。