Processing——DSP)強調的是利用數字信號處理的理論,在芯片上運行目標程序,實現某種信號處理。
數字信號處理是21世紀科學和工程領域最強大的技術之壹。在廣泛的領域發生了革命性的變化:通信、醫學成像、雷達和聲納、保真音樂再現和原油勘探,只有這些被命名。各個領域的DSP技術都發展到了壹定的深度,有了自己的算法、數學和特定的技能。廣度和深度的結合,使得任何人都不可能掌握所有發展起來的DSP技術。DSP教育包括兩項任務:學習可以應用於整體的概念,學習自己感興趣的特定領域的專業技能。本章通過描述DSP在幾個不同領域帶來的巨大影響,開始了我們進入數字信號處理世界的旅程。革命已經開始了。
DSP的根源
數字信號處理不同於計算機科學的其他領域,因為它所使用的數據類型的獨特性:信號。在大多數情況下,這些信號來源於現實世界中的感官數據:地震的地震振動、視覺圖像、聲波等。在信號被轉換成數字形式後,DSP就是用來處理這些信號的數學、算法和技術。這包括各種各樣的目標,例如增強視覺圖像、識別和生成對話(語音)、壓縮數據以便存儲和傳輸等等。假設我們給計算機添加壹個“對比度-數字轉換器”,並用它來檢索壹些真實世界的數據。DSP回答問題:下壹步怎麽辦?
DSP的起源是在1960和1970年代,當時數字計算機首次出現。這個時代電腦很貴,DSP僅限於壹些關鍵應用。先鋒主要集中在四個關鍵領域:危及國際安全的雷達和聲納,可以賺大錢的原油勘探,不可替代的太空探索和可以拯救生命的醫學影像。在1980和1990,個人電腦的革命使得DSP的新應用驟然增多。動機不是出於軍隊和政府的需要。DSP突然被商業市場驅動。任何壹個認為自己可以在快速擴張的領域賺錢的人,突然就變成了DSP廠商。DSP在移動電話、光盤播放器和電子語音郵件等產品中已經變得眾所周知。圖1-1列出了其中壹些應用。
這場技術革命是自上而下發生的。1980早期,電機領域的研究生課程中講授DSP。十年後,DSP已經成為大學標準課程的壹部分。如今,DSP已經成為許多領域的科學家和工程師所需要的壹項基本技能。以此類推,DSP可以和之前技術革命中的“電子學”相提並論。雖然仍然是在電子馬達領域,但幾乎每個科學家和工程師都有壹些基本電路設計的背景。否則,他們可能會迷失在技術的世界裏。DSP也有同樣的未來。
圖1-1
DSP革新了科學和工程的許多領域。這裏列出了壹些不同的應用。
最近的歷史更令人好奇;對妳學習和使用DSP的能力影響很大。假設您遇到了壹個DSP問題,並轉向教科書或其他出版物尋求答案。妳通常會發現壹頁又壹頁的方程式、晦澀難懂的數學符號和陌生的術語。這是壹場噩夢!即使對於有這方面經驗的人來說,很多DSP文檔還是讓人摸不著頭腦。這在文獻中是沒有錯的,只是期望給非常特定的讀者群。目前,發展科學技術的研究人員需要這種復雜(詳細)的數學來理解工作的理論含義。
這本書的基本假設是,大多數實用的DSP技術都可以在沒有傳統復雜數學和理論障礙的情況下學習和使用。《科學家和工程師數字信號處理指南》是為那些想把DSP作為工具而不是新職業的人編寫的。
本章的其余部分列出了DSP帶來革命性變化的壹些領域。當妳看每壹個應用時,妳會註意到DSP是非常跨學科的,依賴於許多相鄰領域的技術工作。如圖1-2所示,DSP與其他技術學科的界限並不明顯,也沒有完美的定義,而是模糊和重疊的。如果想專攻DSP,還需要學習壹些相關的領域。
圖1-2
數字信號處理在科學、工程和數學的許多領域中具有模糊和重疊的邊界。
電信(電信)
電信就是把信息從壹個地方發送到另壹個地方。這包括許多形式的信息:電話交談,電視信號,計算機文件和其他類型的數據。要發送信息,您需要兩個位置之間的通道。這可以是壹對電線、無線電廣播信號、光纖等。電信公司因傳輸客戶信息而獲得報酬,然而,他們必須為建立和維護信道付費。金融書籍的底線很簡單:它們通過單壹渠道傳遞的信息越多,它們能賺的錢就越多。DSP在許多領域給電信行業帶來了革命性的變化:音頻信號的產生和檢測、頻帶偏移、消除電力線嗡嗡聲的濾波等等。這裏將討論電話網的三個特殊例子:多路復用、壓縮和回聲控制。
多路復用(多路復用)
世界上大約有十億部電話。只要按幾個鍵,交換網絡就能讓任何地方的任何人在幾秒鐘內連接起來。這個無限的任務讓人猶豫。直到1960,兩部電話之間的連接需要通過機械開關和放大器傳輸模擬聲音信號。壹個連接需要壹對電線。相比之下,DSP將音頻轉換為串行數字數據流。因為比特可以很容易地交織和分離,許多電話交談可以在壹個信道上傳輸。例如,電話的標準被稱為T-carier系統,它可以同時傳輸24個聲音信號。每個聲音信號使用8位壓擴(對數壓縮)模數轉換每秒采樣8000次。每個聲音信號結果表示為64,000比特/秒,所有24個通道都包含在1.544兆比特/秒中。使用傳統的22號銅電話線,信號可以傳輸大約6000英尺,這是典型的互連距離。數字傳輸有許多經濟優勢。電線和模擬開關很貴,數字邏輯門很便宜。
壓縮(壓縮)
當聲音信號以8000樣本/秒的速度數字化時,大多數數字信息將是冗余的。換句話說,任何壹個樣本攜帶的信息都會被相鄰的樣本大量復制。已經開發了幾十種DSP算法來將數字化的聲音信號轉換成需要更少比特/秒的數據流。這些被稱為數據壓縮算法。相應的解壓縮算法用於將信號恢復到其原始形式。這些算法在壓縮次數和產生的聲音質量方面有所不同。壹般來說,數據速率可以從64千比特/秒降低到32千比特/秒,而不會損失聲音質量。當壓縮到8千比特/秒的數據速率時,聲音會受到明顯影響,但對長途電話網還是有用的。可實現的最大壓縮約為2千位/秒,導致聲音高度失真,但它可以用於壹些應用,如軍事和潛艇通信。
回聲控制(回聲控制)
回聲是長途電話連接中的壹個嚴重問題。當妳對著電話說話時,壹個代表妳聲音的信號傳到與之相連的接收器,壹些信號會被傳輸回來,也就是回聲。如果鏈接在數百英裏之內,只需要幾毫秒就可以接收到回聲。人耳習慣於聽這些小的延時回聲,連接看起來相當正常。隨著距離的變長,回聲越來越明顯,越來越煩人。對於州際通信,延遲可能高達數百微秒,這尤其令人反感。數字信號處理通過測量返回的信號並產生適當的反信號來消除惱人的回聲,從而開始處理這樣的問題。同樣的技術允許揚聲器用戶同時聽和說而不反擊(長時間尖叫)。它也可以被數字生成的抗噪聲抵消,以降低環境噪聲。
音頻處理(音頻處理)
人類的兩種主要感官是視覺和聽覺。相應的,很多DSP都與圖像和音頻處理有關。人們聽音樂和語言(發音)。DSP在這兩個領域發生了革命性的變化。
音樂(音樂)
從音樂家的麥克風到喜歡播放高級立體聲的人的揚聲器的路徑是相當長的。數字數據表示很重要,因為它可以防止“壹般與模擬存儲和處理有關”的退化。任何比較過卡帶和CD音樂質量的人都會熟悉這壹點。在壹般情況下,音樂剪輯在錄音室中錄制在幾個通道或軌道上。在某些情況下,這甚至包括單獨錄制單個樂器和歌手。這樣做是為了讓音響工程師在制作最終產品時有更大的靈活性。將單個軌道組合成最終產品的復雜過程稱為混音。DSP在混音時可以提供幾個重要的功能,包括:濾波、信號加減、信號編輯等。
註意:將X聲道音頻混成Y聲道,其中X是大於Y的數,比如妳的DVD有5.1個聲道,但妳只有耳機,而耳機只有兩個聲道,所以妳需要向下混成2個聲道。感謝絕地的講解。
DSP在音樂準備中最有趣的應用之壹是人工混響。如果單個聲道簡單地加在壹起,產生的片段聽起來很脆弱,很像音樂家在戶外演奏。這是因為聽眾受到音樂回聲或余味的影響很大,這種影響通常在錄音室裏被最小化。DSP允許在mix down中總結人工回聲和余味,以模擬各種理想的聽音環境。延遲數百微秒的回聲給人壹種教堂般的感覺。以10-20微秒的延遲增加回聲,使人感覺處於更合適的聽音空間。
語音生成(語音生成)
語音的產生和識別被用來作為人機之間的交流。不是用妳的手和眼睛,而是用妳的嘴和耳朵。當妳的手和眼睛應該做其他事情的時候,比如開車,操作手術,或者(不幸地)用武器向敵人開火,這是非常方便的。對於計算機生成的聲音,將使用兩種方法:數字錄音和聲道模擬。在數字錄音中,人聲被數字化並存儲,通常是以壓縮的形式。在錄制和回放期間,存儲的數據被解壓縮並轉換回模擬信號。錄了整整壹個小時的語音只需要3兆左右就可以存儲,即使是在小型計算機系統中。這是當今最常用的數字語音生成方法。
聲道模擬更復雜。我們試圖通過建立人聲來模仿身體的物理機制。人體聲道模擬是壹個聲腔,其共振頻率由腔的大小和形狀決定。相比較而言,摩擦音來源於狹窄壓縮下嘈雜的空氣噪音,就像牙齒和嘴唇壹樣。信道模擬通過產生模擬這兩種刺激的數字信號來工作。共振腔的特性是通過用類似* * *振動的數字濾波器傳輸激勵信號來模擬的。這種方法被用在壹個非常早期的DSP成功案例中,Speak & amp;Spell是壹款暢銷的兒童電子學習輔助工具。
語音識別
自動人類語音識別比語音生成更困難。語音識別是人腦做得很好,但數字計算機做得很差的經典例子。數字計算機可以存儲和記憶非常大量的數據,以非常快的速度進行數學計算,並進行重復的工作,而不會感到厭煩或效率低下。不幸的是,當面對原始的感官數據時,今天的計算機表現很差。教計算機每月給妳送壹份賬單是很容易的。教同壹臺計算機理解妳的聲音是壹個大工程。
數字信號處理通常分兩步處理語音識別:特征匹配後的特征提取。
應首先隔離輸入音頻信號中的每個單詞,然後進行分析,以識別刺激類型和振動頻率。然後將這些參數與以前說過的單詞的例子進行比較,以識別最接近的壹對。通常,這些系統僅限於幾百個單詞,並且只能接受單詞之間有明顯中斷的語音;每個演講者都需要單獨接受再培訓。雖然這適用於許多商業應用,但與人類聽覺相比,這些限制就相形見絀了。在這個領域有很多工作要做,那些在商業產品上成功的人將會得到豐厚的回報。
回聲定位
獲取遠程對象信息的壹個常見方法是彈出壹個波。例如,雷達通過發射無線電波的脈沖波並檢查從飛機回波接收的每個信號來工作。在聲納上,聲波通過水傳播來探測潛艇和其他水下物體。地球物理學家通過設置長期爆破和傾聽深埋巖層的回聲來精確定位地球。雖然這些應用程序有相同的線程,但它們都有自己特定的問題和需求。數字信號處理在三個領域產生了革命性的變化。
雷達(雷達)
雷達是無線電探測和測距的縮寫。在最簡單的雷達系統中,無線電發射機產生壹個幾微秒長的射頻能量脈沖。這種脈沖被送入高定向天線,無線電波在那裏以光速傳播和離開。這個波路上的平面會將壹小部分能量反射回發射站附近的接收天線。通過發射脈沖和接收回波之間的時間來計算到物體的距離。物體的方向更容易找到。當接收到回聲時,妳知道妳指向定向天線的位置。
雷達系統的作用距離由兩個參數決定:初始脈沖中有多少能量和無線電接收機的噪聲水平。不幸的是,通常需要更長的脈搏波來增加脈搏波中的能量。於是,較長的脈搏波降低了消耗時間測量的精度和準確度。這導致了兩個重要參數之間的沖突:探測遠處物體的能力和正確確定物體距離的能力。
DSP有三個領域的革命性雷達,都和基礎問題有關。首先,DSP可以在接收到脈沖波後對其進行壓縮,從而在不減小其工作範圍的情況下提供更好的距離測量。其次,DSP可以濾除接收信號,降低噪聲。這在不降低距離測量的情況下增加了範圍。第三,DSP可以快速選擇和產生不同的脈沖波形和長度。其中,這允許針對特定的檢測問題優化脈搏波。現在是令人印象深刻的部分:它們中的許多是基於類似於所用無線電頻率的采樣率,大約是數百兆赫!就雷達而言,DSP與高速硬件設計高度相關,就像它與算法高度相關壹樣。
聲納
聲納是聲音導航和測距的縮寫。分為主動和被動兩類。在主動聲納中,2 kHz到40 kHz之間的聲音脈沖波被發射到水中,檢測並分析結果的回波。使用主動聲納包括:探測和定位水下物體、導航、通信和繪制海底地圖。壹般最大運行裏程為10至100公裏。相比之下,被動聲納只聽水下聲音,包括自然湍流、海洋生物和潛艇及水面艦艇的機械聲。因為被動聲納不會消除能量,所以非常適合轉換操作。妳想發現另壹個人,又不想讓他發現妳。被動聲納最重要的應用是軍事監視系統,用於探測和跟蹤潛艇。被動聲納通常比主動聲納使用更低的頻率,因為它們在水中傳播時吸收更少。探測範圍可達數千公裏。
DSP在聲納和雷達方面有很多革命性的發展:脈沖波產生、脈沖波壓縮、檢測信號濾波。有壹種觀點認為聲納比雷達簡單:因為它包含的頻率更低。另壹種觀點認為,聲納比雷達更難,因為環境更不壹致,更不穩定。聲納系統通常使用昂貴的陣列來發射和接收元素,而不僅僅是單個信道。通過適當地控制和混合這些許多元件的信號,聲納系統可以將消除的脈沖波引導到期望的位置,並確定接收回波的方向。為了處理這麽多的信道,聲納系統需要像雷達壹樣大的DSP計算能力。
反射地震學(反射地震學)
大約在1920年代早期,地球物理學家發現可以通過聲音探測到地殼的結構。探險者可以引爆並記錄地表下十多公裏處邊界層的回波。這些回波被肉眼解釋為對應於地下的結構。反射地震法很快成為確定石油和礦藏位置的主要方法,至今仍然如此。
在理想情況下,傳輸到地面的聲音脈沖波會從每個脈沖波經過的邊界層產生回波。不幸的是,情況通常沒有這麽簡單。每壹個返回地面的回波都必須穿過所有其它的上邊界層。這將導致回聲從壹層跳到另壹層,產生回聲的回聲將在表面上被檢測到。這些二次回波會使檢測到的信號非常復雜,難以解釋。自1960年代以來,數字信號處理已被廣泛用於從反射地震記錄中分離主回波和次回波。早期的地球物理學家在沒有DSP的情況下是如何處理的?答案很簡單:他們著眼於多重反射最小化的簡單地方。DSP允許在困難的位置發現原油,例如在海底。
圖像處理(圖像處理)
圖像是特征信號。首先,它們是空間(距離)中參數的度量,盡管大多數信號是時間參數的度量。其次,它們包含了大量的信息。例如,存儲壹半的電視視頻可能需要超過10兆字節。這比類似長度的聲音信號大1000倍以上。第三,最終質量的判斷壹般會受限於人的評價,而不是客觀的評價標準。這些特征使得圖像處理在DSP內分成不同的子組。
醫療(醫學)
1895年,威廉康拉德R?Ntgen發現X射線可以穿透相當多的實際物體。醫學已經取得了革命性的進步,因為它能夠看到活的人體內部。僅僅幾年時間,醫用X射線系統就已經遍布全球。盡管取得了明顯的成功,但醫學X射線圖像受到四個問題的限制,直到1970年出現了DSP和相關技術。第壹,人體內的重疊結構可以隱藏在另壹個結構後面。例如,肋骨後面的心臟部分可能不可見。其次,並不總是能夠區分相似的組織。例如,也許可以將骨骼與軟組織分開,但不能將腫瘤與肝儲庫區分開來。第三,x光圖像顯示的是解剖學,即身體的結構,而不是生理學,即身體的運作。活人的x光圖像看起來像死人的x光圖像!第四,暴露在X射線下會導致癌癥,所以應該謹慎使用,並且只有在適當的情況下才使用。
通過在1971中引入第壹臺計算機斷層掃描儀(官方命名為計算機軸位斷層掃描儀或CAT掃描儀)解決了重疊結構的問題。計算機斷層掃描(CT)是數字信號處理的經典例子。在對病人進行檢查時,來自多個方向的x射線會穿透病人身體的各個部位。信號被轉換成數字數據並存儲在計算機中,而不是簡單地用檢測到的X射線形成圖像。該信息然後用於計算要顯示為身體切片的圖像。這些圖像顯示了比傳統技術更多的細節,允許更好的檢測和治療。CT的影響幾乎和原始x光圖像本身壹樣大。幾年之內,世界上每壹家大醫院都使用了CT掃描儀。在1979中,CT原理的兩位貢獻者,戈弗雷·N·亨斯費爾德和艾倫·M·科馬克,* * *獲得了諾貝爾醫學獎。那是個不錯的DSP!
後三個X射線問題已經通過使用X射線之外的穿透能量解決了,比如無線電和聲波。DSP在所有這些技術中起著關鍵作用。例如,磁共振成像(MRI)利用磁場和無線電波來檢測人體內部。適當調整磁場強度和頻率,使體區原子核能在量子能態之間振動。這種振動會導致二次無線電波發射,由靠近身體放置的天線檢測到。該檢測到的信號的強度和其他特征提供了關於* * *振動的局部區域的信息。磁場的調整使這個物體掃描的振動區域與內部結構相對應。這些信息通常被表示為圖像,就像計算機斷層掃描壹樣。除了提供不同類型軟組織之間的出色識別之外,MRI還可以提供關於生理學的信息,例如通過動脈的血流。MRI完全依賴於數字信號處理技術,沒有它就無法實現。
外層空間(太空)
有時候,妳必須充分利用壹張糟糕的照片。這通常是因為圖像是從無人衛星和太空探索火箭上拍攝的。沒有人會派壹個修理工去火星只是為了轉動相機的旋鈕!DSP可以使用幾種方法來提高在非常不合適的條件下拍攝的圖像的質量,它們是:亮度和對比度調整、邊界檢測、降噪、焦點調整、減少運動模糊等等。具有空間失真的圖像,例如在拍攝球形行星的平面圖像時遇到的那些,可以被扭曲成正確的表示。許多獨立的圖像可以合並到壹個數據庫中,這樣信息就可以以壹種獨特的方式顯示。例如,壹個電視圖像序列模擬了壹架在不同星球表面飛行的飛機。
商業成像產品(商業成像產品)
對於大量出售給公眾的系統,圖像中的大量信息內容是壹個問題。商用系統壹定要便宜,這不是大量內存和高數據傳輸率的結果。這個定理的壹個解決方案是圖像壓縮。就像聲音信號壹樣,圖像包含大量冗余信息,可以通過減少需要表示的位數的算法傳輸回來。電視和其他動作電影特別適合壓縮,因為大多數圖像從壹幀到另壹幀都是壹樣的。商業圖像處理軟件使用這種技術,包括:可視電話、顯示運動圖像的計算機程序和數字電視。