全國服務熱線
020-22320330
語音芯片的生產(chǎn)方式
掩膜生產(chǎn):掩膜生產(chǎn)通俗的說就是先將聲音燒到芯片里,然后再進行封裝,一般有量的要求。
otp生產(chǎn):所謂otp的意思是指的一次性燒錄。先把芯片封裝好,再借用軟件燒進去聲音。
語音芯片有根據(jù)IC本身的物理結(jié)構(gòu)的多個通道(同時發(fā)出多個通道的聲音)可分為多種類型:
一、單通道的:
1.單通道的語音IC(Speech IC)(這種語音芯片不支持音樂IC音樂存儲方式); 常見的語音IC是單通道的語音芯片,WTN和DKA010動物叫聲是最典型的單通道語音芯片;
2. 單通道的音樂IC(Music IC),同一單位時間內(nèi)只能發(fā)出一種音樂的音樂IC, 電子聲音文件是只有一個通道的.Mid后綴文件;
常說的單音片,是一種最基本的音樂IC,由一定時間內(nèi)音符輸出的多少,決定了單音片的效果,有64音符多,128音符等等. 單音片應用場合廣,價格極其低廉,最常見的有單音片有生日快樂賀卡單音片嚴格的說,單通道的音樂IC和單音片的兩者結(jié)構(gòu)是不相同的。
二、2通道:
1.2通道的語音IC, 2通道和多通道的語音芯片,實際應用中語音播放時一般會按規(guī)定固定在某一通道內(nèi)進行聲音的播放(等同于單通道),但是這類產(chǎn)品比單通道的語音IC(Speech ic)成本要高,價格會高些,語音芯片廠家在設計時為了平衡產(chǎn)品價格和應用,一般來說,功能支持和聲音效果方面都會做得更完美一些。
這種結(jié)構(gòu)也許是因為產(chǎn)品和方案實際應用領域和價格所決定的, 語音芯片輸出一般都是單通道的聲音輸出,支持立體聲的產(chǎn)品很少, 要高端一些的產(chǎn)品就要選MP3主控芯片之類的方案了。
2. 2通道的音樂芯片, 通俗叫法是雙音片(Music With Dual Tone IC),顧名思義,同一單位時間內(nèi)二個通道都可以發(fā)出音樂的音樂IC. 電子聲音源文件一般為.Mid的二通道文件.常見的圣誕系列音樂IC。
這里得多補充兩句,市面上還有一個叫melody的音樂芯片,她是個什么定義呢?簡單的來說,比單音片的效果要好比和弦音樂芯片的效果要差的一種音樂芯片,所以雙音片也有被叫成是melody音樂芯片,melody結(jié)構(gòu)應該來說是一種更高級的單音片,或者可以說是二倍效果的單音片。
三、4通道,8通道或以上:
三通道以上的聲音.又稱為和弦音樂.常說的4和弦音樂IC就是指4通道的音樂IC。
(1)語音信號的量化
采樣率(f)、位數(shù)(n)、波特率(T)
波特率:每秒鐘采樣的位數(shù)(bit)。波特率直接決定音質(zhì)。Bps: bit per second
采樣位數(shù)指在二進制條件下的位數(shù)。一般在沒有特別說明的情況下,聲音的采樣位數(shù)指8位,由00H--FFH,靜音定為80H。
(2)采樣率
奈奎斯特抽樣定理(Nyquist Law):要從抽樣信號中無失真地恢復原信號,抽樣頻率應大于2倍信號最高頻率。抽樣頻率小于2倍頻譜最高頻率時,信號的頻譜有混疊。抽樣頻率大于2倍頻譜最高頻率時,信號的頻譜無混疊。
嗓音的頻帶寬度為20~20K HZ左右,普通的聲音大概在3KHZ以下。所以,一般CD取的音質(zhì)為44.1K和16bit,如果碰到某些特別的聲音,如樂器,音質(zhì)也有用48K和24bit的情況,但不是主流。
一般在我們處理針對普通語音IC的時候,采樣率最高達到16K就夠了、說話聲一般取8K(如電話音質(zhì))、6K左右。低于6K效果比較差。而DKC系列語音芯片采樣可以做到22K。
在應用單片機的過程中,采樣越高,定時器中斷速度越快,會影響到其他信號的監(jiān)控和檢測,所以要綜合考慮。
(3)語音壓縮技術(shù)
由于語音數(shù)據(jù)量龐大,對語音數(shù)據(jù)進行有效壓縮是很必要的,能夠使我們在有限的ROM空間里錄入更多的語音內(nèi)容。有以下幾種方式:
語音分段:將語音中可以重復的部分截取出來,通過排列組合將內(nèi)容完整地回放出來。
語音采樣:一般我們使用的喇叭頻響曲線在中頻部分,較少用到高頻,所以,在喇叭音質(zhì)可以接受的情況下,適當降低采樣頻率,達到壓縮效果,這種過程是不可逆的,無法恢復原貌,叫有損壓縮。
數(shù)學壓縮:主要是針對采樣位數(shù)進行壓縮,這種方式也是有損壓縮。例如,我們經(jīng)常采用的ADPCM壓縮格式,是將語音數(shù)據(jù)從16bit壓縮到4bit,壓縮率是4倍。MP3是對數(shù)據(jù)流進行壓縮,涉及到數(shù)據(jù)預測問題,它的波特率壓縮倍率為10倍左右。
通常,以上幾種壓縮方式都是綜合起來使用的。
WAV格式:Wave Audio Files 是微軟公司開發(fā)的一種聲音文件格式,也叫波形聲音文件,被Windows平臺及其應用程序廣泛支持。WAV格式支持許多壓縮算法,支持多種音頻位數(shù)、采樣頻率和聲道,但WAV格式對存儲空間需求太大不便于交流和傳播。WAV文件里面存放的每一塊數(shù)據(jù)都有自己獨立的標識,通過這些標識可以告訴用戶究竟這是什么數(shù)據(jù),這些數(shù)據(jù)包括采樣頻率和位數(shù),單聲道(mono)還是立體聲(stero)等。
ADPCM格式:是利用對過去的幾個抽樣值來預測當前輸入的樣值,并使其具有自適應的預測功能與實際檢測值進行比較,隨時對測得的差值自動進行量化級差的處理,使之始終保持與信號同步變化。它適用于語音變化率適中的情況,而且聲音回放過程簡短。它的優(yōu)點是對于人聲的處理比較逼真,一般達到90%以上,已廣泛地應用于電話通信領域。
MP3格式: Moving Picture Experts Group Audio Layer III,簡稱為MP3。它是利用 MPEG Audio Layer 3 的技術(shù),采取了名為“感官編碼技術(shù)”的編碼算法:編碼時先對音頻文件進行頻譜分析,然后用過濾器濾掉噪音電平,接著通過量化的方式將剩下的每一位打散排列,最后形成具有較高壓縮比的mp3文件,并使壓縮后的文件在回放時能夠達到較接近原音源的聲音效果。它的實質(zhì)是vbr(Variant Bitrate 可變波特率)可以根據(jù)編碼的內(nèi)容動態(tài)地選擇合適的波特率,因此編碼的結(jié)果是在保證了音質(zhì)的同時又照顧了文件的大小。
mp3壓縮率10倍甚至12倍。是最初出現(xiàn)的一種高壓縮率的語音格式。
Linear Scale格式:根據(jù)聲音的變化率大小,把聲音分成若干段,對每段用線性比例進行壓縮,但是它的比例是可變的。
Logpcm格式:基本上對整個聲音進行線性壓縮,將最后若干位去掉。這種壓縮方式在硬件上很容易實現(xiàn),但音質(zhì)比Linear Scale差一些,特別是音量較小聲音比較細膩的情況下效果較差。主要用于pure speech方面。mid格式。mid格式的語音所占的空間比較狹小,有時短短20幾秒的芯片就能裝進去十多首mid格式的音樂。
(b)“音樂芯片”介紹:
(1)音樂的通道與音色:
包絡(envelope)方波(patch) 通道(channel)
包絡:合成音色的一部分,單位時間內(nèi)音符輸出的變化,常見有“ADSR”
方波:合成音色的一部分,單位時間內(nèi)音符方波電流的變化。(另見三角波等)
通道:在同一時間內(nèi),芯片輸出的音符個數(shù),即“單音樂器”的個數(shù)。
PCT:模擬音色的一種,通過采樣256個點的樂器聲音來模擬出各個音符的音高。(音色柔和,占空間小,但不夠真實)
FULL WAVE:通過采集一種樂器聲音來模擬各個音符音高。(樂器聲真實,但占用空間大,且采集音色音質(zhì)要求高)
(2)音樂的壓縮:
由于音樂數(shù)據(jù)量龐大,對音樂數(shù)據(jù)進行有效壓縮是很必要的,能夠使我們在有限的ROM空間里錄入更多的音樂內(nèi)容。有以下幾種方式:
音樂分段:將音樂中可以重復的部分截取出來,通過排列組合將內(nèi)容完整地回放出來。
音色:根據(jù)音樂的豐滿程度、需求程度,來確定Full wave,PCT、dual tone的選擇,各個音色占用空間不懂,音色質(zhì)量也不同。
數(shù)學壓縮:主要是針對采樣的音色(Full wave)進行壓縮,這種方式也是有損壓縮,對于要采集的音色進行降采樣、處理等減小采集音色的大?。ㄍZ音類的修音)。
MORE+ 精品推薦
MORE+ 資訊推薦