资源描述
语音芯片选型
语音芯片选型
随着科技的发展和产品的集成化,语音芯片已经逐渐替代了多种语音设备应用在各场合。语音芯片主要特性是功耗低,抗干扰能力强,外围器件少,控制简单,语音保存时间久(某些语音芯片可以保存内容100年),掉电不丢失语音,部分芯片还可以重复擦写语音内容。如汽车倒车雷达,公交车报站器,银行排队机、语音玩具、防盗系统等设备都装备了语音芯片。由于芯片种类众多,功能各异,工程师在选用语音芯片会有些彷徨无策,因此给初涉语音行业的工程师提供一些语音芯片的选型参考。
1、录音芯片及放音芯片的选择
语音芯片从使用功能上,基本可以划分为录音语音芯片和放音语音芯片。设计一个使用语音芯片的产品,首先要考虑是否使用录制现场语音,如需要录制语音则选用带有录音功能的语音芯片,否则就选用只有放音功能的语音芯片。通常带有录音功能的语音芯片都具有回放语音的功能,但是在播放语音时,音质都没有专门的放音语音芯片好,所以在选择语音芯片时要权衡功能及音质方面等因素。
安防系统、会议记录系统、录音玩具等产品都要求具备录音功能,这类型产品的开发都会用到录音语音芯片,市场上有录音功能的芯片主要有ISD1110、ISD1400、ISD1700、ISD1800、ISD2500、ISD3300、ISD4000、WTR010、WTV040、APR96000等。利用录音芯片开发的录音模块,拥有更为简洁的外围电路和更佳的效果。如WTR-S4、WTV-NAND录音模块,这些模块利用外部的FLASH ROM作为存储中心,因而能够录制更长时间的语音。
仅用到放音功能的设备很多,像治疗仪、倒车雷达、报站器、报警器等。这类型的产品不需要录制现场的语音,将已经处理过的语音利用工具下载到语音芯片播放就可以。放音芯片根据存储方式可分为OTP ROM、FLASH ROM、EEPROM及MASK四种。
2、OTP ROM、FLASH ROM和EEPROM的选择
OTP(One Time Programable)是指一次性可编程语音芯片,语音只能烧写一次,适合应用在不需要修改语音、语音长度短的场合,从放音的长度上可以分为10秒、20秒、40秒、80秒、170秒、340秒。OTP语音芯片的特点是单芯片方案、价格便宜,适合中小型批量生产,即便是小数量生产也可以及时拿货。主要应用在中低端玩具、电子琴、电动车等产品上。
FLASH ROM和EEPROM的共性是可重复擦写、存储空间大,可随意更换控制方式和语音内容,能存储更大的语音文件。EEPROM通常都会集成在芯片中,此类型语音芯片价格比较昂贵,如ISD1700、ISD2500等。一般可以外挂的FLASH ROM有1Mbit~32Mbit,因需要用“语音芯片+FLASH”才能工作,价格比OTP的稍高,但整体售价比EEPROM的低,适合制样或者中小型批量投产。使用FLASH ROM的语音芯片有WT588D、WTV020-S,WTV040(需烧写特殊程序)等。
3、MASK掩膜投产
MASK投产使得整个语音芯片方案在保持性能、功能不变的情况下成本降低将近一半,且多数语音芯片在MASK投产不需要更改外围电路。但MASK投产需要订单数量超过2~7万,否则厂家会收取高额的光罩费,MASK生产时间大概要用1个月左右。目前MASK掩膜投产的芯片有WTB及WT588D(≤4Mbit FLASH ROM),其语音时间在5秒~340秒,是大批量投产的最佳选择。
4、可以存储更多语音的SD卡方案
SD卡已经成为当前市场上一大主流存储载体,其价格便宜,存储空间大,可移植性强等优点得到大部分厂家青睐。语音芯片也同样向外置SD卡的方向发展,厂家根据主控芯片的特性设计出可以播放各种音频格式的SD卡播放器,如WAV、MP3、WMA、AD4等主流音频格式。WTM-SD模块、USBSD模块 在外挂SD卡的时候可以播放WAV、MP3音频格式,WTV020-SD模块可以播放AD4、WAV音频格式等。这类型模块的播放时间均能达到数十小时。
5、从语音音质、语音长度方面选择
语音存放的长度由音频采样率及芯片内部(或外挂)ROM空间所决定,音频采样率的大小直接影响音频输出的音质,同一型号芯片的音频采样率越高,音质越好,但是需要占用更多的ROM空间。芯片的成本也因存储空间的增大而有不同幅度的上涨。如果对音质要求较高、语音时间在5分钟内,可以考虑选用ISD语音芯片、WTV语音芯片、WTC语音芯片、WT588D语音芯片、ISD语音芯片;要求音质高、语音时间长可以选用WTV020-SD模块、WTM-SD模块、USBSD模块;对音质要求不高、语音时间在340秒以内可选用WTB语音芯片。从录音长度方面考虑,要求录音长度在340秒以内,可选用ISD1700、ISD2500语音芯片;要求录音长度在30分钟内,可选用WTR-S4录音模块;录音长度达到数小时,则要用WTV-NAND录音模块。
6、是否选用MCU控制
部分语音芯片是只支持串口通讯协议的,因此必须由MCU进行控制,而不能利用脉冲或者电平来控制,此部分芯片中包括ISD3300、ISD4000等,在选择此类芯片的时候要考虑到控制端是否具备MCU。大部分芯片都是可以用MCU或者按键来控制的,如WTV、WTB、WTC、WT588D、ISD1700、ISD2500等。
7、语音芯片/模块综合素质对比一览表
序号
芯片/模块型号
特性
稳定性
控制方式
工作电压
音质
价格
1
ISD1110
10秒录放音,EEPROM,可重复擦写
稍差
并口/按键
4.5~5.5V
一般
便宜
2
ISD1420
20秒录放音,EEPROM,可重复擦写
稍差
并口/按键
4.5~6.5V
一般
稍贵
3
ISD1810
8~16秒单段录放音,EEPROM,可重复擦写
好
按键
2.7~4.5V
一般
便宜
4
ISD2532/64
32~64秒录放音,EEPROM,可重复擦写
掉语音
并口/按键
4.5~5.5V
一般
稍贵
5
ISD2560/120
60~120秒录放音,EEPROM,可重复擦写
掉语音
并口/按键
4.5~5.5V
一般
贵
6
ISD3300
2~4分钟录放音,EEPROM,可重复擦写
掉语音
SPI串口
2.7~3.3V
好
贵
7
ISD1700
20~480秒录放音,EEPROM,可重复擦写
好
SPI串口/按键
2.4~5.5V
好
稍贵
8
ISD4002
2~4分钟录放音,EEPROM,可重复擦写
掉语音
SPI串口
2.7~3.3V
好
贵
9
ISD4003
4~8分钟录放音,EEPROM,可重复擦写
掉语音
SPI串口
2.7~3.3V
好
稍贵
10
ISD4004
8~16分钟录放音,EEPROM,可重复擦写
掉语音
SPI串口
2.7~3.3V
好
较贵
11
WTV010/020
10~20秒放音,OTP,可编程
好
串口/并口/按键
2.5~3.6V
一般
便宜
12
WTV040/080
40~80秒放音,OTP,可编程
好
串口/并口/按键
2.5~3.6V
一般
便宜
13
WTV170/340
170~340秒放音,OTP,可编程
好
串口/并口/按键
2.5~3.6V
一般
稍贵
14
WTB015/031
15~31秒放音,OTP,可MASK,可编程
工业级
串口/并口/按键
2.2~5.5V
一般
便宜
15
WTB084/170
84~170秒放音,OTP,可MASK,可编程
工业级
串口/并口/按键
2.2~5.5V
一般
便宜
16
WT588D
33~1057秒放音,可重复擦写,可编程
工业级
串口/并口/按键
2.8~5.5V
好
便宜
17
WTW500-16P
33~1057秒放音,可重复擦写,可编程
工业级
串口/并口/按键
3.3V/5V
好
便宜
18
WT588D-U
33~1057秒放音,USB下载,可编程
工业级
串口/并口/按键
3.3V/5V
好
便宜
19
WTV-S
40~670秒放音,可重复擦写,可编程
好
串口/并口/按键
3.3V
一般
便宜
20
WTV-S1
40~670秒放音,USB下载,可编程
好
串口/并口/按键
3.3V
一般
便宜
21
WTR-S4
64~2730秒录放音,FLASH ROM,可重复擦写
好
串口/按键
2.7~3.6V
一般
便宜
22
WTV-NAND
1~16小时录放音,可跟电脑相互通信
好
串口/按键
3.3V/5V
一般
稍贵
23
WTV020-SD
最长90小时放音,可制定多种控制方式
好
串口/按键
2.5~3.6V
好
便宜
24
WTM-SD
可播放MP3音频,语音来源丰富
好
串口/按键
5V
好
贵
25
USBSD
可播放MP3音频,语音来源丰富
好
串口/按键
5V
好
稍贵
26
APR9301
16~32秒录音,EEPROM,可重复擦写
好
按键
5.5~6.5V
稍差
便宜
27
APR6008
8分钟录放音,EEPROM,可重复擦写
好
串口
2.7~3.3V
一般
贵
28
APR6016
4~8分钟录放音,EEPROM,可重复擦写
好
串口
2.9~3.3V
一般
贵
29
API8108A
10秒语音播放,OTP
稍差
并口/按键
3.0~6.0V
差
稍贵
30
API840N
40秒语音播放,OTP
稍差
并口/按键
3.0~6.0V
差
便宜
31
AP8910/21
10~21秒语音播放,OTP
好
并口/按键
2.6~5.0V
差
便宜
32
AP89021/042
21~42秒语音播放,OTP
好
并口/按键
2.2~3.6V
差
便宜
33
AP89085/170
85~170秒语音播放,OTP
好
并口/按键
2.2~3.6V
差
稍贵
34
AP89341
341秒语音播放,OTP
好
并口/按键
2.2~3.6V
差
贵
35
MSM6295
60秒语音播放,4通道
好
SPI串口/按键
4.5~5.5V
好
贵
36
MSM6585
4通道语音播放
好
SPI串口/按键
4.5~5.5V
好
贵
37
ML22P80X
2.1~8.7分钟语音播放,OTP
好
SPI串口
2.7~3.6V
好
贵
38
WTC020
10-20秒OTP
好
单线串口
2.6-5V
好
便宜
展开阅读全文