2017
-
10
-
20
说明:
很多都会问:我测试科大讯飞的识别效果很好呀,为什么你们的不能达到这个效果呢?原因很简单,因为你所测试的是科大讯飞在线的语音识别模块,而我们的是离线的语音识别模块。离线的语音识别和在线的语音识别是有所差距的:l 离线语音识别:固定词条,不需要连接网络,但是识别率稍低l 在线语音识别:词条不固定,需要连接网络,识别率较高,但是效果会受网络影响, 价格相对较高产生差距的原因有两点:① 语音识别比较重要的一个因素是:语音库,它作为识别过程中对比的数据在线的语音库在云端,存储的数据是非常庞大的;而离线的语音库在本地,空间是有限的,那样对比的数据样本差异就比较大,假设输入的语音“打开灯”,那么识别的过程就会将此语音拿来与语音库中的声音样本做对比,语音库中数据样本越多,成功匹配的可能性就越高,所以识别成功率就越高②在线识别的运算速度是非常快的,和离线语音识别相对比就类似为CPU的运算速度和芯片的运算速度,等级相差比较大的 因此,离线的效果是没有在线的那么好,那是不是意味着离线就没有价值呢?不是的,每个技术出来都有其价值,只是不同的技术适用于不同的领域,离线识别效果稍差,但是在近距离,相对安静的环境下,识别率是可以达到90%以上的;而对于一些不连接网络的产品,如:移动照明,按摩器等,离线语音识别比在线的就更加适合,而且从价格方面来说,离线语音识别应用能满足挺多场合的,价格比在线的便宜,应用在线语音识别最终的产品价格也会相对偏高,看用户的一个研发产品市场定位跟选择的。
2017
-
09
-
22
说明:
很多语音芯片有带音量控制,有些则不带音量控制。语音芯片的音量控制一般分为两种,一种是硬件音量控制,另外一种是软件音量控制。一、硬件音量控制:语音芯片的音量控制一般分为8级音量控制和16级音量控制。但是语音芯片一般有两种音频输出方式,一种是PWM音频输出,一种是DAC音频输出,哪语音芯片的硬件音量控制是怎么控制两种音频输出的音量的呢?一般是采用调整电流的方式来控制音量的输出。控制PWM电流就可以控制输出到喇叭上的电流强度,从而控制喇叭振幅的大小,从而控制我们人感知的音量大小。DAC音频输出方式,同样也是控制电流形式,因为语音芯片大多数一般都是电流型DAC只要控制DAC的电流就可以控制外部三极管的基极电流,从而控制喇叭上的电流强度达到音量调节的目的。二、软件音量控制:由于软件调节音量不能直接控制PWM和DAC上的电流,所以软件音量控制一般是直接调整输送到音频合成器的数值,达到音量控制的目的。所以只要通过一定的数学运算,就可以对输送到音频合成器的数值进行调制。理论上软件音量控制可以任意级数。但是由于受到CPU运算能力的影响和实际应用的需求一般也是做16级音量控制。如果运算能力有限也可以做2级或者4级音量控制。各行业语音芯片如何选型?目前各行用的最多的是8脚语音芯片,因为电路体积小、应用方便,而且价格比较低,一般为OTP类型的较为多,各行业均会优先考虑该类型。8脚语音芯片主要是指软封装为八个引脚,硬封装为DIP8或者SOP8的语音芯片,常见的八脚语音芯片有WTH040系列、WTH080系列、WTN3系列、WTN4系列、WTN5系列、WTH040系列、WTH080系列……,不同的芯片行业领域应用可选择不同的型号。一般的语音集成电路的封装形式大部分是双列直插式塑料封装集成电路(DIP),俗称硬封装电路,按引脚数分为8脚、14脚、16脚等,每个引脚的功能是不同的。通常引脚多,集成电路芯片...
2017
-
07
-
26
说明:
目前市场上可供选择的语音芯片,模块,大概可以根据时间长短和功能来选择,下面是一些深圳唯创知音电子有限公司提供给大家的经验,公司从1999年从事语音ic行业到目前,已经有十几年,根据一个自身经验,特此总结如下,希望对初次选用使用语音芯片、录放音芯片的用户能有所帮助。l 从时间长度上考虑:一般情况下,语音芯片(默认OTP:一次性的)的时间长度在10~340秒。基本上集中在短秒数的。它声音清晰,时间短,价钱低,制作容易,订货数量不限,所以是产品试验阶段较好的选择方案。市面上20秒的芯片价格大概在2~3元左右;40秒大概在4~5元;170秒大概在9~10元。一般情况下,是由厂家制作样品,用户服务订货时,由厂家将内容烧写好,然后交给用户。这样用户就可以省掉一些功夫。如果用户的声音需要经常修改,则可以自己购买一套编程(也叫烧写器,下载器),自己学会是如何制作的,则可以由自己来制作。语音芯片的用途集中在安防门禁、家用电器、医疗设备等场合。 语音模块,它的结构大概是:MCU+外挂存储器,所以它的存储容量会比芯片大得多,从10~30分钟都有,但是,价钱一般从20~80元不等起,是芯片的好几倍。体积也比芯片大,功耗也稍微要大一点。l 从功能上考虑:语音芯片是一次性的,它订货数量不限,出货速度快,但也有缺点:不可以重复多次烧写。深圳唯创知音电子有限公司出了一些是可以重复擦写的模块,比如:WT588D系列语音模块, WT2003S系列语音模块等,一些是可以通过专用的烧写器来更换内容,一些是可以直接通过USB口来更换语音内容,甚至还可以在现场下载内容,进行语音的更新,这些强大的功能,有效的丰富了语音模块的内涵,增加了它的应用领域,开拓了新的天地 。随着科技的发展和产品的集成化,语音芯片已经逐渐替代了多种语音设备应用在各场合。语音芯片主要特性是功耗低,抗干扰能力强,外围...
2013
-
11
-
29
说明:
WT系列开头的各类型语音芯片,录音芯片都是深圳唯创知音电子有限公司自有品牌产品,WT为唯创知音电子英文名称WAYTRONIC简写。OTP语音芯片有WTV系列,WTH系列,WTN3/4/5/6系列,挂FLASH的有WT588D,具体看你需要多长时间的,都可以实现,把多段语音烧写到对应的地址,通过单片机调用即可。 还有有一个可以同时支持储存多段录音的录音IC: WT2000/WTR030/WTR050系列录音芯片为我司新研发产品,采用录音芯片外挂SPI存储器的方式,达到录音的功能。 它的主要特点是声音清晰,录音时间长。WT系列可以提供的最长录音时间为16小时。一个显著特点是存储时间灵活,客户根据自己需要的录放时间长度,选择相应的外挂SPI FLASH容量,主控芯片无需更改,相比其它录音芯片或电路,有着单片录音时间长、多段灵活控制、成本低、语音清晰的优点。 有些WT系列语音IC具备按键控制模式、按键一对一控制模式及三线串口控制模式等三种模式。能够很方便的应用在多种场合,是一款性价比很高的标准化录放模块。 WT系列的控制模式只能在第一次烧写程序的时候设定,一经设定就不能再次更改,但录音内容是可以随意擦写的.
2013
-
11
-
29
说明:
MP3解码芯片介绍: (1)音乐的通道与音色: 包络(envelope)方波(patch) 通道(channel) 包络:合成音色的一部分,单位时间内音符输出的变化,常见有“ADSR” 方波:合成音色的一部分,单位时间内音符方波电流的变化。(另见三角波等) 通道:在同一时间内,芯片输出的音符个数,即“单音乐器”的个数。 PCT:模拟音色的一种,通过采样256个点的乐器声音来模拟出各个音符的音高。(音色柔和,占空间小,但不够真实) FULL WAVE:通过采集一种乐器声音来模拟各个音符音高。(乐器声真实,但占用空间大,且采集音色音质要求高) (2)音乐的压缩: 由于音乐数据量庞大,对音乐数据进行有效压缩是很必要的,能够使我们在有限的ROM空间里录入更多的音乐内容。有以下几种方式: 音乐分段:将音乐中可以重复的部分截取出来,通过排列组合将内容完整地回放出来。 音色:根据音乐的丰满程度、需求程度,来确定Full wave,PCT、dual tone的选择,各个音色占用空间不懂,音色质量也不同。。 数学压缩:主要是针对采样的音色(Full wave)进行压缩,这种方式也是有损压缩,对于要采集的音色进行降采样、处理等减小采集音色的大小(同语音类的修音)。 (3)常用音乐格式: MID格式:MIDI(Musical Instrument Digital Interface)乐器数字接口 ,是20 世纪80 年代初为解决电声乐器之间的通信问题而提出的。MIDI 传输的不是声音信号, 而是音符、控制参数等指令。 WAV格式:(相见语音IC类介绍)采集音色的格式。
2013
-
11
-
29
说明:
语音芯片的发展语音芯片主要特性是功耗低,抗干扰能力强,外围器件少,控制简单,语音保存时间久(某些语音芯片可以保存内容100年),掉电不丢失语音,部分芯片还可以重复擦写语音内容。如汽车倒车雷达,公交车报站器,银行排队机、语音玩具、防盗系统等设备都装备了语音芯片。由于芯片种类众多,功能各异,工程师在选用语音芯片会有些彷徨无策,因此给初涉语音行业的工程师提供一些语音芯片的选型参考。那语音芯片如何选型?1、录音芯片及放音芯片的选择语音芯片从使用功能上,基本可以划分为录音语音芯片和放音语音芯片。设计一个使用语音芯片的产品,首先要考虑是否使用录制现场语音,如需要录制语音则选用带有录音功能的语音芯片,否则就选用只有放音功能的语音芯片。通常带有录音功能的语音芯片都具有回放语音的功能,但是在播放语音时,音质都没有专门的放音语音芯片好,所以在选择语音芯片时要权衡功能及音质方面等因素,例如WT2000/WTR030/WTR050等系列录音IC。 安防系统、会议记录系统、录音玩具等产品都要求具备录音功能,这类型产品的开发都会用到录音语音芯片。仅用到放音功能的设备很多,像治疗仪、倒车雷达、报站器、报警器等。这类型的产品不需要录制现场的语音,将已经处理过的语音利用工具下载到语音芯片播放就可以。放音芯片根据存储方式可分为OTP ROM、FLASH ROM、EEPROM及MASK四种。2、OTP ROM、FLASH ROM和EEPROM的选择 OTP(One Time Programable)是指一次性可编程语音芯片,语音只能烧写一次,适合应用在不需要修改语音、语音长度短的场合,从放音的长度上可以分为10秒、20秒、40秒、80秒、170秒、340秒。OTP语音芯片的特点是单芯片方案、价格便宜,适合中小型批量生产,即便是小数量生产也可以及时拿货,例如WTH系列、...
2013
-
11
-
29
说明:
音乐芯片是一种比较简单的语音电路,常见的的音乐芯片有WT2003S语音芯片、WT2000、WT2003系列语音芯片。音乐芯片通过内部的振荡电路,再外接小量分立元件,就能产生各种音乐信号,音乐芯片是语音集成电路的一个重要分支,目前广泛用于音乐卡、电子玩具、电子钟、电子门铃、家用电器等场合。 音乐芯片由以下几个部分组成:逻辑控制电路、振荡器、地址计数器、音符节拍存贮器(ROM)、音阶发生器、输出驱动器。它的工作原理为:振荡电路产生的信号供各个电路使用;控制电路从存储器中读出代码,根据代码来控制节拍器和音调器协调工作,产生相应的音乐输出。 音乐芯片的种类介绍,市场上的音乐芯片很多,种类也不同,根据音乐输出的特点我们将音乐电路分为以下几类:单曲、复音、音乐带闪灯、唱歌;它们主要应用在做死的音乐播放器上,如生日贺卡芯片是单曲芯片。音乐芯片按是否可录分可录和不可录,可录芯片是可以通过电路把人的声音录到芯片上,然后通过电路播放出来。如音乐玩具盒和留声机都是用可录芯片做成的。按封装形式有COB黑膏软封装和三极管封装形式。音乐芯片的功能特点:音乐芯片存储格式多样,生产周期快,仅需一天,下单无数量限制; 音乐芯片灵活的多种按键操作模式以及电平输出方式供选择(边沿按键触发、电平触发、随机按键播放、顺序按键播放);音乐芯片采用简单方便的两线MCU串口控制方式,用户主控MCU可控制任意段语音的触发播放及停止;音乐芯片的音质优美,性能稳定,物美价廉;
2013
-
11
-
29
说明:
八脚语音芯片有哪些?8脚语音芯片怎么选型?8脚语音芯片主要是指软封装为八个引脚,硬封装为DIP8或者SOP8的语音芯片,常见的八脚语音芯片有WTH040、WTH080、WTN3、WT5、WTN4、WTN6系列……,不同的芯片行业领域应用可选择不同的型号。一般的语音集成电路的封装形式大部分是双列直插式塑料封装集成电路(DIP),俗称硬封装电路,按引脚数分为8脚、14脚、16脚等,每个引脚的功能是不同的。通常引脚多,集成电路芯片的体积越大,电路功能强,价格较八脚的高,八脚语音芯片也是小体积语音IC,空间占用小。 常用的8脚语音ic用途很多,目前很多行业青睐8脚语音芯片,行业常用的语音芯片有哪些呢?分别用在什么用途,语音芯片的选型,除了考虑管脚外,也要考虑价格、语音长度等,以下为您详解WTN3,更多的可以咨询我们的在线工程师。 WTN3语音芯片在芯片应用范围上,几乎可以涉及到所有需要低成本,但不更改语音的场所,应用场合有汽车(防盗报警器、倒车雷达、GPS导航仪、电子狗、中控锁);智能家居系统、闹钟、提醒器;专用报警器、家庭防盗报警器;医疗器械人声提示、治疗仪;家电(电磁炉、电饭煲、微波炉);娱乐设备(游戏机、游乐机);学习模型(早教机、儿童有声读物);智能交通设备(收费站、停车场);通信设备(电话交换机、电话机);工业控制领域(电梯、工业设备)儿童玩具。 其实除了封装管脚为8个引脚外,语音ic也有封装为16管脚、18管脚(DIP18)、20管脚(SSOP20)32管脚(LQFP32)、48管脚的语音芯片,例如WT588D语音芯片有18管脚、20管脚、32管脚的;上文提到的WT5001有48管脚等。 一般采购多少管脚的语音ic主要是由工程师来决定。