行业新闻

什么是语音芯片|语音芯片的界说

宣布日期：2018-05-22

什么是语音芯片 / Voice IC是什么 / 语音芯片的界说

语音芯片直观的从名称上来看,就是与语音有关的芯片,语音就是存储的电子声音,通常能爆发声音的芯片,就是语音芯片,俗称声音芯片,英文准确些来说应该是Voice IC.

在语音芯片的各人庭中,凭证声音的类型差别可分为语音IC(Speech IC)和音乐IC(Music IC)两种.这儿应该算是语音芯片有用的区分要领.

日常生涯中,语音芯片应用场合和行业差别,又被各人分为玩具芯片(玩具行业使用的,如AC80E5),门铃芯片(AC8DM32),OTP语音芯片(AC8040),童谣IC(AC8DE12), 童车IC等等.虽然这种分类内里她也同时保存着语音IC(Speech ic)和音乐IC(Music IC) .

语音芯片有凭证IC自己的物理结构的多个通道(同时发出多个通道的声音)可分为多种类型:

一, 单通道的:

1, 单通道的语音IC(Speech IC)(这种语音芯片不支持音乐IC音乐存储方式); 常见的语音IC是单通道的语音芯片,AC8020-OTP20秒和AC83E12动物啼声是典范的单通道语音芯片了,

2, 单通道的音乐IC(Music IC),统一单位时间内只能发出一种音乐的音乐IC, 电子声音文件是只有一个通道的.Mid后缀文件.

常说的单音片,是一种基本的音乐IC,由一准时间内音符输出的几多,决议了单音片的效果,有64音符多,128音符等等. 单音片应用场合广,价钱极其低廉,常见的有单音片有生日快乐贺卡单音片.典范的有AC8SE07等

严酷的说,单通道的音乐IC和单音片的两者结构是不相同的

二, 2通道:

1, 2通道的语音IC, 2通道和多通道的语音芯片,现实应用中语音播放时一般会按划定牢靠在某一通道内举行声音的播放(等同于单通道),可是这类产品比单通道的语音IC(Speech ic)本钱要高,价钱会高些,语音芯片厂家在设计时为了平衡产品价钱和应用,一般来说,功效支持和声音效果方面都会做得更优异一些.

这种结构也许是由于产品和方案现实应用领域和价钱所决议的, 语音芯片输出一般都是单通道的声音输出,支持立体声的产品很少, 要高端一些的产品就要选MP3主控芯片之类的方案了

2, 2通道的音乐芯片, 通俗叫法是双音片(Music With Dual Tone IC), 故名思义,统一单位时间内二个通道都可以发出音乐的音乐IC. 电子声音源文件一般为.Mid的二通道文件.常见的圣诞系列音乐IC如:AC8DC12.

这里得多增补两句,市面上尚有一个叫melody的音乐芯片,她是个什么界说呢?简朴的来说,比单音片的效果要好比和弦音乐芯片的效果要差的一种音乐芯片,以是双音片也有被叫成是melody音乐芯片,melody结构应该来说是一种更好的单音片,或者可以说是二倍效果的单音片.

三, 4通道,8通道或以上:

三通道以上的声音.又称为和弦音乐.常说的4和弦音乐IC就是指4通道的音乐IC...

一般多通道的语音芯片都是同时支持音乐IC(Music IC)和语音IC(Speech IC)功效的.

怎样区分有没集成MCU的语音芯片

先看MCU(Micro Controller Unit)的界说，，，又称单片微型盘算机(Single Chip Microcomputer)，，，是指随着大规模集成电路的泛起及其生长，，，将盘算机的CPU、RAM、ROM、准时数器和多种I/O接口集成在一片芯片上，，，形成芯片级的盘算机。。。。

语音芯片有两种,一种是集成MCU的,如AC4060,AC5080可编程OTP系列,功效较量强盛,从物理结构上简朴的说,它集成了RAM(随机存储器和准时计数器等)和ROM两种存储器。。。。而另一种是不集成MCU的,它内部只有一个ROM(不详细运算和随机存储计时器等一些功效),如AC9020,AC8040,AC3030系列芯片,可是价钱会相当自制一些.

简朴一些的说吧,有RAM的OTP语音芯片是集成MCU的,由于RAM随机存储器的特征,让芯片能完成更多重大的功效。。。。

凭证语音芯片的物理特征的界说:

语音芯片是将语音信号通过声音采样转化为数字信号，，，存储在芯片的ROM中，，，再通过电路将ROM中的数字信号还原针言音信号的集成电路。。。。

通例语音芯片的语音信号输出方式有两种：脉冲宽度调制(PWM）输出和数模转换输出（DAC）。。。。

脉冲宽度调制(PWM）输出，，，是使用微处理器的数字输出来对模拟电路举行控制的一种很是有用的手艺。。。。其相关于DAC输出，，，其特点是应用广、本钱低。。。。是玩具行业主要的声音输出应用方式。。。。

数模转换输出(DAC)：通俗语音芯片是指单独具有放音功效的集成电路，，，实质上是一个DAC历程，，，而ADC历程资料是由电脑完成，，，其中包括对语音信号的采样、压缩、EQ等处理。。。。

ADC=Analog Digital Change 模数转换

DAC= Digital Analog Change 数模转换

音质的优劣取决于ADC和DAC位数的几多。。。。有的ADC和DAC均为32bit,靠近真人音质。。。。而有的ADC和DAC为16bit，，，靠近CD音质。。。。而一些通俗的DAC为8bit，，，为通俗音质。。。。

录音芯片包括ADC和DAC两个历程，，，都是由芯片自己完成的，，，包括语音数据的收罗、剖析、压缩、存储、播放等方法。。。。

2、语音信号的量化表述：（分类：语音IC 和音乐IC）

a) “语音IC”介绍：

（1）语音信号的量化

采样率（f）、位数（n）、波特率（T）

采样：将语音模拟信号转化成数字信号。。。。

采样率：每秒采样的个数（byte）。。。。

波特率：每秒钟采样的位数(bit)。。。。波特坦率接决议音质。。。。Bps: bit per second

采样位数指在二进制条件下的位数。。。。一般在没有特殊说明的情形下，，，声音的采样位数指8位，，，由00H--FFH，，，静音定为80H。。。。深圳市环芯半导体有限公司

（2）采样率

耐奎斯特抽样定理：要从抽样信号中无失真地恢回复信号，，，抽样频率应大于2倍信号高频率。。。。抽样频率小于2倍频谱高频率时，，，信号的频谱有混叠。。。。抽样频率大于2倍频谱高频率时，，，信号的频谱无混叠。。。。

嗓音的频带宽度为20～20K HZ左右，，，通俗的声音或许在3KHZ以下。。。。以是，，，一般CD取的音质为44.1K和16bit，，，若是遇到某些特别的声音，，，如乐器，，，音质也有用48K和24bit的情形，，，但不是主流。。。。

一般在我们处理针对通俗语音IC的时间，，，采样率高抵达16K就够了、语言声一般取8K（如电话音质）、6K左右。。。。低于6K效果较量差。。。。

在应用单片机的历程中，，，采样越高，，，准时器中止速率越快，，，会影响到其他信号的监控和检测，，，以是要综合思量。。。。

（3）语音压缩手艺。。。。

由于语音数据量重大，，，对语音数据举行有用压缩是很须要的，，，能够使我们在有限的ROM空间里录入更多的语音内容。。。。有以下几种方式：

语音分段：将语音中可以重复的部分截取出来，，，通过排列组合将内容完整地回放出来。。。。

语音采样：一般我们使用的喇叭频响曲线在中频部分，，，较少用到高频，，，以是，，，在喇叭音质可以接受的情形下，，，适当降低采样频率，，，抵达压缩效果，，，这种历程是不可逆的，，，无法恢回复貌，，，叫有损压缩。。。。

数学压缩：主要是针对采样位数举行压缩，，，这种方式也是有损压缩。。。。例如，，，我们经常接纳的ADPCM压缩名堂，，，是将语音数据从16bit压缩到4bit，，，压缩率是4倍。。。。MP3是对数据流举行压缩，，，涉及到数据预测问题，，，它的波特率压缩倍率为10倍左右。。。。

通常，，，以上几种压缩方式都是综合起来使用的。。。。

（4）常用语音名堂

PCM名堂： Pulse Code Modulation 脉冲编码调制，，，它将声音模拟信号采样后获得量化后的语音数据，，，是基来源始的一种语音名堂。。。。同它极为类似的尚有RAW名堂和SND名堂。。。。它们都是纯语音名堂。。。。

WAV名堂：Wave Audio Files 是微软公司开发的一种声音文件名堂，，，也叫波形声音文件，，，被Windows平台及其应用程序普遍支持。。。。WAV名堂支持许多压缩算法，，，支持多种音频位数、采样频率和声道，，，但WAV名堂对存储空间需求太大未便于交流和撒播。。。。WAV文件内里存放的每一块数据都有自己自力的标识，，，通过这些标识可以告诉用户事实这是什么数据，，，这些数据包括采样频率和位数，，，单声道(mono)照旧立体声(stero)等。。。。；；沸居镆粜酒琁C

ADPCM名堂：是使用对已往的几个抽样值来预测目今输入的样值，，，并使其具有自顺应的预测功效与现实检测值举行较量，，，随时对测得的差值自动举行量化级差的处理，，，使之始终坚持与信号同步转变。。。。它适用于语音转变率适中的情形，，，并且声音回放历程简短。。。。它的优点是关于人声的处理较量逼真，，，一般抵达90％以上，，，已普遍地应用于电话通讯领域。。。。

MP3名堂： Moving Picture Experts Group Audio Layer III，，，简称为MP3。。。。它是使用 MPEG Audio Layer 3 的手艺，，，接纳了名为“感官编码手艺”的编码算法：编码时先对音频文件举行频谱剖析，，，然后用过滤器滤掉噪音电平，，，接着通过量化的方式将剩下的每一位打散排列，，，后形成具有较高压缩比的mp3文件，，，并使压缩后的文件在回放时能够抵达较靠近原音源的声音效果。。。。它的实质是vbr（Variant Bitrate 可变波特率）可以凭证编码的内容动态地选择合适的波特率，，，因此编码的效果是在保广告法证了音质的同时又照顾了文件的巨细。。。。

mp3压缩率10倍甚至12倍。。。。是初泛起的一种高压缩率的语音名堂。。。。

Linear Scale名堂：凭证声音的转变率巨细，，，把声音分成若干段，，，对每段用线性比例举行压缩，，，可是它的比例是可变的。。。。SUNLINK公司和ALPHA公司的Linear Scale名堂为5bit。。。。

Logpcm名堂：基本上对整个声音举行线性压缩，，，将后若干位去掉。。。。这种压缩方式在硬件上很容易实现，，，但音质比Linear Scale差一些，，，特殊是音量较小声音较量细腻的情形下效果较差。。。。主要用于pure speech方面。。。。

（b）“音乐IC”介绍：

（1）音乐的通道与音色：

包络（envelope）方波(patch) 通道（channel）

包络：合成音色的一部分，，，单位时间内音符输出的转变，，，常见有“ADSR”

方波：合成音色的一部分，，，单位时间内音符方波电流的转变。。。。（另见三角波等）

通道：在统一时间内，，，IC输出的多音符个数，，，即“单音乐器”的个数。。。。

PCT：模拟音色的一种，，，通过采样256个点的乐器声音来模拟出各个音符的音高。。。。(音色柔和，，，占空间小，，，但不敷真实)

FULL WAVE：通过收罗一种乐器声音来模拟各个音符音高。。。。（乐器声真实，，，但占用空间大，，，且收罗音色音质要求高）

（2）音乐的压缩：

由于音乐数据量重大，，，对音乐数据举行有用压缩是很须要的，，，能够使我们在有限的ROM空间里录入更多的音乐内容。。。。有以下几种方式：

音乐分段：将音乐中可以重复的部分截取出来，，，通过排列组合将内容完整地回放出来。。。。

音色：凭证音乐的丰满水平、需求水平，，，来确定Full wave，，，PCT、dual tone的选择，，，各个音色占用空间差别，，，音色质量也差别。。。。。。。。

数学压缩：主要是针对采样的音色（Full wave）举行压缩，，，这种方式也是有损压缩，，，关于要收罗的音色举行降采样、处理等减小收罗音色的大。。。。ㄍ镆衾嗟男抟簦。。。。

（3）常用音乐名堂：

MID名堂：MIDI(Musical Instrument Digital Interface)乐器数字接口，，，是20 世纪80 年月初为解决电声乐器之间的通讯问题而提出的。。。。MIDI 传输的不是声音信号, 而是音符、控制参数等指令。。。。

WAV名堂：（相见语音IC类介绍）收罗音色的名堂。。。。

3、语音ROM空间的表述

语音芯片为表述的形象化，，，由语音长度来体现

a)通俗语音芯片以6K采样率为语音长度盘算标准。。。。

b)录音IC以4K采样率为语音长度盘算标准(以AC6006,AC6009,AC6012为例)。。。。

即：以6k（4k）采样率芯片可以播放的长度。。。。

4、语音芯片的要素

相同品种的芯片本钱与芯片的巨细成正比。。。。

a)I/O口的分配和ROM的大。。。。ㄓ镆裘胧┚鲆樾酒厩。。。。低秒数语音芯片其I/O口较少。。。。

b)音质提高，，，采样提高，，，语音秒数缩短。。。。

音质降低，，，采样降低，，，语音秒数变长

c) 语音秒数的盘算要领：M/(n*f)

M---ROM大。。。。╞it） n*f---波特率

适用的盘算语音芯片傻瓜盘算方式, 音乐IC和语音IC是差别的哦 : -_-

语音IC的秒数=ROM(bit)除以/10(工业算法标准)＝Byte(理论上是除以8)/再除以3＝语音芯片的秒数，，，好比512kbitROM/8/3＝21秒左右,芯片的内部压缩比差别，，，秒数是非稍有误差，，，以上算法是以6K采样率为基准的。。。。

音乐IC的秒数=ROM(bit)除以/除以3＝音乐IC的秒数，，，好比512kbitROM/3＝210秒左右,芯片的内部压缩比差别，，，秒数是非稍有误差。。。。

5、常见声音处理软件:

1）SoundForge , 功效强盛的声音处理软件，，，上手稍难一些

2）Cooledit，，，功效强盛的绘图声音处理软件，，，上手容易

3）goldwave，，，功效强盛的声音处理软件

4）Cakewalk，，，用于MID音乐文件图形化编辑的处理软件