jbo竞博

接待光临~广州jbo竞博电子科技有限公司
联系电话 手机/微信:

18925103846

您的位置: 网站首页 > 资料知识

资料知识

MX9016B-24QS语音识别芯片使用说明书V1.02

1、芯片特征

  • 半米内识别率 90%以上

  • 可以通过语音指令控制输出

  • 可以通过单片机串口控制播放指定语音

  • 三种输出模式:串口输出、IO 输出、喇叭播放

  • PWM 输出可直接推动 0.5W/8Ω 或 1W/8Ω 扬声器

  • 具有差分放大电路,,,清静情形下语音识别距离可抵达 2-3 米

  • 外挂 SPI Flash,,,增添存储容量

  • 可以存储多组词条,,,可是统一时刻只能泛起一组词条

  • 非特定人语音识别

  • 语音可支持 32 种语言,现在中文识别度较好

 

2、功效形貌

MX9016B语音识别模????槭且豢钚∏捎镆羰侗鹉?????,,,清静情形下语音识别距离可抵达 2-3 米;;;;;;外挂 SPI Flash,增添存储容量;;;;;;主要功效如下:

  1. 识别功效:可识别预设的语音词条,,,同时通过串口,,,IO 输出以及识别效果。。。。

  2. 播放功效:通过单片机指令播放指定的语音,,,同时通过 BUSY 脚标记是否正在播放语音。。。。

 

3、应用规模

  • 玩具类:智能机械人、智能故事机、智能玩具车机等

  • 家电类:智能茶壶、智能电饭锅、智能音箱、智能插排、智能晾衣架,,,智能空气净化器等

  • 理疗类:眼部推拿仪、推拿椅、头部推拿仪、足浴推拿器

  • 语音导航类:医院、阛阓等地方内指路器

4、应用方框图

模????1

结构组成:MX9016B-24QS 语音识别芯片外挂SPI-flash;;;;;;可搭配麦克风、喇叭、单片机等外设一起使用。。。。不过,,,在虚线框中的串口和 IO 都是用于检测 MX9016B是否能准确识别,,,以是在毗连 MCU(客户的)时可毗连其 IO 口或串口,,,二选一即可。。。。

 

5、芯片管脚介绍

芯片管脚图,,,引脚凭证上图排列顺序

 

引脚

引脚标号

功效形貌

1

PWMP

数字PWM输出(+),,,跟PWMP组合使用可直接驱动扬声器

2

VPS

PWM电源输出脚

3

VIO

PortA IO 电源输入脚

4

SPI_SO

SPI_SO脚

5

SPI_SI

SPI_SI脚

6

SPI_SCLK

SPI_SI脚

7

SPI_CS

SPI_CS脚

8

RESTINB

复位脚(烧录时需用到)

9

PC4

MIC麦克风口

10

PC3

MIC麦克风口

11

PC2

MIC麦克风口

12

AVSS

模拟地

13

BUSY

BUSY输出脚

14

OUTD

IO口/32K的晶体输出脚

15

V33O

内部LDO3.3V/1.8V 电压输出

16

VCC

电源输入脚

17

VSS

数字地

18

TX

串口发送脚

19

RX

串口吸收脚

20

OUTC

IO口/AD口

21

OUTB

烧录引脚,,,闲置时可当IO口使用

22

OUTA

烧录引脚,,,闲置时可当IO口使用

23

PWMN

数字PWM输出(-),,,跟PWMP组合使用可直接驱动扬声器

24

VPD

PWM 电源输入脚

 

6、芯片电气参数

Symbol

Parameter

Min

Max

Type

Uint

VCC

事情电压

1.8

5.5

3.3

V

Iop

无负载电流

--

--

7

mA

Ta

事情温度

-20

75

--

Io

输出电流

-16

16

--

mA

 

8、芯片功效详解

8.1 IO 口功效简介

1)RXD/TXD 标准串口通讯、波特率 9600,,,设置见下图

2)13脚为播放状态 BUSY 指示,,,播放时为 H,,,不播放时为 L

3)MIC  麦克风正极输入端,,,可接常用的麦克风型号

4)PWMP/PWMN pwm 输出、可直接驱动 0.5W/8Ω 或 1W/8Ω 扬声器

 

8.2 指令名堂

 

串口指令名堂接纳:起始码+参数+反码,,,设置如下表。。。。

起始码

参数

反码

AA/BB

见下文

见下文

注:①参数+反码 = FF,,,例如 TX 输出的指令 “AA 01 FE” ,,,起始码为 AA ,,,参数为 01 ,,,反码为 FE,,,01+FE=FF,其他数据依此类推

②TX 输出指令起始码为 AA(见表 4),,,RX 输入指令起始码为 BB(见表5)

 

8.3 词条相关简介

MX9016B语音识别模????榭梢允迪掷慰看驶,,,非特定人的语音识别。。。。

牢靠词汇并非指词条永远无法改变,,,而是用户不可以自行更改,,,但开发者可以凭证需求替换词条,,,之后将词条存储到 MX9016B-24QS 语音芯片里或是外挂的 SPI Flash 里,,,待识别时将会拿输入的语音与存储起来的词条语音作比照,,,若是两者相似度抵达标准就以为是输入的语音与存储中的词条一致,,,即识别乐成。。。。

8.3.1 词条的存储容量

存储词条的地方有两处:语音芯片的内部、SPI Flash;两者自己的容量差别,,,所能存储的词条数目自然也差别。。。。下面举行四字词条(即是每个词条四个字)的存储容量的比照

 

存储位置

存储词条数目

MX9016B-24S 语音芯片

12 条

SPI Flash

凭证 Flash 自身容量决议

 

虽说 MX9016B-24QS 语音芯片内部可以存储 12 条左右的词条,,,可是存储的数目越多,,,运算的速率越低,,,识别的效果也会相对的差一点。。。。

8.3.2 词条的存储方式

 

词条的存储方式主要有两种:

①一组存储

在词条的数目较少,,,并且都是统一类型,,,如都是体现颜色的词条,,,那可以选择放在统一组中,,,不必举行切换,,,更省时间。。。。

②分组存储

若是词条的数目多,,,并且分类纷歧样,,,那可以选择分组存储,,,例如现在有三组差别类型的词条,,,划分是故事类,,,古诗类以及音乐类

故事类

古诗类

音乐类

 拔苗助长

望天门山

爱我中华

后羿射日

游山西村

绚烂岁月

亡羊补牢

使至塞上

良久不见

守株待兔

过零丁洋

心如刀割

将词条分组存储,,,待需要举行古诗类词条时,,,则需先进入古诗类词组,,,那么我们需要一个入口。。。。

 

8.3.3 词条的识别历程

词条的识别历程现实就是波形的识别。。。。现实上,,,声音会爆发波形,,,可见如下声音波形图。。。。无论是人声,,,照旧风扇的声音,,,都有波形,,,可是差别的人说统一句话,,,声音的波形都会有一点点的差别,,,就算是统一个人说统一句话,,,声音的波形也会有差别,,,由于音调,,,语速等等都可能爆发细小的转变,,,从而影响声音波形。。。。

因此,,,在设计的历程中,,,会设置一个门槛,,,若输入语音的波形与存储好的词条波形相似度高于这个门槛,,,则识别乐成。。。。而这个门槛的崎岖可以改动的(用户无法更改),,,门槛调高了,,,即相似度要更高,,,会更难识别,,,识别率降低;;;;;;若门槛调低了,,,更容易识别,,,识别率增添,,,可是这也带来了一个问题-----误识别。。。。

在吵杂的情形中,,,多种声音的波形叠加在一起,,,恰恰与存储中的某一个词条的波形相似度凌驾门槛值,,,那么就会以为是存储中的词条,,,从而语音识别乐成,,,这就引起了误识别,,,若设置的门槛越低,,,误识别率就越高。。。。

以是说,,,识别率和误识别率是一致的,,,识别率升高,,,误识别率也会升高,,,这就需要凭证场合,,,凭证需求来设计识别率。。。。虽然,,,减低误识别率是有步伐的,,,如在不需要识别的时间,,,让模????榇τ谛菝咦刺,,,既可以省电,,,又可以降低误识别率。。。。

8.3.4 词条的设计

 

识别率,,,除了与识别的门槛有关,,,还与词条的是非等有关,,,其关系见表 6。。。。

 

词条与识别效果表

词条

识别效果

太短了,,,欠好识别

开灯

识别效果一般

关灯

与其他词条相似,,,识别效果一般

小智,,,开灯

长度适中、相似度低,,,识别效果佳

我困了,,,请关灯

长度适中、相似度低,,,识别效果佳

因此,,,在替换词条时,,,应思量词条的长度,,,各个词条间的相识度,,,只管做到长度适中、相似度低。。。。

 

由于页面限制,,,完整内容请点击文章右上下载按钮下载文件审查……

用手机扫描二维码关闭
二维码
【网站地图】
MX9016B-24QS语音识别芯片使用说明书V1.02_广