智能家居入门DIY——【二、LD3320之语音识别】
前一篇说了一下只有RX,TX,VCC,GND的WIFI模块软串口通讯;在实现了远程观察数据,类似的就可以实现远程控制。接下来说一下近距离控制,很多情况下应用语音识别技术无疑比掏出手机操作要更人性化一些,当然有些情况是例外,例如半夜起床来,那么人体感应模块和光传感器结合就更人性化。LD3320模块本身识别准确率并不高,但是通过编写程序的一些技巧,可以提高这个准确度。不过这个模块接线的时候有一些小问题,我买的是很多教程上的那个长方形模块,头上有俩插孔,尾巴上面2排12个针那种。说一下怎么用起来:
一、接线
A、下排
CS是片选,很多教程讲接GND,如果有多个SPI设备,则需要接一个引脚。
P0-P2,接UNO11-13引脚。(通讯+时钟)。
同排的GND,3.3V接UNO的GND,和3.3输出。
B、上排
IRQ是中断,接PIN2
WR接GND
RST接PIN9
共9线完成。
二、程序
首先,感谢ld3320.h的原作者。
然后,说一下这个“垃圾关键词”:首先,明确的说,把垃圾关键词都认为是真垃圾的思路我不认同;让我说严重点这就是误导,是背道而驰,贵圈确实很乱。提出几点原因:
1、本身识别准确率并不高,假定为60%,并且要求发音清楚、连贯性适中。
2、“垃圾关键词”是接近正确命令的发音,其中有相当部分是用户正确发音但未正确识别,假定为30%。
如果,代码中让“垃圾关键词”并不“垃圾”,那么识别率就是60%+30%;换一种说法,垃圾关键词中即使有1%是正确发音但未被准确识别的,我们把它加上,也是提高1%的正确识别。那么,接下来的问题就是真的垃圾怎么办。
1、场景切换(口令模式),当15%的真垃圾进入下一个场景,接下来的语句仍然符合下一场景的关键词的几率是多少?
2、长口令,带称呼的口令更符合人们的习惯,所以开灯可以变成二狗子开灯……长口令的错误识别率无疑要低。
所以,我的程序中,数据结构和逻辑结构是这样的:
struct AsrCommand { char* flag; int ID; }; AsrCommand CallName[] = { { "da hei", 0 }, { "da ei", 0 }, { "da kei", 0 }, { "da bai", 1 }, { "da he", 1 } }; AsrCommand ExecuteCommand[] = { { "kai dian shi",0 }, { "ai dian shi",0 }, { "kai yan shi",0 }, { "ai yan shi",0 }, { "kai tian shi",0 }, { "ai tian shi",0 }, { "guan dian shi",1 }, { "kuan dian shi",1 }, { "guan yan shi",1 }, { "kuan yan shi",1 }, { "guan tian shi",1 }, { "kuan tian shi",1 } };
CallName中,编号为1的是真垃圾关键词,但是编号是0的部分里面包含了一部分假垃圾关键词,通过场景切换,使用ExecuteCommand中的关键词,两组都是命令,一组是开电视,一组是关电视。通过场景切换,第一组中的错误识别将被缩小。你可以尝试一下这个模式,它可以让你不必咬文嚼字的和机器对话而机器也会正确的响应你。识别率被提高,而不必非常担心:它会不会知道我说了什么?尽可能的不要让我们找方便的时候被搞得不痛快吧,那就不是用机器了,简直就是被机器用。