[发明专利]一种语音识别方法及系统有效
申请号: | 202010273597.2 | 申请日: | 2020-04-09 |
公开(公告)号: | CN111429886B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 许阿义;游水;庄少波 | 申请(专利权)人: | 厦门钛尚人工智能科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/08;G10L15/10 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 乐珠秀 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 系统 | ||
1.一种语音识别方法,其特征在于,所述方法包括以下步骤:
S1,建立数据库,归纳与用户相关的文字数据,以形成用户词典;
S2,通过规则方法识别用户的意图,并将其收集;
S3,根据步骤S2中所识别出的意图,使用模糊匹配方法,检测出目标实体的特定值是否在用户的语句中出现,其中,目标实体为数据库中的命名实体信息;
步骤S3中的检测方法是基于拼音的模糊检测方法,其方法包括以下检测步骤:
S301,生成汉语模糊发音规则,并定义不同发音之间的编辑距离;
S302,使用动态规划算法,检测词典中所有词在用户语句中的匹配情况;
S303,记录编辑距离最小的词典中的词作为候选词;
S304,计算匹配系数,若匹配系数达标,则检测成功,输出识别结果;
步骤S2中的规则方法包括基于规则的自动分类,其中,每个类目确定分类规则而形成类别模板,规则分类器根据测试样本中的规则测试信息及位置信息来衡量测试样本的所属类别,其中,每条规则包含多个项,规则包括“与”、“或”、“非”、“异或”逻辑运算。
2.根据权利要求1所述的语音识别方法,其特征在于,所述逻辑运算的运算顺序降序依次为“括号”、“等于”、“与”、“异或”、“非”、“或”。
3.根据权利要求1或2所述的语音识别方法,其特征在于,步骤S303中的编辑距离计算方法包括:发音相似的声母或韵母之间差异小于1;若同一音节的声母和韵母同时发生改变,则在计算编辑距离时给予一个正的惩罚值;音调变化导致的差异小于1。
4.一种语音识别系统,其特征在于,所述系统包括数据库、识别模块、检测模块:
数据库与识别模块、检测模块互通,其用于归纳与用户相关的文字数据,并生成与用户数据对应的词典;
识别模块用于收集用户意图,包括通过规则方法识别用户的意图,并将其收集;规则方法包括基于规则的自动分类,其中,每个类目确定分类规则而形成类别模板,规则分类器根据测试样本中的规则测试信息及位置信息来衡量测试样本的所属类别,其中,每条规则包含多个项,规则包括“与”、“或”、“非”、“异或”逻辑运算;
检测模块用于命名实体模糊检测,其中,目标实体为数据库中的命名实体信息;检测方法是基于拼音的模糊检测方法,其方法包括以下检测步骤:
S301,生成汉语模糊发音规则,并定义不同发音之间的编辑距离;
S302,使用动态规划算法,检测词典中所有词在用户语句中的匹配情况;
S303,记录编辑距离最小的词典中的词作为候选词;
S304,计算匹配系数,若匹配系数达标,则检测成功,输出识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门钛尚人工智能科技有限公司,未经厦门钛尚人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010273597.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种舰船自动力多途径加速装置
- 下一篇:一种陶瓷生产用的釉烧辊道窑