[发明专利]一种语音识别方法及系统有效
申请号: | 202010273597.2 | 申请日: | 2020-04-09 |
公开(公告)号: | CN111429886B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 许阿义;游水;庄少波 | 申请(专利权)人: | 厦门钛尚人工智能科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/08;G10L15/10 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 乐珠秀 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 系统 | ||
本申请公开了一种语音识别方法及系统,其方法包括S1,建立数据库,归纳与用户相关的文字数据,以形成用户词典;S2,通过规则方法或学习模型识别用户的意图,并将其收集;S3,根据步骤S2中所识别出的意图,使用模糊匹配方法,检测出目标实体的特定值是否在用户的语句中出现,其中,目标实体为数据库中的命名实体信息,其系统包括相互连通的数据库、识别模块和检测模块。本申请提高了语音识别的准确性及工作效率,增强了实用性。
技术领域
本申请涉及语音识别和自然语言处理领域,具体而言,涉及一种语音识别方法及系统。
背景技术
语音识别技术作为智能识别领域的重要研究领域,已经有60多年的发展历史。语音识别是将声音识别成文字的过程,中文语音识别是根据说话人的发音将语音转换成中文文字。但是由于个人发音差异,不规范的中文拼音发音会造成语音识别的正确率大大降低,如果能够智能的对语音识别后的中文文本进行分析,查找出错词并进行纠正,必将极大地提高语音识别精确程度。
随着技术的发展,语音识别的精度和速度都取得了长足的进步。在安静环境、标准口音和常见词汇场景下,语音识别的准确率已经达到了与人类相近的水平。但如果说话者发音不标准,并且对话中包含专有名词,如特定的人名、地名、机构名等,则识别的准确率会大大降低。在现有的语音识别技术当中,一般通过对识别的词句文字进行筛选匹配,其中出现了以下问题:1)中文输入法带来的同音字替换或由个人习惯带来的近音字替换,中文用户大部分使用中文输入法,而在使用中文输入法时很容易造成一些同音不同字的错误,或是由于地域问题对同一个词会有不同的表达方式;2)文字使用更加简洁,出现很多组合词,但是在信息检索时我们并不能穷举出所有的词,这使得对信息进行筛选与匹配变得比以前更加困难。针对上述问题,现有技术中出现了编辑距离技术,编辑距离是俄罗斯科学家Vladimir Levenshtein在1965年提出的一个概念,所以又称为Levenshtein距离。最经典的编辑距离定义为:两个字符串之间,由一个转换成另外一个所需要的最少的操作次数。在Levenshtein的定义体系中有三种原子操作包括:替换、插入、删除等。
对于编辑距离,现有技术中公开了专利号为CN106168954B的发明专利一种基于编辑距离的负面信息模式模糊匹配方法,该发明通过基于汉字的编辑距离计算方法计算两个字符串的汉字距离;通过基于拼音的编辑距离计算方法计算两个相应字符串的拼音字符串间的拼音距离;采用将汉字距离与拼音距离相结合的模式模糊匹配方法,来进行负面信息检测,在模式匹配的过程中先计算推文中所有的词语与Trigger(触发词)类关键词的距离,当值小于设定的编辑距离阈值时再与Entity(实体词)类关键词进行匹配,进而有效的提高模式匹配的查全率。但是,由于大部分语音识别的错误,都表现为同音字或近音字的替换误用,如果把拼音串简单地看作广义的英文字母串,则替换、插入或删除一个字母,得到的结果并不一定是合法的拼音串,进而造成语音识别出现识别错误,以对使用者的工作造成影响。
综上所述,本领域亟待一种基于拼音模糊匹配的语音识别方法。
发明内容
本申请的主要目的在于提供一种语音识别方法及系统,提高了语音识别的准确性及工作效率,增强了实用性。
本发明实施例的技术方案是这样实现的:
一种语音识别方法,所述方法包括以下步骤:
S1,建立数据库,归纳与用户相关的文字数据,以形成用户词典;
S2,通过规则方法或学习模型识别用户的意图,并将其收集;
S3,根据步骤S2中所识别出的意图,使用模糊匹配方法,检测出目标实体的特定值是否在用户的语句中出现,其中,目标实体为数据库中的命名实体信息。
同时本发明实施例还提供一种配置软件静态数据的处理系统,包括:
数据库、识别模块、检测模块:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门钛尚人工智能科技有限公司,未经厦门钛尚人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010273597.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种舰船自动力多途径加速装置
- 下一篇:一种陶瓷生产用的釉烧辊道窑