[发明专利]一种基于电力领域本体知识的语音识别系统在审
申请号: | 202211606185.1 | 申请日: | 2022-12-12 |
公开(公告)号: | CN116013291A | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 农惠清;王凯;申双喜;杨倩;黄蔚;吴婷;袁小惠;宁立声;江洁;谢佩;吴伟伟;郑毅;李金灿;陶镇威;李娟娟 | 申请(专利权)人: | 广西电网有限责任公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G06F16/332;G06F16/31;G06N20/00;G10L15/02;G10L15/06;G10L25/51 |
代理公司: | 贵州派腾知识产权代理有限公司 52114 | 代理人: | 唐斌 |
地址: | 530023 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 电力 领域 本体 知识 语音 识别 系统 | ||
1.一种基于电力领域本体知识的语音识别系统,其特征在于,包括:
语音采集模块:用于采集来自用户端的音频数据,对所述音频数据进行校验、矫正,输出待识别音频数据;
电力领域本体知识仓库:用于提供电力领域专有词汇信息,所述专有词汇内容包括特征单字、特征短词、特征长词、常用词;所述专有词汇信息的属性包括:文本特征、需求特征;所述专有词汇信息通过专有词汇特征关联模型存储内容和属性,并建立相互关联;
语音识别模块:用于获取所述待识别音频数据,通过语音识别纠错模型进行语音识别处理,输出识别结果,并优化语音识别纠错模型;
识别结果校验模块:用于结合所述电力领域本体知识仓库,校验所述识别结果是否符合电力领域应用要求,输出校验结果,所述校验结果包括样本补充训练请求;
电力领域应用模块:用于根据识别结果,实现用户需求,获取用户需求处理结果;
训练集补充模块:获取补充训练请求,进行训练集补充处理。
2.根据权利要求1所述的语音识别系统,其特征在于,所述语音识别模块采用Baum-Welch算法进行语音识别纠错模型改进,采用音素评分子模块生成音素评分结果,作为纠错判断标准。
3.根据权利要求2所述的语音识别系统,其特征在于,所述语音识别模块通过所述音素评分结果,比较所述待识别音频数据的语音和标准语音的差异程度,用于计算整句识别的准确概率值。
4.根据权利要求1所述的语音识别系统,其特征在于,所述语音采集模块采用MFCC特征从音频数据提取用户语音特征,设置三角滤波器对音频信号幅度加权运算,生成待识别音频数据。
5.根据权利要求1所述的语音识别系统,其特征在于,所述识别校验模块根据所述专有词汇特征关联模型进行校验的顺序为:整句校验、长词校验、短词校验、单字校验。
6.根据权利要求1所述的语音识别系统,其特征在于,所述训练集补充模块获取来自识别校验模块的样本补充训练请求,生成训练集,向语音识别模块发送语音识别训练样本。
7.根据权利要求6所述的语音识别系统,其特征在于,所述训练集补充模块还获取来自电力领域应用模块发送的补充训练请求;
所述电力领域应用模块根据所述用户需求处理结果判断所述识别结果是否与电力领域应用匹配,如果不匹配,生成所述补充训练请求。
8.根据权利要求1所述的语音识别系统,其特征在于,所述专有词汇特征关联模型支持的专有词汇内容还包括:连接词、常用词。
9.根据权利要求9所述的语音识别系统,其特征在于,所述专有词汇特征关联模型支持的专有词汇关联方式包括:字词延伸关系、词义延伸关系、语法延伸关系。
10.根据权利要求9所述的语音识别系统,其特征在于,所述专有词汇特征关联模型还支持自定义词汇关联方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西电网有限责任公司,未经广西电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211606185.1/1.html,转载请声明来源钻瓜专利网。