[发明专利]一种语义解析方法及系统有效
申请号: | 201910186089.8 | 申请日: | 2019-03-12 |
公开(公告)号: | CN109949799B | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 魏誉荧 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/10;G10L15/06;G06F40/289;G06F40/30;G06F40/211 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 郭桂峰 |
地址: | 523851 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语义 解析 方法 系统 | ||
1.一种语义解析方法,其特征在于,包括:
获取语料集,所述语料集包括多条语料;
在所述语料集中提取出句式结构清楚的语料;
根据所述提取出的语料生成一个或多个正则表达式;
将所述语料集中剩余的语料作为训练样本输入初始语义解析模型中进行训练,得到训练后的语义解析模型;
获取用户输入的语音信息;
计算所述语音信息与所述正则表达式的匹配度;
若所述语音信息与任一正则表达式的匹配度大于预设阈值,则通过匹配度大于所述预设阈值的正则表达式解析所述语音信息的语义;
若所述语音信息与所述正则表达式的匹配度小于所述预设阈值,则通过所述语义解析模型解析所述语音信息的语义。
2.根据权利要求1所述的一种语义解析方法,其特征在于,所述根据所述提取出的语料生成一个或多个正则表达式具体包括:
对所述提取出的语料进行分词;
标注分词后词语的词性,并获取分词后词语的词义;
对分词标注后的语料进行语法分析,得到每条语料的句式结构;
根据所述句式结构和所述词语的词义生成一个或多个正则表达式。
3.根据权利要求1所述的一种语义解析方法,其特征在于,所述根据所述提取出的语料生成一个或多个正则表达式之后,所述获取用户输入的语音信息之前还包括:
提取所述正则表达式中的语义槽;
建立与所述语义槽相匹配的词库。
4.根据权利要求3所述的一种语义解析方法,其特征在于,所述若所述语音信息与任一正则表达式的匹配度大于预设阈值,则通过匹配度大于所述预设阈值的正则表达式解析所述语音信息的语义具体包括:
在所述正则表达式中筛选出与所述语音信息的匹配度大于预设阈值的正则表达式;
在所述匹配度大于所述预设阈值的正则表达式中提取出匹配度最大的正则表达式作为目标正则表达式;
根据所述目标正则表达式和所述目标正则表达式中的语义槽的词库解析所述语音信息。
5.根据权利要求1-4任一项所述的一种语义解析方法,其特征在于,所述计算所述语音信息与所述正则表达式的匹配度具体包括:
将所述语音信息与当前正则表达式中的每个匹配项进行匹配;
统计相匹配的匹配项的数量;
将所述相匹配的匹配项的数量除以所述当前正则表达式中的匹配项的总数量得到所述匹配度。
6.一种语义解析系统,其特征在于,包括:
语料集获取模块,用于获取语料集,所述语料集包括多条语料;
语料提取模块,用于在所述语料集中提取出句式结构清楚的语料;
正则表达式生成模块,用于根据所述提取出的语料生成一个或多个正则表达式;
模型训练模块,用于将所述语料集中剩余的语料作为训练样本输入初始语义解析模型中进行训练,得到训练后的语义解析模型;
语音信息获取模块,用于获取用户输入的语音信息;
匹配度计算模块,用于计算所述语音信息与所述正则表达式的匹配度;
第一语义解析模块,用于若所述语音信息与任一正则表达式的匹配度大于预设阈值,则通过匹配度大于所述预设阈值的正则表达式解析所述语音信息的语义;
第二语义解析模块,用于若所述语音信息与所述正则表达式的匹配度小于所述预设阈值,则通过所述语义解析模型解析所述语音信息的语义。
7.根据权利要求6所述的一种语义解析系统,其特征在于,所述正则表达式生成模块包括:
分词单元,用于对所述提取出的语料进行分词;
词性标注单元,用于标注分词后词语的词性;
词义获取单元,用于获取分词后词语的词义;
语法分析单元,用于对分词标注后的语料进行语法分析,得到每条语料的句式结构;
正则表达式生成单元,用于根据所述句式结构和所述词语的词义生成一个或多个正则表达式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910186089.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于音频的广告检测方法以及装置
- 下一篇:语音打车方法及系统