[发明专利]一种语义解析方法及系统有效
申请号: | 201910186089.8 | 申请日: | 2019-03-12 |
公开(公告)号: | CN109949799B | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 魏誉荧 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/10;G10L15/06;G06F40/289;G06F40/30;G06F40/211 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 郭桂峰 |
地址: | 523851 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语义 解析 方法 系统 | ||
本发明属于语义识别领域,公开了一种语义解析方法及系统,其方法包括:获取语料集;在语料集中提取出句式结构清楚的语料;根据提取出的语料生成正则表达式;将剩余的语料作为训练样本进行训练,得到语义解析模型;获取用户输入的语音信息;计算语音信息与正则表达式的匹配度;若语音信息与任一正则表达式的匹配度大于预设阈值,通过匹配度大于预设阈值的正则表达式解析语音信息的语义;若匹配度小于预设阈值,则通过语义解析模型解析语音信息的语义。本发明当用户语句清楚时通过正则表达式进行语义解析,可提高语义解析的速率;当用户语句无法用正则表达式进行解析时,通过语义解析模型进行语义解析,以提高语义解析成功率,降低误解析的情况。
技术领域
本发明属于语义识别技术领域,特别涉及一种语义解析方法及系统。
背景技术
随着智能终端及网络技术的迅速发展,人们越来越习惯地使用智能终端完成各种需求,如在学习的过程中,碰到不理解的知识点、不会解的习题时,在智能学习设备中语音输入相关知识点,搜索对应的答案和知识讲解,以便对用户进行学习辅导。
目前,在人机交互场景中,准确理解语义是做出正确应答的基础。但是,由于小学生在讲话过程中,经常会语言顺序和逻辑颠倒错乱,部分容易获得特定特征的语句容易解析,而部分不能获取到其特定特征的语句则容易导致语义解析失败,使得用户的体验感较差,不利于产品的推广和使用。
发明内容
本发明的目的是提供一种语义解析方法及系统,当用户语句清楚时可通过正则表达式进行语义解析,提高语义解析速率,当用户语句不清楚无法通过正则表达式进行语义解析时,可通过训练得到的模型进行语义解析,提高语义解析成功率,降低误解析的情况。
本发明提供的技术方案如下:
一方面,提供一种语义解析方法,包括:
获取语料集,所述语料集包括多条语料;
在所述语料集中提取出句式结构清楚的语料;
根据所述提取出的语料生成一个或多个正则表达式;
将所述语料集中剩余的语料作为训练样本输入初始语义解析模型中进行训练,得到训练后的语义解析模型;
获取用户输入的语音信息;
计算所述语音信息与所述正则表达式的匹配度;
若所述语音信息与任一正则表达式的匹配度大于预设阈值,则通过匹配度大于所述预设阈值的正则表达式解析所述语音信息的语义;
若所述语音信息与所述正则表达式的匹配度小于所述预设阈值,则通过所述语义解析模型解析所述语音信息的语义。
进一步优选地,所述根据所述提取出的语料生成一个或多个正则表达式具体包括:
对所述提取出的语料进行分词;
标注分词后词语的词性,并获取分词后词语的词义;
对分词标注后的语料进行语法分析,得到每条语料的句式结构;
根据所述句式结构和所述词语的词义生成一个或多个正则表达式。
进一步优选地,所述根据所述提取出的语料生成一个或多个正则表达式之后,所述获取用户输入的语音信息之前还包括:
提取所述正则表达式中的语义槽;
建立与所述语义槽相匹配的词库。
进一步优选地,所述若所述语音信息与任一正则表达式的匹配度大于预设阈值,则通过匹配度大于所述预设阈值的正则表达式解析所述语音信息的语义具体包括:
在所述正则表达式中筛选出与所述语音信息的匹配度大于预设阈值的正则表达式;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910186089.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于音频的广告检测方法以及装置
- 下一篇:语音打车方法及系统