[发明专利]一种用户语料语义理解的方法及系统在审
申请号: | 201910046978.4 | 申请日: | 2019-01-18 |
公开(公告)号: | CN109766453A | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 魏誉荧 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F17/27 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 郭桂峰 |
地址: | 523851 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语料 语义槽 词性标注 图谱 词语 正则表达式 句法标注 连接关系 用户语义 语义理解 关联词 解析 样本 语料样本 匹配 抽取 | ||
1.一种用户语料语义理解的方法,其特征在于,包括:
建立知识图谱;
获取语料样本;
对所述语料样本进行词性标注和句法标注;
根据所述词性标注和所述句法标注抽取所述语料样本中的主体词语和关联词;
根据所述词性标注和所述主体词语生成语义槽;
将所述主体词语和所述知识图谱进行匹配,得到所述语义槽之间的连接关系;
根据所述语义槽、所述连接关系以及所述关联词生成正则表达式;
获取用户语料;
将所述用户语料和所述语义槽、所述正则表达式对比,解析得到对应的用户语义。
2.根据权利要求1所述的用户语料语义理解的方法,其特征在于,所述的建立知识图谱具体包括:
获取知识点以及所述知识点对应的关联关系;
根据所述知识点和所述层级关系建立所述知识图谱。
3.根据权利要求2所述的用户语料语义理解的方法,其特征在于,所述的将所述主体词语和所述知识图谱进行匹配,得到所述语义槽之间的连接关系具体包括:
将所述主体词语和所述知识图谱进行匹配,得到所述主体词语对应的语料知识点和语料层级关系;
根据所述语料知识点和所述语料层级关系得到所述语义槽之间的连接关系。
4.根据权利要求1所述的用户语料语义理解的方法,其特征在于,所述的根据所述语义槽、所述连接关系以及所述关联词生成正则表达式具体包括包括:
根据所述语义槽、所述连接关系以及所述关联词生成多个句式不同但语义相同的正则表达式;
根据所述多个正则表达式得到所述语义槽之间的逻辑关系。
5.根据权利要求4所述的用户语料语义理解的方法,其特征在于,所述的将所述用户语料和所述语义槽、所述正则表达式对比,解析得到对应的用户语义具体包括:
通过分词技术对所述用户语料进行分词,得到对应的用户分词以及分词词性;
结合所述用户分词以及所述分词词性,和所述语义槽进行对比,得到所述用户分词之间的分词连接关系;
结合所述用户分词以及所述分词词性生成对应的用户正则式,将所述用户正则式和所述正则表达式进行对比,得到所述用户分词之间的分词逻辑关系;
根据所述用户分词、所述分词词性、所述分词连接关系以及所述分词逻辑关系解析所述用户语料得到对应的所述用户语义。
6.一种用户语料语义理解的系统,其特征在于,包括:
图谱建立模块,建立知识图谱;
样本获取模块,获取语料样本;
标注模块,对所述样本获取模块获取的所述语料样本进行词性标注和句法标注;
抽取模块,根据所述标注模块标注的所述词性标注和所述句法标注抽取所述语料样本中的主体词语和关联词;
语义槽生成模块,根据所述标注模块标注的所述词性标注和所述抽取模块得到的所述主体词语生成语义槽;
匹配模块,将所述抽取模块得到的所述主体词语和所述图谱建立模块建立的所述知识图谱进行匹配,得到所述语义槽之间的连接关系;
正则式生成模块,根据所述语义槽生成模块生成的所述语义槽、所述匹配模块得到的所述连接关系以及所述抽取模块得到的所述关联词生成正则表达式;
语料获取模块,获取用户语料;
解析模块,将所述语料获取模块获取的所述用户语料和所述语义槽生成模块生成的所述语义槽、所述正则式生成模块生成的所述正则表达式对比,解析得到对应的用户语义。
7.根据权利要求6所述的用户语料语义理解的系统,其特征在于,所述图谱建立模块具体包括:
获取单元,获取知识点以及所述知识点对应的关联关系;
图谱建立单元,根据所述获取单元获取的所述知识点和所述层级关系建立所述知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910046978.4/1.html,转载请声明来源钻瓜专利网。