[发明专利]一种用户语料语义理解的方法及系统在审
申请号: | 201910046978.4 | 申请日: | 2019-01-18 |
公开(公告)号: | CN109766453A | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 魏誉荧 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F17/27 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 郭桂峰 |
地址: | 523851 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语料 语义槽 词性标注 图谱 词语 正则表达式 句法标注 连接关系 用户语义 语义理解 关联词 解析 样本 语料样本 匹配 抽取 | ||
本发明提供了一种用户语料语义理解的方法及系统,其方法包括:建立知识图谱;获取语料样本;对所述语料样本进行词性标注和句法标注;根据所述词性标注和所述句法标注抽取所述语料样本中的主体词语和关联词;根据所述词性标注和所述主体词语生成语义槽;将所述主体词语和所述知识图谱进行匹配,得到所述语义槽之间的连接关系;根据所述语义槽、所述连接关系以及所述关联词生成正则表达式;获取用户语料;将所述用户语料和所述语义槽、所述正则表达式对比,解析得到对应的用户语义。本发明基于知识图谱对获取的用户语料进行解析,从而得到对应的用户语义。
技术领域
本发明涉及语言处理技术领域,尤指一种用户语料语义理解的方法及系统。
背景技术
当前随着网络的飞速发展,智能处理信息也是越来越普遍。计算机、智能设备等每天可能需要处理成千上万的信息。智能设备一般通过分析语料得到对应的正则表达式,从而解析语料。
但是,在语义解析中,根据当前分词技术,会抽取出多个相互独立的词语,词语与词语之间的逻辑关系无法判断,会导致语义解析逻辑混乱,无法正确解析用户语料的语义。
因此,有必要通过一种用户语料语义理解的方法及系统解析用户语料从而得到最有可能的对应的用户语义。
发明内容
本发明的目的是提供一种用户语料语义理解的方法及系统,实现基于知识图谱对获取的用户语料进行解析,从而得到对应的用户语义。
本发明提供的技术方案如下:
本发明提供一种用户语料语义理解的方法,包括:
建立知识图谱;
获取语料样本;
对所述语料样本进行词性标注和句法标注;
根据所述词性标注和所述句法标注抽取所述语料样本中的主体词语和关联词;
根据所述词性标注和所述主体词语生成语义槽;
将所述主体词语和所述知识图谱进行匹配,得到所述语义槽之间的连接关系;
根据所述语义槽、所述连接关系以及所述关联词生成正则表达式;
获取用户语料;
将所述用户语料和所述语义槽、所述正则表达式对比,解析得到对应的用户语义。
进一步的,所述的建立知识图谱具体包括:
获取知识点以及所述知识点对应的关联关系;
根据所述知识点和所述层级关系建立所述知识图谱。
进一步的,所述的将所述主体词语和所述知识图谱进行匹配,得到所述语义槽之间的连接关系具体包括:
将所述主体词语和所述知识图谱进行匹配,得到所述主体词语对应的语料知识点和语料层级关系;
根据所述语料知识点和所述语料层级关系得到所述语义槽之间的连接关系。
进一步的,所述的根据所述语义槽、所述连接关系以及所述关联词生成正则表达式具体包括包括:
根据所述语义槽、所述连接关系以及所述关联词生成多个句式不同但语义相同的正则表达式;
根据所述多个正则表达式得到所述语义槽之间的逻辑关系。
进一步的,所述的将所述用户语料和所述语义槽、所述正则表达式对比,解析得到对应的用户语义具体包括:
通过分词技术对所述用户语料进行分词,得到对应的用户分词以及分词词性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910046978.4/2.html,转载请声明来源钻瓜专利网。