[发明专利]基于图扩展结构的词义消歧方法、装置、设备及介质在审
申请号: | 202110602047.5 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113204962A | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 倪子凡;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/30 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 涂年影 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 扩展 结构 词义 方法 装置 设备 介质 | ||
1.一种基于图扩展结构的词义消歧方法,其特征在于,所述基于图扩展结构的词义消歧方法包括:
响应于词义消歧指令,根据所述词义消歧指令获取目标词,及获取所述目标词所属的初始图谱;
创建窗口,并根据创建的窗口提取所述初始图谱中所述目标词所对应的节点的候选节点;
连接每两个候选节点作为一条边,并根据得到的边及所述候选节点构建候选图谱;
计算每条边所对应的两个候选节点间的文本相似度,及计算每条边所对应的两个候选节点间的词义相似度;
根据每条边所对应的两个候选节点间的文本相似度及每条边所对应的两个候选节点间的词义相似度计算每条边的权重;
根据每条边的权重确定每个候选节点的重要度;
根据每个候选节点的重要度对所述候选图谱进行去干扰处理,得到目标图谱;
对所述目标图谱进行中心度量,得到所述目标词的目标词义。
2.如权利要求1所述的基于图扩展结构的词义消歧方法,其特征在于,所述根据所述词义消歧指令获取目标词,及获取所述目标词所属的初始图谱包括:
解析所述词义消歧指令,得到所述词义消歧指令所携带的信息,所述词义消歧指令所携带的信息中包括词及地址;
获取与所述词对应的第一预设标签,及获取与所述地址对应的第二预设标签;
根据所述第一预设标签建立第一正则表达式,及根据所述第二预设标签建立第二正则表达式;
利用所述第一正则表达式遍历所述词义消歧指令所携带的信息,并将遍历到的与所述第一正则表达式相匹配的信息确定为所述目标词;
利用所述第二正则表达式遍历所述词义消歧指令所携带的信息,并将遍历到的与所述第二正则表达式相匹配的信息确定为目标地址;
连接至所述目标地址,并将所述目标地址处存储的具有所述目标词的图谱确定为所述初始图谱。
3.如权利要求1所述的基于图扩展结构的词义消歧方法,其特征在于,所述创建窗口,并根据创建的窗口提取所述初始图谱中所述目标词所对应的节点的候选节点包括:
创建预设数量的窗口,并随机初始化每个窗口的尺度;
将所述目标词所对应的节点确定为起点,并根据每个窗口的尺度,在所述初始图谱中利用每个窗口进行扩展,得到所述预设数量的扩展节点集合;
对所述扩展节点集合进行并集处理,得到所述目标词所对应的节点的候选节点。
4.如权利要求1所述的基于图扩展结构的词义消歧方法,其特征在于,所述计算每条边所对应的两个候选节点间的词义相似度包括:
将每条边所对应的两个候选节点确定为节点组合;
计算每条边所对应的两个候选节点中每个点的概念概率,及计算对应的节点组合的概念概率;
计算每条边所对应的两个候选节点中每个点的概念概率的负对数作为每个点的信息内容,及计算对应的节点组合的概念概率的负对数作为所述对应的节点组合的信息内容;
计算每条边所对应的两个候选节点中每个点的信息内容的和作为每条边的第一数值,及计算对应的节点组合的信息内容与预设值的乘积作为每条边的第二数值;
计算每条边的第一数值与每条边的第二数值的差值作为每条边的第三数值;
将每条边的第三数值的倒数确定为每条边所对应的两个候选节点间的词义相似度。
5.如权利要求1所述的基于图扩展结构的词义消歧方法,其特征在于,所述根据每条边所对应的两个候选节点间的文本相似度及每条边所对应的两个候选节点间的词义相似度计算每条边的权重包括:
计算每条边所对应的两个候选节点间的文本相似度与每条边所对应的两个候选节点间的词义相似度的和作为每条边的相似度值;
对每条边的相似度值进行标准化处理,得到每条边的权重。
6.如权利要求1所述的基于图扩展结构的词义消歧方法,其特征在于,所述根据每个候选节点的重要度对所述候选图谱进行去干扰处理,得到目标图谱包括:
比较每个候选节点的重要度与配置重要度的大小;
当检测到有候选节点的重要度小于所述配置重要度时,将检测到的候选节点确定为干扰节点;
从所述候选图谱中删除所述干扰节点,及删除所述干扰节点对应的边,得到所述目标图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110602047.5/1.html,转载请声明来源钻瓜专利网。