[发明专利]指代消解方法、电子装置及计算机可读存储介质有效
申请号: | 201811168621.5 | 申请日: | 2018-10-08 |
公开(公告)号: | CN109446517B | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 赵峰;杜展;王健宗;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/253 | 分类号: | G06F40/253;G06F40/295 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 张超艳;陈英俊 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及大数据分析,提供一种指代消解方法,包括:对文本进行分词得到指代集合及候选先行集合;根据特征指标构建指代词和候选先行词之间的特征向量;模拟指代词、权重矩阵和候选先行集合子集的分类情况,将每种分类情况对应的特征向量输入分类模型,得到每个指代词对应的权重矩阵和候选先行词子集;采用排序模型对候选先行词子集中各候选先行词按照设定规则进行排序,得到每个指代词对应的先行词和权重;在聚类决策中考虑排序模型权重对指代同一先行词的不同指代词进行聚类,得到指代簇。本发明还提出了一种电子装置及计算机可读存储介质。本发明通过模型套叠引入一个能够结合指代对信息和实体层面信息的指代消解,提高了识别的正确率。 | ||
搜索关键词: | 指代 消解 方法 电子 装置 计算机 可读 存储 介质 | ||
【主权项】:
1.一种指代消解方法,应用于电子装置,其特征在于,所述方法包括:对文本进行分词,得到指代集合及候选先行集合;根据特征指标构建每个指代词和每个候选先行词之间的特征向量,所述特征指标包括距离特征、语法特征、语义特征和基于规则特征中的一种或多种;模拟各指代词在各种权重矩阵下的指代各候选先行集合子集的分类情况,将每一种分类情况对应的特征向量输入分类模型,得到每个指代词对应的分类模型的权重矩阵和候选先行词子集;采用排序模型对每个指代词的上述候选先行词子集中各候选先行词按照设定规则进行排序,得到每个指代词对应的先行词和权重;在聚类模型聚类决策中考虑上述排序模型的权重对指代同一先行词的不同指代词进行聚类,得到指代簇。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811168621.5/,转载请声明来源钻瓜专利网。