[发明专利]零指代位置检测方法、装置、设备及计算机可读存储介质有效
申请号: | 202010110444.6 | 申请日: | 2020-02-21 |
公开(公告)号: | CN111414758B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 楼星雨;许开河;王少军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/295;G06F16/35;G06N3/0455;G06N3/047 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 徐进之 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 指代 位置 检测 方法 装置 设备 计算机 可读 存储 介质 | ||
1.一种零指代位置检测方法,其特征在于,所述零指代位置检测方法包括以下步骤:
将输入的文本和需进行零指代位置检测的待检测语句进行拼接,以获取目标文本,并根据预设形式对所述目标文本中的字和特征进行表征,以获取各表征矩阵;
将各所述表征矩阵分别嵌入到低维稠密表征矩阵中,并对已迁入所述表征矩阵的低维稠密表征矩阵进行相加,以获取各目标稠密表征矩阵;
将各所述目标稠密表征矩阵依次输入到语言表征模型进行模型训练,以获取各所述字对应的字向量;
将各所述字向量输入到条件随机场CRF中进行预测,并根据预测结果确定所述待检测语句的零指代位置。
2.如权利要求1所述的零指代位置检测方法,其特征在于,所述将各所述字向量输入到条件随机场CRF中进行预测,并根据预测结果确定所述待检测语句的零指代位置的步骤,包括:
将各所述字向量输入到CRF中进行预测,并在各所述字向量中将预测结果为是的目标向量筛选出来,确定各所述目标向量对应的字,并将各所述目标向量对应的字的前一个位置作为零指代位置。
3.如权利要求2所述的零指代位置检测方法,其特征在于,所述将各所述字向量输入到条件随机场CRF中进行预测,并根据预测结果确定所述待检测语句的零指代位置的步骤,包括:
将各所述字向量输入到CRF中进行预测,并在各所述字向量中将预测结果为是的目标向量筛选出来,确定各所述目标向量对应的字,并将各所述目标向量对应的字的后一个位置作为零指代位置。
4.如权利要求1所述的零指代位置检测方法,其特征在于,所述将各所述字向量输入到条件随机场CRF中进行预测,并根据预测结果确定所述待检测语句的零指代位置的步骤之后,包括:
将各所述零指代位置作为消解任务,并将所述消解任务输入到消解模型中进行模型训练,基于训练结果获取与所述零指代位置对应的具体回指项。
5.如权利要求1-4任一项所述的零指代位置检测方法,其特征在于,所述根据预设形式对所述目标文本中的字和特征进行表征,以获取各表征矩阵的步骤,包括:
依次遍历所述目标文本中的字,并根据预设形式对所述目标文本中当前遍历的字进行表征,以获取高维离散字表征矩阵;
确定所述当前遍历的字所在句子的特征,并根据预设形式对所述特征进行表征,以获取高维离散特征表征矩阵,并将所述高维离散字表征矩阵和所述高维离散特征表征矩阵作为表征矩阵,直至所述目标文本中的字遍历完成。
6.如权利要求5所述的零指代位置检测方法,其特征在于,所述特征包括位置特征和句子归属特征,
所述根据预设形式对所述句子的特征进行表征,以获取高维离散特征表征矩阵的步骤,包括:
根据预设形式对所述位置特征进行表征,以获取位置表征矩阵;
根据所述预设形式对所述句子归属特征进行表征,以获取句子归属表征矩阵,并将所述位置表征矩阵和句子归属表征矩阵作为高维离散特征表征矩阵。
7.如权利要求6所述的零指代位置检测方法,其特征在于,所述基于预设的低维稠密表征矩阵对各所述表征矩阵进行处理,以获取各目标稠密表征矩阵的步骤包括:
依次遍历各所述表征矩阵,并将当前遍历的表征矩阵中的高维离散字表征矩阵嵌入到预设的低维稠密表征矩阵,以获取第一表征矩阵;
将当前遍历的表征矩阵中的高维离散特征表征矩阵嵌入到预设的低维稠密表征矩阵,以获取第二表征矩阵;
将所述第一表征矩阵和所述第二表征矩阵进行相加处理,以获取目标稠密表征矩阵,直至各所述表征矩阵遍历完成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010110444.6/1.html,转载请声明来源钻瓜专利网。