[发明专利]零指代位置检测方法、装置、设备及计算机可读存储介质有效
申请号: | 202010110444.6 | 申请日: | 2020-02-21 |
公开(公告)号: | CN111414758B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 楼星雨;许开河;王少军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/295;G06F16/35;G06N3/0455;G06N3/047 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 徐进之 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 指代 位置 检测 方法 装置 设备 计算机 可读 存储 介质 | ||
本发明涉及自然语言处理技术领域,公开了一种零指代位置检测方法及装置、设备和计算机可读存储介质,该方法包括:将输入的文本和需进行零指代位置检测的待检测语句进行拼接,以获取目标文本,并根据预设形式对目标文本中的字和特征进行表征,以获取各表征矩阵;将各表征矩阵分别嵌入到低维稠密表征矩阵中,并对已迁入表征矩阵的低维稠密表征矩阵进行相加,以获取各目标稠密表征矩阵;将各目标稠密表征矩阵依次输入到语言表征模型进行模型训练,以获取各所述字对应的字向量;将各所述字向量输入到CRF中进行预测,并根据预测结果确定所述待检测语句的零指代位置。解决了现有技术中进行零指代位置检测时,识别精度低的技术问题。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种零指代位置检测方法、装置、设备及计算机可读存储介质。
背景技术
目前,指代消解是自然语言领域中研究时间最长且应用场景十分广阔的任务之一。并且指代消解包括零指代消解和共至消解两部分,而零指代位置检测是零指代消解中的重要组成部分。零指代位置检测就是找到在前文中具有回指项的零指代项的位置。目前传统的零指代位置检测方法一般分为两步,即抽取和分类。抽取指的是识别出零指项的位置,这一步的传统做法都是通过复杂的规则来实现的。分类指的是在抽取结果的基础上,判断零指项是否具有前文回指项,这一步的传统做法是利用复杂,稀疏且少量的人造特征来构建二元分类器来实现的。也就是传统的零指代位置检测方法具有误差传播,特征稀疏,特征不准确,规则不精确等问题,从而导致采用传统方法进行零指代位置检测,其识别精度很低。
发明内容
本发明的主要目的在于提供一种零指代位置检测方法、装置、设备和计算机存储介质,旨在解决现有技术中进行零指代位置检测时,识别精度低的技术问题。
为实现上述目的,本发明提供一种零指代位置检测方法,所述零指代位置检测方法包括:
将输入的文本和需进行零指代位置检测的待检测语句进行拼接,以获取目标文本,并根据预设形式对所述目标文本中的字和特征进行表征,以获取各表征矩阵;
将各所述表征矩阵分别嵌入到低维稠密表征矩阵中,并对已迁入所述表征矩阵的低维稠密表征矩阵进行相加,以获取各目标稠密表征矩阵;
将各所述目标稠密表征矩阵依次输入到语言表征模型进行模型训练,以获取各所述字对应的字向量;
将各所述字向量输入到条件随机场CRF中进行预测,并根据预测结果确定所述待检测语句的零指代位置。
可选地,所述将各所述字向量输入到条件随机场CRF中进行预测,并根据预测结果确定所述待检测语句的零指代位置的步骤,包括:
将各所述字向量输入到CRF中进行预测,并在各所述字向量中将预测结果为是的目标向量筛选出来,确定各所述目标向量对应的字,并将各所述目标向量对应的字的前一个位置作为零指代位置。
可选地,所述将各所述字向量输入到条件随机场CRF中进行预测,并根据预测结果确定所述待检测语句的零指代位置的步骤,包括:
将各所述字向量输入到CRF中进行预测,并在各所述字向量中将预测结果为是的目标向量筛选出来,确定各所述目标向量对应的字,并将各所述目标向量对应的字的后一个位置作为零指代位置。
可选地,所述将各所述字向量输入到条件随机场CRF中进行预测,并根据预测结果确定所述待检测语句的零指代位置的步骤之后,包括:
将各所述零指代位置作为消解任务,并将所述消解任务输入到消解模型中进行模型训练,基于训练结果获取与所述零指代位置对应的具体回指项。
可选地,所述根据预设形式对所述目标文本中的字和特征进行表征,以获取各表征矩阵的步骤,包括:
依次遍历所述目标文本中的字,并根据预设形式对所述目标文本中当前遍历的字进行表征,以获取高维离散字表征矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010110444.6/2.html,转载请声明来源钻瓜专利网。