[发明专利]基于query分析的图谱优化方法、装置、设备及介质有效

专利信息
申请号: 202110688454.2 申请日: 2021-06-22
公开(公告)号: CN113254671B 公开(公告)日: 2021-09-28
发明(设计)人: 陈宇 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06F16/36 分类号: G06F16/36;G06F16/28;G06F16/35;G06F40/295;G06N3/04;G06N5/02
代理公司: 深圳市精英专利事务所 44242 代理人: 李翔宇
地址: 518000 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 query 分析 图谱 优化 方法 装置 设备 介质
【权利要求书】:

1.一种基于query分析的图谱优化方法,其特征在于,包括:

获取预设时长内产生的query日志;

从所述query日志中获取浏览信息,并根据所述浏览信息确定待优化query;

调用指定搜索引擎,并利用所述指定搜索引擎查询所述待优化query,得到至少一个非结构化文本;

利用改进的BiLSTM模型对所述至少一个非结构化文本进行实体及关系抽取,得到候选实体及候选关系;

从所述至少一个非结构化文本中获取抽取失败的文本,利用改进的基于ERNIE的实体关系联合抽取模型对所述抽取失败的文本进行补充抽取,并将抽取到的数据补充至所述候选实体及所述候选关系;

调用初始知识图谱,并利用所述初始知识图谱对所述候选实体及所述候选关系进行清洗,得到目标实体及目标关系,包括:从所述候选实体中识别所述初始知识图谱中存在的实体,并从所述候选实体中删除识别到的实体,得到第一实体;合并所述第一实体中重复的实体,得到所述目标实体;从所述候选关系中识别所述初始知识图谱中存在的关系,并从所述候选关系中删除识别到的关系,得到第一关系;合并所述第一关系中重复的关系,得到所述目标关系;

将所述目标实体及所述目标关系更新至所述初始知识图谱,得到目标图谱。

2.根据权利要求1所述的基于query分析的图谱优化方法,其特征在于,所述根据所述浏览信息确定待优化query包括:

从所述浏览信息中捕获停留时长大于或者等于配置时长,且没有点击操作的页面,将捕获到的页面所对应的query确定为所述待优化query;及/或

从所述浏览信息中读取用户的消极反馈记录,并获取与所述消极反馈记录对应的query作为所述待优化query。

3.根据权利要求1所述的基于query分析的图谱优化方法,其特征在于,所述利用所述指定搜索引擎查询所述待优化query,得到至少一个非结构化文本包括:

向所述指定搜索引擎发起带有所述待优化query的查询请求;

接收所述指定搜索引擎针对所述待优化query反馈的页面,其中,所述指定搜索引擎根据所述待优化query生成Request包,并基于HTTP库向目标站点发送所述Request包,所述指定搜索引擎接收所述目标站点反馈的Response包,并返回所述Response包的内容作为所述指定搜索引擎针对所述待优化query反馈的页面;

获取排在预设位之前的页面作为目标页面;

将所述目标页面内的数据确定为所述至少一个非结构化文本。

4.根据权利要求1所述的基于query分析的图谱优化方法,其特征在于,在利用改进的BiLSTM模型对所述至少一个非结构化文本进行实体及关系抽取前,所述方法还包括:

调用初始BiLSTM模型,并在所述初始BiLSTM模型的输出层添加关系分类器;

获取第一训练样本,将所述第一训练样本进行向量化处理,得到所述第一训练样本的嵌入表示;

获取所述第一训练样本的实体标签及关系标签;

将所述第一训练样本的嵌入表示确定为输入,将所述第一训练样本的实体标签及关系标签确定为训练目标,并对所述初始BiLSTM模型及所述关系分类器进行联合训练;

当所述初始BiLSTM模型及所述关系分类器同时收敛时,停止训练,得到所述改进的BiLSTM模型。

5.根据权利要求1所述的基于query分析的图谱优化方法,其特征在于,在利用改进的基于ERNIE的实体关系联合抽取模型对所述抽取失败的文本进行补充抽取前,所述方法还包括:

从通用中文库中获取第二训练样本;

随机屏蔽所述第二训练样本中的短语,并将屏蔽掉的短语替换为预设标记,得到屏蔽样本;

调用初始ERNIE模型;

根据所述屏蔽样本对所述初始ERNIE模型进行屏蔽短语预测训练;

当所述初始ERNIE模型达到收敛时,停止训练,得到所述改进的基于ERNIE的实体关系联合抽取模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110688454.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top