[发明专利]基于query分析的图谱优化方法、装置、设备及介质有效
申请号: | 202110688454.2 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113254671B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 陈宇 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/28;G06F16/35;G06F40/295;G06N3/04;G06N5/02 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 李翔宇 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 query 分析 图谱 优化 方法 装置 设备 介质 | ||
1.一种基于query分析的图谱优化方法,其特征在于,包括:
获取预设时长内产生的query日志;
从所述query日志中获取浏览信息,并根据所述浏览信息确定待优化query;
调用指定搜索引擎,并利用所述指定搜索引擎查询所述待优化query,得到至少一个非结构化文本;
利用改进的BiLSTM模型对所述至少一个非结构化文本进行实体及关系抽取,得到候选实体及候选关系;
从所述至少一个非结构化文本中获取抽取失败的文本,利用改进的基于ERNIE的实体关系联合抽取模型对所述抽取失败的文本进行补充抽取,并将抽取到的数据补充至所述候选实体及所述候选关系;
调用初始知识图谱,并利用所述初始知识图谱对所述候选实体及所述候选关系进行清洗,得到目标实体及目标关系,包括:从所述候选实体中识别所述初始知识图谱中存在的实体,并从所述候选实体中删除识别到的实体,得到第一实体;合并所述第一实体中重复的实体,得到所述目标实体;从所述候选关系中识别所述初始知识图谱中存在的关系,并从所述候选关系中删除识别到的关系,得到第一关系;合并所述第一关系中重复的关系,得到所述目标关系;
将所述目标实体及所述目标关系更新至所述初始知识图谱,得到目标图谱。
2.根据权利要求1所述的基于query分析的图谱优化方法,其特征在于,所述根据所述浏览信息确定待优化query包括:
从所述浏览信息中捕获停留时长大于或者等于配置时长,且没有点击操作的页面,将捕获到的页面所对应的query确定为所述待优化query;及/或
从所述浏览信息中读取用户的消极反馈记录,并获取与所述消极反馈记录对应的query作为所述待优化query。
3.根据权利要求1所述的基于query分析的图谱优化方法,其特征在于,所述利用所述指定搜索引擎查询所述待优化query,得到至少一个非结构化文本包括:
向所述指定搜索引擎发起带有所述待优化query的查询请求;
接收所述指定搜索引擎针对所述待优化query反馈的页面,其中,所述指定搜索引擎根据所述待优化query生成Request包,并基于HTTP库向目标站点发送所述Request包,所述指定搜索引擎接收所述目标站点反馈的Response包,并返回所述Response包的内容作为所述指定搜索引擎针对所述待优化query反馈的页面;
获取排在预设位之前的页面作为目标页面;
将所述目标页面内的数据确定为所述至少一个非结构化文本。
4.根据权利要求1所述的基于query分析的图谱优化方法,其特征在于,在利用改进的BiLSTM模型对所述至少一个非结构化文本进行实体及关系抽取前,所述方法还包括:
调用初始BiLSTM模型,并在所述初始BiLSTM模型的输出层添加关系分类器;
获取第一训练样本,将所述第一训练样本进行向量化处理,得到所述第一训练样本的嵌入表示;
获取所述第一训练样本的实体标签及关系标签;
将所述第一训练样本的嵌入表示确定为输入,将所述第一训练样本的实体标签及关系标签确定为训练目标,并对所述初始BiLSTM模型及所述关系分类器进行联合训练;
当所述初始BiLSTM模型及所述关系分类器同时收敛时,停止训练,得到所述改进的BiLSTM模型。
5.根据权利要求1所述的基于query分析的图谱优化方法,其特征在于,在利用改进的基于ERNIE的实体关系联合抽取模型对所述抽取失败的文本进行补充抽取前,所述方法还包括:
从通用中文库中获取第二训练样本;
随机屏蔽所述第二训练样本中的短语,并将屏蔽掉的短语替换为预设标记,得到屏蔽样本;
调用初始ERNIE模型;
根据所述屏蔽样本对所述初始ERNIE模型进行屏蔽短语预测训练;
当所述初始ERNIE模型达到收敛时,停止训练,得到所述改进的基于ERNIE的实体关系联合抽取模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110688454.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大容量老化测试箱
- 下一篇:多级变速器及车辆