[发明专利]候选搜索词的生成方法、装置、设备及介质在审
申请号: | 202011383662.3 | 申请日: | 2020-11-30 |
公开(公告)号: | CN112507188A | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 潘禄;陈玉光 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/338;G06F16/33;G06N3/04;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 韩海花 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 候选 搜索词 生成 方法 装置 设备 介质 | ||
本申请公开了一种候选搜索词的生成方法、装置、设备及介质,涉及自然语言处理和知识图谱技术领域。具体实现方案为:获取目标事件的事件相关文本后,根据事件相关文本生成多个焦点概率向量,并根据目标事件的结构化信息,生成目标事件的事件语义表示向量,以根据事件语义表示向量、事件相关文本的文本语义表示向量和多个焦点概率向量生成多个候选搜索词。由此,通过引入多个焦点概率向量,多个焦点概率向量用于指导生成多个候选搜索词,不仅有效的提高了候选搜索词的生成效率和准确性,还提成了候选搜索词生成的多样性。
技术领域
本申请公开了一种候选搜索词的生成方法、装置、设备及介质,涉及深度学习技术领域,具体涉及自然语言处理和知识图谱技术领域。
背景技术
随着互联网发展,信息量大幅增加,为了提高信息获取效率,节约信息获取时间,用户可以在各类网站的搜索框中输入搜索词以获取相应的资源。例如,可以在百科类网站的搜索框中输入一个或多个搜索词以获取相应的百科内容。
但是,目前大部分事件都没有搜索词或者很少的搜索词,从而导致用户搜索时并未关注到该事件。为此,提供一种用于生成事件的搜索词的方法是至关重要的。
发明内容
本申请提供了一种候选搜索词的生成方法、装置、设备及介质。
本申请的一方面,提供了一种候选搜索词的生成方法,包括:
获取目标事件的事件相关文本,并根据所述事件相关文本生成多个焦点概率向量;
根据所述目标事件的结构化信息,生成所述目标事件的事件语义表示向量;
根据所述事件语义表示向量、所述事件相关文本的文本语义表示向量和所述多个焦点概率向量生成多个候选搜索词。
作为本申请一方面的一种可能的实现方式,所述根据所述事件相关文本生成多个焦点概率向量,包括:
将所述事件相关文本输入至多专家模型以生成多个专家向量,其中,所述多专家模型对所述事件相关文本的关注点不同;
将所述多个专家向量输入至连接层以生成所述多个焦点概率向量。
作为本申请一方面的另一种可能的实现方式,所述根据所述目标事件的结构化信息,生成所述目标事件的事件语义表示向量,包括:
从所述目标事件的结构化信息中提取论元信息,并根据所述论元信息生成论元语义表示向量;
根据所述论元语义表示向量生成所述目标事件的事件语义表示向量。
作为本申请一方面的另一种可能的实现方式,所述从所述目标事件的结构化信息中提取论元信息,并根据所述论元信息生成论元语义表示向量,包括:
从所述结构化信息中提取至少一组所述论元信息;其中,各组所述论元信息中包含论元角色和论元值;
将属于同一组所论元信息的所述论元角色和所述论元值输入第一双向LSTM模型以生成所述论元角色向量和论元值向量;
将所述论元角色向量和所述论元向量拼接以生成所述论元语义表示向量。
作为本申请一方面的另一种可能的实现方式,所述论元信息为多组,每一组所述论元信息具有对应的所述论元语义表示向量,所述根据所述论元语义表示向量生成所述目标事件的事件语义表示向量,包括:
将各组所述论元信息所对应的论元语义表示向量输入至第二双向LSTM模型以生成所述事件语义表示向量。
作为本申请一方面的另一种可能的实现方式,所述根据所述事件语义表示向量、所述事件相关文本的文本语义表示向量和所述多个焦点概率向量生成多个候选搜索词之前,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011383662.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自触发式宠物用喂食装置
- 下一篇:一种医疗用高效雾化器及其使用方法