[发明专利]候选搜索词的生成方法、装置、设备及介质在审
申请号: | 202011383662.3 | 申请日: | 2020-11-30 |
公开(公告)号: | CN112507188A | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 潘禄;陈玉光 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/338;G06F16/33;G06N3/04;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 韩海花 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 候选 搜索词 生成 方法 装置 设备 介质 | ||
1.一种候选搜索词的生成方法,包括:
获取目标事件的事件相关文本,并根据所述事件相关文本生成多个焦点概率向量;
根据所述目标事件的结构化信息,生成所述目标事件的事件语义表示向量;
根据所述事件语义表示向量、所述事件相关文本的文本语义表示向量和所述多个焦点概率向量生成多个候选搜索词。
2.根据权利要求1所述的候选搜索词的生成方法,其中,所述根据所述事件相关文本生成多个焦点概率向量,包括:
将所述事件相关文本输入至多专家模型以生成多个专家向量,其中,所述多专家模型对所述事件相关文本的关注点不同;
将所述多个专家向量输入至连接层以生成所述多个焦点概率向量。
3.根据权利要求1所述的候选搜索词的生成方法,其中,所述根据所述目标事件的结构化信息,生成所述目标事件的事件语义表示向量,包括:
从所述目标事件的结构化信息中提取论元信息,并根据所述论元信息生成论元语义表示向量;
根据所述论元语义表示向量生成所述目标事件的事件语义表示向量。
4.根据权利要求3所述的候选搜索词的生成方法,其中,所述从所述目标事件的结构化信息中提取论元信息,并根据所述论元信息生成论元语义表示向量,包括:
从所述结构化信息中提取至少一组所述论元信息;其中,各组所述论元信息中包含论元角色和论元值;
将属于同一组所论元信息的所述论元角色和所述论元值输入第一双向长短期记忆网络LSTM模型以生成所述论元角色向量和论元值向量;
将所述论元角色向量和所述论元向量拼接以生成所述论元语义表示向量。
5.根据权利要求4所述的候选搜索词的生成方法,其中,所述论元信息为多组,每一组所述论元信息具有对应的所述论元语义表示向量,所述根据所述论元语义表示向量生成所述目标事件的事件语义表示向量,包括:
将各组所述论元信息所对应的论元语义表示向量输入至第二双向LSTM模型以生成所述事件语义表示向量。
6.根据权利要求1所述的候选搜索词的生成方法,其中,所述根据所述事件语义表示向量、所述事件相关文本的文本语义表示向量和所述多个焦点概率向量生成多个候选搜索词之前,还包括:
对所述事件相关文本进行分词以生成多个词,并获取所述多个词的多个词编码向量;
将所述多个词编码向量输入至第三双向LSTM模型以生成所述文本语义表示向量。
7.根据权利要求1-6任一项所述的候选搜索词的生成方法,其中,所述根据所述事件语义表示向量、所述事件相关文本的文本语义表示向量和所述多个焦点概率向量生成多个候选搜索词,包括:
将所述多个焦点概率向量中的一个焦点概率向量与所述事件语义向量和所述文本语义表示向量拼接,得到拼接向量;
将所述拼接向量输入解码器,以得到所述解码器输出的一个所述候选搜索词。
8.根据权利要求7所述的候选搜索词的生成方法,其中,所述解码器,用于循环执行多次解码过程,每一次解码过程用于解码得到所述一个候选搜索词中的一个字符;
其中,所述解码器包括隐藏层和输出层;
所述隐藏层,用于根据所述拼接向量、隐状态指示向量,以及上一次解码过程中所述输出层的输出,生成本次解码过程的隐状态;所述隐状态指示向量,是根据上一次解码过程中所述隐藏层生成的隐状态生成的;
所述输出层,用于根据本次解码过程的隐状态,输出所述本次解码过程解码得到的字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011383662.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自触发式宠物用喂食装置
- 下一篇:一种医疗用高效雾化器及其使用方法