[发明专利]一种在查询信息中识别核心词的方法、装置和设备在审

申请号：	201711252342.2	申请日：	2017-12-01
公开（公告）号：	CN110019676A	公开（公告）日：	2019-07-16
发明（设计）人：	崔志刚;王峰;李刚;贺宇凯;易鸣;汤俊杰	申请（专利权）人：	北京搜狗科技发展有限公司
主分类号：	G06F16/33	分类号：	G06F16/33;G06N20/00
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	刘佳;王宝筠
地址：	100084 北京市海淀区中关***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种在查询信息中识别核心词的方法。该方法包括：接收用户提供的目标查询信息；对目标查询信息进行分词，得到初始关键词；将初始关键词输入到机器学习模型中，并基于机器学习模型的输出结果，从初始关键词中确定出目标核心词；其中，所述机器学习模型已基于历史查询信息分词得到的历史关键词与所述历史查询信息中已知的历史目标词之间的对应关系进行了训练；在所述机器学习模型中包括LSTM网络；所述LSTM网络的输入序列包括第一序列；在所述第一序列中，所述初始关键词对应的词向量按照所述初始关键词在所述目标查询信息中的上下文位置进行排列。此外，本发明还公开了一种在查询信息中识别核心词的装置和设备。
搜索关键词：	机器学习模型查询信息目标查询核心词历史查询分词上下文位置基于机器接收用户历史目标目标核心输出结果输入序列词向量网络学习
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种在查询信息中识别核心词的方法，其特征在于，包括：接收用户提供的目标查询信息；对所述目标查询信息进行分词，得到初始关键词；将所述初始关键词输入到机器学习模型中，并基于所述机器学习模型的输出结果，从所述初始关键词中确定出目标核心词；其中，所述机器学习模型已基于历史查询信息分词得到的历史关键词与所述历史查询信息中已知的历史目标词之间的对应关系进行了训练；在所述机器学习模型中包括长时间记忆网络；所述长时间记忆网络的输入序列包括第一序列；在所述第一序列中，所述初始关键词对应的词向量按照所述初始关键词在所述目标查询信息中的上下文位置进行排列。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司，未经北京搜狗科技发展有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201711252342.2/，转载请声明来源钻瓜专利网。

上一篇：一种关键词提取的方法及装置
下一篇：基于聚类分析的微博广告发布者识别方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种在查询信息中识别核心词的方法、装置和设备在审

专利文献下载