[发明专利]一种基于深度学习的文本关键词提取方法在审
申请号: | 201610394935.1 | 申请日: | 2016-06-03 |
公开(公告)号: | CN106095749A | 公开(公告)日: | 2016-11-09 |
发明(设计)人: | 凌立刚;朱海鹏 | 申请(专利权)人: | 杭州量知数据科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 张法高;傅朝栋 |
地址: | 310013 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度学习的文本关键词提取方法。该方法首先需要训练一个循环神经网络模型,所使用的训练数据是大量的文本及其关键词,训练目标是最大化关键词基于文本的条件概率。对于每一组文本和关键词,首先将其转化为词向量,然后输入循环神经网络模型中,使用随机梯度下降方法更新网络参数。模型训练结束后,对于一段待提取关键词的文本,将其转化为词向量,输入到已经训练好的循环神经网络模型中,可以生成这段文本的关键词。本方法通过数据驱动学习了一个端到端的模型来实现文本关键词的提取,相对于传统的基于统计学和语言学的方法来说,本方法适应性更强,能够根据不同的训练数据得到不同的模型,从而提取出符合特定领域要求的关键词。 | ||
搜索关键词: | 一种 基于 深度 学习 文本 关键词 提取 方法 | ||
【主权项】:
一种基于深度学习的文本关键词提取方法,其特征在于,包括如下步骤:1)获取文本关键词数据库,文本关键词数据库中包含若干组文本和其对应的关键词;2)使用word2vec将每组文本和其对应的关键词转化为词向量;3)使用词向量形式的文本和其对应的关键词来训练循环神经网络,循环神经网络由输入层、隐层和输出层组成,输入层接受词向量,隐层记录已输入的词向量信息,输出层输出概率分布,用于预测关键词;4)循环神经网络训练完成后,对于新的文本,利用训练后的循环神经网络来进行关键词的提取。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州量知数据科技有限公司,未经杭州量知数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610394935.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种用于生态乐园观光旅游的果实采摘装置
- 下一篇:一种空调器