[发明专利]文本主题抽取方法、装置及计算机可读存储介质在审
申请号: | 201910659924.5 | 申请日: | 2019-07-19 |
公开(公告)号: | CN110502748A | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 金戈;徐亮 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 44347 深圳市沃德知识产权代理事务所(普通合伙) | 代理人: | 于志光;高杰<国际申请>=<国际公布>= |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种人工智能技术,揭露了一种文本主题抽取方法,包括:接收文本数据集,对所述文本数据集进行预处理操作;对预处理操作后的所述文本数据集进行编码,得到文本词向量集、文本句子向量集以及文本段落向量集,根据所述文本词向量集、文本句子向量集以及文本段落向量集建立文本向量集;对所述文本向量集进行稀疏操作,得到稀疏后的文本向量集,通过预先构建的变焦神经网络模型对稀疏操作后的所述文本向量集进行解码,输出所述文本向量集的文本隐藏状态序列,从而得到所述文本数据集的主题。本发明还提出一种文本主题抽取装置以及一种计算机可读存储介质。本发明实现了文本主题的高效提取。 | ||
搜索关键词: | 向量集 文本向量 文本数据 文本主题 稀疏 预处理操作 文本句子 文本词 计算机可读存储介质 文本 人工智能技术 神经网络模型 抽取装置 高效提取 文本隐藏 状态序列 解码 变焦 构建 抽取 输出 | ||
【主权项】:
1.一种文本主题抽取方法,其特征在于,所述方法包括:/n接收文本数据集,对所述文本数据集进行预处理操作;/n对预处理操作后的所述文本数据集进行编码,得到文本词向量集、文本句子向量集以及文本段落向量集,根据所述文本词向量集、文本句子向量集以及文本段落向量集建立文本向量集;/n对所述文本向量集进行稀疏操作,得到稀疏后的文本向量集,通过预先构建的变焦神经网络模型对稀疏操作后的所述文本向量集进行解码,输出所述文本向量集的文本隐藏状态序列,从而得到所述文本数据集的主题。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910659924.5/,转载请声明来源钻瓜专利网。