[发明专利]一种趋势预测模型的训练方法及装置有效
申请号: | 202010047480.2 | 申请日: | 2020-01-16 |
公开(公告)号: | CN111222051B | 公开(公告)日: | 2023-09-12 |
发明(设计)人: | 郑婉腾;林伟翔 | 申请(专利权)人: | 深圳市华海同创科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/04;G06N3/08 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 李娟 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 趋势 预测 模型 训练 方法 装置 | ||
本申请适用于计算机技术领域,提供了一种趋势预测模型的训练方法,包括:获取预设时间段内的新闻关键词对应的词向量信息和影响力特征信息、并且获取所述预设时间段对应的趋势标签;获取新闻特征信息;所述新闻特征信息基于所述词向量信息和所述影响力特征信息生成;基于所述新闻特征信息及其对应的趋势标签对深度神经网络训练,得到用于输出趋势信息的趋势预测模型;在训练过程中,所述趋势预测模型的输入为所述新闻特征信息;所述趋势预测模型的输出为所述新闻特征信息对应的趋势信息。上述方法,将新闻文本转换成词向量信息,基于词向量信息和影响力特征信息生成新闻特征信息,将新闻特征信息及其对应的趋势标签作为训练样本,训练得到用于输出趋势信息的趋势预测模型,从而可以对新闻数据的趋势进行预测,提高新闻数据的分析效率。
技术领域
本申请属于计算机技术领域,尤其涉及一种趋势预测模型的训练方法及装置。
背景技术
随着互联网行业的发展,用户除了通过传统媒体获取新闻还可以通过很多新形式的媒体来获取新闻,例如,新闻客户端、网页、微博等等。由于用户获取到的新闻数据的数量过大,对于新闻数据的分析以及趋势的预测就十分必要。但是,现有的对于新闻数据的分析方法只能获取到已经发生的新闻数据对应的趋势,无法对趋势进行预测,得到的分析结果不具有前瞻性,新闻数据的分析效率低。
发明内容
本申请实施例提供了一种趋势预测模型的训练方法及装置,可以解决现有的对于新闻数据的分析方法只能获取到已经发生的新闻数据对应的趋势,无法对趋势进行预测,得到的分析结果不具有前瞻性,新闻数据的分析效率低的问题。
第一方面,本申请实施例提供了一种方法,包括:
获取预设时间段内的新闻关键词对应的词向量信息和影响力特征信息、并且获取所述预设时间段对应的趋势标签;
获取新闻特征信息;所述新闻特征信息基于所述词向量信息和所述影响力特征信息生成;
基于所述新闻特征信息及其对应的趋势标签对深度神经网络训练,得到用于输出趋势信息的趋势预测模型;在训练过程中,所述趋势预测模型的输入为所述新闻特征信息;所述趋势预测模型的标注为所述预设时间段对应的趋势标签;所述趋势预测模型的输出为所述预测趋势信息。
进一步地,获取预设时间段内的新闻关键词对应的影响力特征信息,包括:
基于所述预设时间段的新闻关键词对应的新闻发布时刻和所述预设时间段对应的结束时刻,生成预设时间段内的新闻关键词对应的影响力特征信息。
进一步地,所述基于所述预设时间段的新闻关键词对应的新闻发布时刻和所述预设时间段对应的结束时刻,生成预设时间段内的新闻关键词对应的影响力特征信息,包括:
基于第一影响力特征计算策略、所述预设时间段的新闻关键词对应的新闻发布时刻和所述预设时间段对应的结束时刻,生成预设时间段内的新闻关键词对应的影响力特征信息;所述第一影响力特征计算策略为:
影响力特征信息=1/(T-ti)α
其中,α为可调整参数,ti为新闻发布时刻,T为结束时刻。
进一步地,所述基于所述预设时间段的新闻关键词对应的新闻发布时刻和所述预设时间段对应的结束时刻,生成预设时间段内的新闻关键词对应的影响力特征信息,包括:
基于第二影响力特征计算策略、所述预设时间段的新闻关键词对应的新闻发布时刻和所述预设时间段对应的结束时刻,生成预设时间段内的新闻关键词对应的影响力特征信息;所述第二影响力特征计算策略为:
其中,α为可调整参数,ti为新闻发布时刻,T为结束时刻。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市华海同创科技有限公司,未经深圳市华海同创科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010047480.2/2.html,转载请声明来源钻瓜专利网。