[发明专利]目标事件的标记方法和装置、存储介质及电子装置有效
申请号: | 201910713377.4 | 申请日: | 2019-08-02 |
公开(公告)号: | CN110458296B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 邹耿鹏;段建波 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06N20/10 | 分类号: | G06N20/10;G06F16/35;G06F40/289 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周婷婷 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 事件 标记 方法 装置 存储 介质 电子 | ||
本发明公开了一种目标事件的标记方法和装置、存储介质及电子装置。其中,该方法包括:获取待处理信息中携带的内容语句,其中,内容语句被切分为多个词组;在多个词组中确定出目标词组,其中,目标词组为出现在同一条待处理信息中、且在预定时间段内出现次数超过预设次数阈值的词组;使用分类模型确定待处理信息中包含目标词组的目标待处理信息所对应的目标类别,其中,包括目标类别的不同类别在分类模型中对应不同的权重,目标类别的权重用于指示目标词组成为目标事件的可能性;在目标类别对应的权重超过预设权重阈值的情况下,将目标待处理信息中包含的目标词组标记为目标事件。以至少解决相关技术中对目标事件进行检测的效率较低问题。
技术领域
本发明涉及游戏数据处理技术领域,具体而言,涉及一种目标事件的标记方法和装置、存储介质及电子装置。
背景技术
目前在相关技术中,针对网络热点事件的检测主要是使用词嵌入(WordEmbedding)相关算法训练词向量模型来实现。具体的,使用词向量模型获得词级别的向量表达,然后通过词向量拼接或获取语句主干的方式来提取主干词,再利用训练模型等方式来获得语句向量表达,然后通过聚类方法对语句向量进行聚类,获得事件簇。但是,目前相关技术提供的方式并不能实现对事件簇的类别进行智能识别,即,无法准确地确定出待检测的事件是真的热点事件,或是阶段性的频率高的正常事件,常常需要通过人工来辨别该事件是否为热点事件。
也就是说,相关技术提供的这种检测方式,需要投入大量的人力成本,使得对事件检测的复杂度增加,从而导致检测效率较低的问题。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种目标事件的标记方法和装置、存储介质及电子装置,以至少解决相关技术中对目标事件进行检测的效率较低问题。
根据本发明实施例的一个方面,提供了一种目标事件的标记方法,包括:获取待处理信息中携带的内容语句,其中,所述内容语句被切分为多个词组;在所述多个词组中确定出目标词组,其中,所述目标词组为出现在同一条所述待处理信息中、且在预定时间段内出现次数超过预设次数阈值的词组;使用分类模型确定所述待处理信息中包含所述目标词组的目标待处理信息所对应的目标类别,其中,包括所述目标类别的不同类别在所述分类模型中对应不同的权重,所述目标类别的权重用于指示所述目标词组成为目标事件的可能性;在所述目标类别对应的权重超过预设权重阈值的情况下,将所述目标待处理信息中包含的所述目标词组标记为所述目标事件。
根据本发明实施例的另一方面,还提供了一种目标事件的标记装置,包括:获取模块,用于获取待处理信息中携带的内容语句,其中,所述内容语句被切分为一个或多个词组;第一确定模块,用于在所述多个词组中确定出目标词组,其中,所述目标词组为出现在同一条所述待处理信息中、且在预定时间段内出现次数超过预设次数阈值的词组;第二确定模块,用于使用分类模型确定所述待处理信息中包含所述目标词组的目标待处理信息所对应的目标类别,其中,包括所述目标类别的不同类别在所述分类模型中对应不同的权重,所述目标类别的权重用于指示所述目标词组成为目标事件的可能性;标记模块,用于在所述目标类别对应的权重超过预设权重阈值的情况下,将所述目标待处理信息中包含的所述目标词组标记为所述目标事件。
可选地,所述第二确定模块包括:输入单元,用于将所述目标待处理信息输入所述分类模型,其中,所述目标待处理信息中包含一个或多个所述目标词组,所述分类模型是使用所述待处理信息中包含的所述词组作为训练样本对初始分类模型进行训练得到的;输出单元,用于输出所述目标词组对应的所述目标类别。
可选地,所述装置还包括:训练模块,用于使用已经确定类别的第一目标待处理信息作为训练样本对所述初始分类模型进行训练,其中,所述第一目标待处理信息中包含标记为目标事件的词组和没有标记为目标事件的词组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910713377.4/2.html,转载请声明来源钻瓜专利网。