[发明专利]一种数据处理方法、装置、存储介质和电子设备有效
申请号: | 202010065877.4 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111309903B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 王鹏 | 申请(专利权)人: | 北京大米未来科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F40/289 |
代理公司: | 北京睿派知识产权代理有限公司 11597 | 代理人: | 刘锋 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 存储 介质 电子设备 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
获取至少一个用户相关的舆情数据,所述舆情数据包括预定期限内的文本数据和/或语音数据;
对所述舆情数据进行分析,得到至少一个语义片段;
提取所述至少一个语义片段中的词汇;
基于所述各词汇的出现频次,得到至少一个目标词汇;
对所述至少一个目标词汇进行语义聚类,确定热点事件;
确定与热点事件相关的至少一个目标用户;
获取与所述目标用户相关的至少一个语义片段;
根据所述至少一个语义片段确定所述目标用户的标签;
发送所述目标用户的标签至预定的终端,以根据所述目标用户的标签对所述目标用户采取不同的服务策略。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取与热点事件相关的至少一个语义片段;
根据所述至少一个语义片段分析目标用户对所述热点事件的情感极性,所述目标用户为与至少一个所述语义片段相关的用户;
发送所述目标用户对所述热点事件的情感极性信息。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取各目标用户相关的至少一个语义片段;
根据所述至少一个语义片段确定所述目标用户的标签;
根据所述标签确定所述目标用户分类;
发送所述目标用户分类信息。
4.根据权利要求1所述的方法,其特征在于,所述提取所述至少一个语义片段的词汇包括:
对所述语义片段进行分词处理、去停用词以及繁简转换处理。
5.根据权利要求1所述的方法,其特征在于,所述对所述至少一个目标词汇进行语义聚类包括:
获取目标词汇的词向量;
对所述词向量进行聚类,以确定聚类后的多个词汇集合;以及
根据词汇集合确定对应的热点事件。
6.根据权利要求1所述的方法,其特征在于,所述舆情数据包括时间信息,所述舆情数据的日期距离当前日期的时长小于预定值。
7.一种数据处理装置,其特征在于,所述装置包括:
数据获取单元,用于获取至少一个用户相关的舆情数据,所述舆情数据包括预定期限内的文本数据和/或语音数据;
语义片段获取单元,用于对所述舆情数据进行分析,得到至少一个语义片段;
词汇提取单元,用于提取所述至少一个语义片段中的词汇;
词汇频次确定单元,用于基于所述各词汇的出现频次,得到至少一个目标词汇;
语义聚类单元,用于对所述至少一个目标词汇进行语义聚类,确定热点事件;
所述装置还被用于:
确定与热点事件相关的至少一个目标用户;
获取与所述目标用户相关的至少一个语义片段;
根据所述至少一个语义片段确定所述目标用户的标签;
发送所述目标用户的标签至预定的终端,以根据所述目标用户的标签对所述目标用户采取不同的服务策略。
8.一种计算机可读存储介质,其上存储计算机程序指令,其特征在于,所述计算机程序指令在被处理器执行时实现如权利要求1-6中任一项所述的方法。
9.一种电子设备,包括存储器和处理器,其特征在于,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行如权利要求1-6中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大米未来科技有限公司,未经北京大米未来科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010065877.4/1.html,转载请声明来源钻瓜专利网。