[发明专利]一种数据处理方法、装置、存储介质和电子设备有效
申请号: | 202010065877.4 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111309903B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 王鹏 | 申请(专利权)人: | 北京大米未来科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F40/289 |
代理公司: | 北京睿派知识产权代理有限公司 11597 | 代理人: | 刘锋 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 存储 介质 电子设备 | ||
本发明实施例提供了一种数据处理方法、装置、存储介质和电子设备。在本发明实施例中,通过自然语言处理技术对终端产生的数据进行采集和分析,获取目标用户对应的热点问题。能够提高数据处理的效率,及时高效的发现产品中存在的问题,便于针对性的改进产品缺陷,优化产品,提升用户体验。
技术领域
本发明涉及数据处理领域,尤其涉及一种数据处理方法、装置、存储介质和电子设备。
背景技术
随着互联网技术的发展,基于网络的在线教学得到越来越广泛的应用。在线教学场景中,家长和老师或者其他销售人员的沟通很频繁,而且随着学员学习的进展,沟通会长期持续。积累了大量的数据,包括语音和文本,这些数据中可能包含用户遇到的各种问题、建议和体验反馈,对所述数据的舆情挖掘能及时发现问题并解决问题,为产品优化方向提供参考依据,提升用户体验。现有的对数据的分析主要是通过人工进行。然而,人工分析成本高,效率低下,且分析不全面,无法有效的利用相关的数据。因此,如何有效利用沟通过程中的数据来提升用户体验成为急需解决的问题。
发明内容
有鉴于此,本发明实施例提供了一种数据处理方法、装置、存储介质和电子设备,能够提高对语音请求分类的准确性。
第一方面,本发明实施例提供一种数据处理方法,所述方法包括:
获取至少一个用户相关的舆情数据,所述舆情数据包括文本数据和/或语音数据;
对所述舆情数据进行分析,得到至少一个语义片段;
提取所述至少一个语义片段中的词汇;
基于所述各词汇的出现频次,得到至少一个目标词汇;
对所述至少一个目标词汇进行语义聚类,确定热点事件。
优选地,所述方法还包括:
获取与热点事件相关的至少一个语义片段;
根据所述至少一个语义片段分析目标用户对所述热点事件的情感极性,所述目标用户为与至少一个所述语义片段相关的用户;
发送所述目标用户对所述热点事件的情感极性信息。
优选地,所述方法还包括:
确定与热点事件相关的至少一个目标用户;
获取与所述目标用户相关的至少一个语义片段;
根据所述至少一个语义片段确定所述目标用户的标签;
发送所述目标用户的标签。
优选地,所述方法还包括:
获取各目标用户相关的至少一个语义片段;
根据所述至少一个语义片段确定所述目标用户的标签;
根据所述标签确定所述目标用户分类;
发送所述目标用户分类信息。
优选地,所述提取所述至少一个语义片段的词汇包括:
对所述语义片段进行分词处理、去停用词以及繁简转换处理。
优选地,所述对所述至少一个目标词汇进行语义聚类包括:
获取目标词汇的词向量;
对所述词向量进行聚类,以确定聚类后的多个词汇集合;以及
根据词汇集合确定对应的热点事件。
优选地,述舆情数据包括时间信息,所述舆情数据的日期距离当前日期的时长小于预定值。
第二方面,本发明实施例提供一种数据处理装置,所述装置包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大米未来科技有限公司,未经北京大米未来科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010065877.4/2.html,转载请声明来源钻瓜专利网。