[发明专利]一种热词统计方法、系统、电子设备和存储介质在审
申请号: | 202110486427.7 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113051893A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 宋雨;丁锐;宗宇;程璐 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/289 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 陈颖 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 统计 方法 系统 电子设备 存储 介质 | ||
1.一种热词统计方法,其特征在于,包括:
获取预设时间段内的客户语料;
对所述客户语料按照预设处理规则进行处理,得到待选词集合;
统计所述待选词集合中每个待选词出现的次数,得到每个所述待选词的词频;
基于每个所述待选词的词频,从所述待选词集合中筛选出热词集合,所述热词集合中每个热词的词频高于所述待选词集合中非热词的词频;
对所述热词集合中的各个热词按照不同的词频分布规律进行统计,得到不同类型的热词子集合。
2.根据权利要求1所述的热词统计方法,其特征在于,所述对所述热词集合中的各个热词按照不同的词频分布规律进行统计,得到不同类型的热词子集合,具体包括:
将所述热词集合中在所述客户语料中出现的次数一直稳定在预设区间内容中的热词,确定为长期热词;
对所述热词集合中所有的所述长期热词进行统计,得到长期热词子集合。
3.根据权利要求1所述的热词统计方法,其特征在于,所述对所述热词集合中的各个热词按照不同的词频分布规律进行统计,得到不同类型的热词子集合,具体包括:
将所述热词集合按照时序划分成多个统计区间;
将所述热词集合中在不同的所述统计区间中出现的次数为梯度分布,且梯度值大于梯度阈值的热词,确定为短期突发热词;
对所述热词集合中所有的所述短期突发热词进行统计,得到短期突发热词子集合。
4.根据权利要求1所述的热词统计方法,其特征在于,所述对所述热词集合中的各个热词按照不同的词频分布规律进行统计,得到不同类型的热词子集合,具体包括:
将所述热词集合按照时序划分成多个统计区间;
确定每个统计区间中的各个热词出现的次数;
将所述热词集合中在不同的所述统计区间中出现的次数成周期性分布的热词,确定为周期性热词;
对所述热词集合中所有的所述周期性热词进行统计,得到周期性热词子集合。
5.根据权利要求1所述的热词统计方法,其特征在于,所述对所述客户语料按照预设处理规则进行处理,得到待选词集合,具体包括:
对所述客户语料进行中文分词和停用词删除,得到所述待选词集合。
6.一种热词统计系统,其特征在于,包括:
获取单元,用于获取预设时间段内的客户语料;
处理单元,用于对所述客户语料按照预设处理规则进行处理,得到待选词集合;
词频统计单元,用于统计所述待选词集合中每个待选词出现的次数,得到每个所述待选词的词频;
筛选单元,用于基于每个所述待选词的词频,从所述待选词集合中筛选出热词集合,所述热词集合中每个热词的词频高于所述待选词集合中非热词的词频;
热词子集合统计单元,用于对所述热词集合中的各个热词按照不同的词频分布规律进行统计,得到不同类型的热词子集合。
7.根据权利要求6所述的热词统计系统,其特征在于,所述热词子集合统计单元具体包括:
长期热词确定子单元,用于将所述热词集合中在所述客户语料中出现的次数一直稳定在预设区间内容中的热词,确定为长期热词;
第一集合统计子单元,用于对所述热词集合中所有的所述长期热词进行统计,得到长期热词子集合。
8.根据权利要求6所述的热词统计系统,其特征在于,所述热词子集合统计单元具体包括:
第一划分子单元,用于将所述热词集合按照时序划分成多个统计区间;
短期突发热词确定子单元,用于将所述热词集合中在不同的所述统计区间中出现的次数为梯度分布,且梯度值大于梯度阈值的热词,确定为短期突发热词;
第二集合统计子单元,用于对所述热词集合中所有的所述短期突发热词进行统计,得到短期突发热词子集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110486427.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种母乳源鼠李糖乳杆菌及其应用
- 下一篇:一种润肠通便的压片糖果及其制备方法