[发明专利]一种通讯录文本分类方法、装置及电子设备有效
申请号: | 201910450578.X | 申请日: | 2019-05-28 |
公开(公告)号: | CN110222179B | 公开(公告)日: | 2022-10-25 |
发明(设计)人: | 曲波 | 申请(专利权)人: | 深圳市小赢信息技术有限责任公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/31;G06F16/335 |
代理公司: | 上海科政专利代理事务所(普通合伙) 31463 | 代理人: | 杨军 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种通讯录文本分类方法、装置及电子设备,方法包括:根据预设分词模型对源通讯录文本进行分词,且对分词结果进行过滤,计算过滤后的分词结果中的各分词的统计权重;获取统计权重大于预设权重阈值的分词以作为初选分词;根据先验知识对初选分词进行规整处理,以获得选定分词;根据选定分词生成关键词向量列表,以获得关于关键词向量列表的聚类结果;根据预设的风险标签统计结果对聚类结果的风险等级进行划分和排序。本发明可以将通讯录文本进行分类并提供风险等级划分,在市场营销、客户管理和风险控制等细分领域可以获取更为综合的通讯录画像信息,进一步结合风险信息,为具体业务提供有效支撑。 | ||
搜索关键词: | 一种 通讯录 文本 分类 方法 装置 电子设备 | ||
【主权项】:
1.一种通讯录文本分类方法,其特征在于,包括:获取源通讯录文本;根据预设分词模型对所述源通讯录文本进行分词以获得分词结果;根据预设的过滤条件对所述分词结果进行过滤;根据预设的权重计算参数计算过滤后的所述分词结果中的各分词的统计权重;获取所述统计权重大于预设权重阈值的分词以作为初选分词;根据先验知识对所述初选分词进行规整处理,以获得选定分词;根据所述选定分词生成关键词向量列表;将所述关键词向量列表和预设的主题分类输入预设的概率生成模型中,以获得关于所述关键词向量列表的聚类结果;根据预设的风险标签统计结果对所述聚类结果的风险等级进行划分,且根据预设的排序方式对所述聚类结果的风险等级进行排序。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市小赢信息技术有限责任公司,未经深圳市小赢信息技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910450578.X/,转载请声明来源钻瓜专利网。