[发明专利]推送消息过滤方法、装置、计算机设备及存储介质在审
申请号: | 202310539299.7 | 申请日: | 2023-05-12 |
公开(公告)号: | CN116502639A | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 罗伟东;付凯 | 申请(专利权)人: | 深圳市和讯华谷信息技术有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F18/22;G06N5/01;G06F9/54;G06F16/335 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 李燕娥 |
地址: | 518000 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 推送 消息 过滤 方法 装置 计算机 设备 存储 介质 | ||
本发明实施例公开了推送消息过滤方法、装置、计算机设备及存储介质。所述方法包括:获取待过滤消息内容;将所述待过滤消息内容进行分词,以得到分词结果;对所述分词结果采用minhash函数进行计算,以得到计算结果;将所述计算结果输入LSH随机投影森林模型中进行相似度计算,以得到对比结果;判断所述对比结果是否是有反馈内容;若所述对比结果有反馈内容,则过滤所述待过滤消息内容。通过实施本发明实施例的方法可实现过滤内容相似的消息,避免了一定时间范围内多次频繁推送内容类似消息骚扰用户的情况,提升了消息推送的服务质量。
技术领域
本发明涉及消息处理方法,更具体地说是指推送消息过滤方法、装置、计算机设备及存储介质。
背景技术
消息推送指APP(应用程序,application)运营人员通过自己开发程序或者第三方工具对用户移动设备进行的主动消息推送,内容长度一般不超过256字节,UTF8编码3个字节保存一个中文汉字,用户可以在移动设备锁定屏幕和通知栏看到消息推送的消息通知,通知栏点击可唤起APP并去往相应页面,其中消息推送平台作为第三方saas(软件即服务项目,Software as a Service)服务平台,帮助app运营人员对接各个移动设备厂商的消息推送通道,简化开发复杂度和降低研发成本,同时提高消息送达率,是目前主流方式。消息推送平台在推送场景中,包括新闻、广告、支付、社交、电商、娱乐等移动服务使用过程中,会按照app运营推送策略向用户移动设备推送各类相关信息,因此对于某个用户移动设备,但是可能存在推送消息内容雷同的问题,造成用户连续接收到多次重复类似内容信息的情况,给用户带来骚扰,服务体验下降,造成不必要的用户投诉。
因此,有必要设计一种新的方法,实现过滤内容相似的消息,避免了一定时间范围内多次频繁推送内容类似消息骚扰用户的情况,提升了消息推送的服务质量。
发明内容
本发明的目的在于克服现有技术的缺陷,提供推送消息过滤方法、装置、计算机设备及存储介质。
为实现上述目的,本发明采用以下技术方案:推送消息过滤方法,包括:
获取待过滤消息内容;
将所述待过滤消息内容进行分词,以得到分词结果;
对所述分词结果采用minhash函数进行计算,以得到计算结果;
将所述计算结果输入LSH随机投影森林模型中进行相似度计算,以得到对比结果;
判断所述对比结果是否是有反馈内容;
若所述对比结果有反馈内容,则过滤所述待过滤消息内容。
其进一步技术方案为:所述过滤所述待过滤消息内容之后,还包括:
将所述计算结果记录到过滤日志中。
其进一步技术方案为:所述判断所述对比结果是否是有反馈内容之后,还包括:
若所述对比结果没有反馈内容,则推送所述待过滤消息内容。
其进一步技术方案为:所述推送所述待过滤消息内容之后,还包括:
将所述计算结果存储到LSH随机投影森林结构模型中。
其进一步技术方案为:所述将所述计算结果输入LSH随机投影森林模型中进行相似度计算,以得到对比结果,包括:
将所述计算结果输入LSH随机投影森林模型中对比Jaccard相似度,以得到对比结果。
本发明还提供了推送消息过滤装置,包括:
内容获取单元,用于获取待过滤消息内容;
分词单元,用于将所述待过滤消息内容进行分词,以得到分词结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市和讯华谷信息技术有限公司,未经深圳市和讯华谷信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310539299.7/2.html,转载请声明来源钻瓜专利网。