[发明专利]标签的处理方法、装置、电子设备及存储介质有效
申请号: | 201811238336.6 | 申请日: | 2018-10-23 |
公开(公告)号: | CN109614482B | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 申世伟 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/9535 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 处理 方法 装置 电子设备 存储 介质 | ||
本公开是关于一种标签的处理方法、装置、电子设备及存储介质,所述方法包括:通过获取信息分享平台中针对目标对象设置的原始话题标签,然后从所述原始话题标签中,确定待验证话题标签,再对所述待验证话题标签进行网页搜索,最后根据所述网页搜索获得的搜索结果,从所述待验证话题标签中提取出目标话题标签。通过上述方法,有效地从原始话题标签中过滤掉了不规范的、不适合作为研究对象的话题标签,且简单可行,降低了技术人员的工作量,提高了话题标签的提取效率,方便了技术人员对提取出的目标话题标签进行分析研究,进而掌握用户关注热点,以更好地为用户服务。
技术领域
本公开涉及计算机应用技术领域,尤其涉及一种标签的处理方法、装置、电子设备及存储介质。
背景技术
随着互联网的迅猛发展,人们越来越乐于通过在社交网站发布文本信息或视频来表达观点和展现日常生活。用户在社交网站上发布的文本信息或视频往往蕴含着一定时期内的社会热点和大众的关注点,对这些内容进行研究,有利于技术人员更好地发掘用户需求,为用户推送更为有价值的信息。
但是由于用户在社交网站上发布的文本信息或者视频的标题文本信息一般长度都比较短,且存在词汇稀疏、书写不规范的问题,导致了信息汇总数据中严重的高稀疏和高噪音问题,从而使得技术人员对用户发布的文本信息的分析和挖掘产生了困难,难以从用户发布的文本信息中提取出有效的标签信息。
发明内容
为克服现有技术中难以从用户发布的文本信息中提取有效的标签信息的问题,本公开提供一种标签的处理方法、装置、电子设备及存储介质。
根据本公开实施例的第一方面,提供一种标签的处理方法,包括:
获取信息分享平台中,针对目标对象设置的原始话题标签;
从所述原始话题标签中,确定待验证话题标签;
对所述待验证话题标签进行网页搜索;
根据所述网页搜索获得的搜索结果,从所述待验证话题标签中提取出目标话题标签。
根据本公开实施例的第二方面,提供一种标签的处理装置,包括:
原始话题标签获取模块,被配置为执行获取信息分享平台中,针对目标对象设置的原始话题标签;
待验证话题标签确定模块,被配置为执行从所述原始话题标签中,确定待验证话题标签;
网页搜索模块,被配置为执行对所述待验证话题标签进行网页搜索;
目标话题标签提取模块,被配置为执行根据所述网页搜索获得的搜索结果,从所述待验证话题标签中提取出目标话题标签。
根据本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:获取信息分享平台中,针对目标对象设置的原始话题标签;从所述原始话题标签中,确定待验证话题标签;对所述待验证话题标签进行网页搜索;根据所述网页搜索获得的搜索结果,从所述待验证话题标签中提取出目标话题标签。
根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行一种标签处理方法,所述方法包括:
获取信息分享平台中,针对目标对象设置的原始话题标签;从所述原始话题标签中,确定待验证话题标签;对所述待验证话题标签进行网页搜索;根据所述网页搜索获得的搜索结果,从所述待验证话题标签中提取出目标话题标签。
根据本公开实施例的第五方面,提供一种应用程序,当所述应用程序中的指令由电子设备的处理器执行时,使得电子设备能够执行一种标签处理方法,所述方法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811238336.6/2.html,转载请声明来源钻瓜专利网。