[发明专利]软文展现次数统计方法和装置有效
申请号: | 201510850381.7 | 申请日: | 2015-11-27 |
公开(公告)号: | CN106815196B | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 王名洋;吴丹 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F16/951;G06F16/953;G06F16/958 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 韩建伟;张永明 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 展现 次数 统计 方法 装置 | ||
本申请公开了一种软文展现次数统计方法和装置。其中,该方法包括:获取多个网页内容,其中,多个网页内容为搜索结果页中的多个网页的内容;分别计算多个网页内容中各个网页内容和目标软文的文本编辑距离;分别根据多个网页内容中各个网页内容和目标软文的文本编辑距离判断各个网页内容是否与目标软文相同;以及统计多个网页内容中与目标软文相同的网页内容的数量,作为目标软文的展现次数。通过本申请,解决了相关技术中通过人工方式统计软文的展现次数效率较低的技术问题。
技术领域
本申请涉及数据处理领域,具体而言,涉及一种软文展现次数统计方法和装置。
背景技术
软文是一种文字广告,例如,在报纸、杂志或网络等宣传载体上刊登的用于提升企业品牌形象和知名度,或促进企业销售的一些宣传性、阐释性文章,包括特定的新闻报道、深度文章、付费短文广告、案例分析等。一些企业基于提高品牌声誉度或增加品牌曝光量等原因,会制作出一批基于品牌关键词或者产品关键词的软文,然后将软文在众多外部网站上进行投放。
为了分析软文的投放效果,通常需要统计所投放的软文在搜索端的这些特定关键词的搜索结果中的展现次数和排名情况。现有技术中通过人工搜索关键词,然后打开搜索结果页的每一个链接,查看相应网页内容并统计软文的展现数量以及软文的排名情况。这种人工操作的方式不仅效率低,而且统计结果容易出错。
针对相关技术中通过人工方式统计软文的展现次数效率较低的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种软文展现次数统计方法和装置,以解决相关技术中通过人工方式统计软文的展现次数效率较低的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种软文展现次数统计方法。该方法包括:获取多个网页内容,其中,多个网页内容为搜索结果页中的多个网页的内容;分别计算多个网页内容中各个网页内容和目标软文的文本编辑距离;分别根据多个网页内容中各个网页内容和目标软文的文本编辑距离判断各个网页内容是否与目标软文相同;以及统计多个网页内容中与目标软文相同的网页内容的数量,作为目标软文的展现次数。
进一步地,多个网页内容包括第一网页内容,分别根据多个网页内容中各个网页内容和目标软文的文本编辑距离判断各个网页内容是否与目标软文相同包括:统计目标软文的长度;计算第一网页内容和目标软文的文本编辑距离与目标软文的长度的比值;判断第一网页内容和目标软文的文本编辑距离与目标软文的长度的比值是否小于第一阈值;当判断出第一网页内容和目标软文的文本编辑距离与目标软文的长度的比值小于第一阈值时,则确定第一网页内容与目标软文相同;以及当判断出第一网页内容和目标软文的文本编辑距离与目标软文的长度的比值不小于第一阈值时,则确定第一网页内容与目标软文不相同。
进一步地,多个网页内容包括第一网页内容,分别计算多个网页内容中各个网页内容和目标软文的文本编辑距离包括计算第一网页内容和目标软文的文本编辑距离,计算第一网页内容和目标软文的文本编辑距离包括:分别对第一网页内容和目标软文进行分块,得到第一内容块列表和第二内容块列表,其中,第一内容块列表为第一网页内容分块后得到的内容块列表,第二内容块列表为目标软文分块后得到的内容块列表;以及分别计算第一内容块列表中各个内容块与第二内容块列表中各个内容块的文本编辑距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510850381.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种分词方法及装置、检索方法及装置
- 下一篇:文本相似度的确定方法和装置