[发明专利]覆盖式优化设置关键字的方法有效
申请号: | 201711092580.1 | 申请日: | 2017-11-08 |
公开(公告)号: | CN107908706B | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 施少杰 | 申请(专利权)人: | 施少杰 |
主分类号: | G06F16/30 | 分类号: | G06F16/30 |
代理公司: | 福建如浩律师事务所 35223 | 代理人: | 刘开林 |
地址: | 361010 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 覆盖 优化 设置 关键字 方法 | ||
1.覆盖式优化设置关键字的方法,其特征在于:提供《切词词典》并读入,再进行如下步骤:
步骤1:构建《关键词词典》,其载入手机应用商城中任一手机软件的名称及于手机应用商城中搜索应用软件的热度词,《关键词词典》中载入的任一关键词包括前缀及关键词本身;
所述步骤1中的《关键词词典》的具体创建步骤如下:
步骤1.1:打开储备文件,其中文件中存储有各个国家与地区的手机应用商城中关键词、关键词热度及关键词搜索结果,形成《关键词词典》:
步骤1.2:对于任意一个关键词,创建一个struct word_info存储其权重和搜索结果数,并将成员变量tag设置成true以代表这是一个关键词;
步骤1.3:将步骤1.2中关键词的所有前缀也存入《关键词词典》以便在之后的递归中找到该关键词,同时创建前缀的word_info,并将权重及搜索结果数均设置为0,tag设置成false以代表这是关键词的前缀;
步骤2:切词处理,通过《切词词典》对输入的文本字符串进行切词处理,记录字符串被切词后产生的多个分词:
步骤3:各分词对比,运用递归对切好的每个分词于《关键词词典》进行对比,得到每个分词的权重及搜索结果数;
所述步骤3中利用《切词词典》切好的分词以pairstring,int的形式保存在map1里的,具体步骤如下:
步骤3.1: map1中存储了输入的分词及其重复数,进而每拿出一个分词,就将其重复数减一,若重复数为0,则将这个分词从map1中删去;
步骤4:组词对比,多个分词中一个分词与任意另外一分词进行组合,形成组合词,在将组合词于《关键词词典》中进行递归的对比,得到组合词的权重及搜索结果数;组合词再与任意另外一分词进行拼接组合,进而再对组合后的词语于《关键词词典》中进行递归的对比,直至拼接至切好分词中最后一个,则完成组对比,从而获得出拼接而得词语的权重及搜索结果数,以进行筛选优化处理;
所述步骤4包括对组合词的对比的具体步骤4.1如下:
步骤4.1.1:利用for循环,分别从map1中拿出下一个分词和步骤3.1的分词作组合,形成组合词,如果拼接好的词存在《关键词词典》中,则进入下一层,否则继续循环;
步骤4.1.2:若步骤4.1.1组合词在《关键词词典》中,则将这个组合词传入下一层与其他分词拼接,进而每一层都通过for循环将所有剩下分词分别拼接到当前拼接词末尾,直到当前所拼接的词不在《关键词词典》中或者map1中剩下词为0,则返回;
步骤4.1.3:如果当前所拼接的组合词在《关键词词典》中并且tag为true,记录这个词的权重和搜索结果数,以pairstring, word_info的形式存储于map2中,并更新组成拼接词的所有词的可覆盖列表;
步骤4.1.4:当循环结束,输出map2中的总覆盖关键词及其热度和搜索结果数,同时按照热度倒排;
所述步骤4还包括一步骤4.2:更新输入词的可覆盖列表,且具体步骤如下:
步骤4.2.1:每个存储在map1里的词都有一个set存储这个输入词可以覆盖的关键词列表,即可以通过这个输入词组成的词;
步骤4.2.2:当在深度优先的遍历中找到一个拼接后词存在于《关键词词典》中并且tag为true,将此分词存储到组成这个拼接后词的所有输入词的set中;
步骤4.2.3:输出所有输入词的可覆盖信息;
所述步骤4.2.3中具体步骤如下:
步骤4.2.3.1:计算每个输入词的可覆盖列表中,所有词的个数count简称覆盖词;
步骤4.2.3.2:计算覆盖词的平均权重ave_hot;
步骤4.2.3.3:计算覆盖词的平均搜索结果数ave_result;
步骤4.2.3.4:以json形式输出覆盖词,ave_hot,ave_result及count;
步骤4.2.3.5:排序时按照公式ave_hot* count /(总关键词可覆盖列表的个数)倒排。
2.根据权利要求1所述覆盖式优化设置关键字的方法,其特征在于:所述步骤4还包括优化及删去重复的词的步骤如下:
步骤4.3:通过最初的map1输出重复数大于1的输入词,以便开发商优化及删去重复的词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于施少杰,未经施少杰许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711092580.1/1.html,转载请声明来源钻瓜专利网。