[发明专利]基于决策树算法的SEO关键词竞争程度计算方法无效
申请号: | 201210411604.6 | 申请日: | 2012-10-24 |
公开(公告)号: | CN102968447A | 公开(公告)日: | 2013-03-13 |
发明(设计)人: | 朱欣娟;谭志强 | 申请(专利权)人: | 西安工程大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 张瑞琪 |
地址: | 710048 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 决策树 算法 seo 关键词 竞争 程度 计算方法 | ||
技术领域
本发明涉及一种SEO领域中的关键词竞争程度计算方法,特别是基于决策树算法的SEO关键词竞争程度计算方法。
背景技术
关键词是浏览者在搜索引擎中查找信息时输入的词语,这些关键词在SEO(Search Engine Optimization,搜索引擎优化)中扮演着重要的角色,选择合理的关键词才能够迎合用户特定的搜索目标。只有选择正确的关键词,才能使网站SEO走在正确的大方向上。确定什么样的关键词决定了网站内容规划、链接建设等重要后续步骤。但是现有的SEO关键词计算方法基本都是定性描述的,如很多文献给出了关键词选择的准则,归纳有以下几点:①关键词不能过于宽泛;②关键词不要过于冷门;③要符合用户的搜索习惯;④可以将地理位置、形容词类的关键词与提供产品或者服务的关键词名称合并,形成长尾关键词竞争度会更强等。采用定性方法进行SEO关键词分析,很大程度上需要凭借SEO人员的经验进行,准确度不高。因此,如何快速、准确地对SEO关键词竞争度进行量化分析,成为SEO人员迫切需要解决的重要问题。
发明内容
本发明的目的是提供一种基于决策树算法的SEO关键词竞争程度计算方法,克服了人工凭借经验进行SEO关键词竞争程度计算效率低、准确性差的问题。
本发明所采用的技术方案是:基于决策树算法的SEO关键词竞争程度计算方法,包括以下步骤:
(1)选取关键词搜索结果数量P1、使用intitle指令搜索得到的结果页面数P2、搜索结果是否存在付费推广P3、搜索结果第一页中网站内页数P4、关键词在搜索结果第一页标题中出现的次数P5、关键词长度P6作为关键词竞争程度C的影响因素;
(2)训练数据集的生成:按照“关键词,P1,P2,P3,P4,P5,P6,C”为一条优化数据记录,整理历史优化数据,并对相应的属性进行概化,形成训练数据集;
(3)根据训练数据集构建决策树:以P1-P6为非类别属性,以C为类别属性,采用C4.5算法构建出相应的决策树,该决策树等价于一系列规则;
(4)应用决策树进行关键词竞争程度分析:将待决策的SEO关键词数据引入到上述决策树中去,并计算出相应的分析结果。
所述步骤(2)的属性值概化方法如下:
将P1属性概化为四个区间,即:{S1:[0,50万),S2:[50万,100万),S3:[100万,300万),S4:[300万,10000万)};
将P2属性概化为三个区间,即:{T1:[0,10万),T2:[10万,50万),T3:[50万,100万),T4:[100万,1000万)};
将P4属性概化为两个区间,即:{U1:[0,5),U2:[5,10]};
将P5属性概化为三个区间,即:{V1:[0,3),V2:[3,6),V3:[6,10]};
将P6属性概化为四个区间,即:{W1:[0,6),W2:[6,10),W3:[10,20)};
按搜索结果是否存在付费推广P3可划分为:Y(存在);N(不存在);
C分为四个级别:“竞争很强”,“竞争较强”,“竞争较小”,“竞争很小”。其中“竞争很强”指的是由于该关键词竞争激烈,只能优化该关键词为35名之后;“竞争较强”是指优化关键词排名在15至35,“竞争较小”是指将关键词优化到4至12名,“竞争很小”是该关键词能够优化到搜索引擎检索结果的前3名。
所述步骤(3)中C4.5算法是一种贪心算法,即选择最优的一个属性作为下一阶段的检测属性,具体过程如下:
1)以P1-P6为非类别属性,以C为类别属性,根据信息增益率公式,计算出当前信息增益率最大的属性;
2)将该属性作为树的根节点;
3)根据该属性值的个数将训练表中的数据分为相应的分支;
4)对于每个分支,重复1)-3)的过程,直到所有的数据都用光为止;
5)将1)-4)过程中找到的属性连起来,就是一个决策树,叶子节点上是“竞争很强”,“竞争较强”,“竞争较小”,“竞争很小”这四个类别值。
所述步骤(4)还包括以下步骤:
a).记录需要预测的关键词,获取其对应的影响因素P1-P6的值,P1-P6的获取可以通过在搜索引擎中输入关键词,查看搜索结果的各项指标的形式完成;
b).将记录中与决策树根对应的属性值检索出来,并与决策树根属性的值进行比较,根据比较的结果决定下一层分支点的属性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安工程大学,未经西安工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210411604.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:氮氧传感器氧泵保护电路
- 下一篇:一种电子开关之短路保护电路