[发明专利]基于贝叶斯的模糊c均值算法实现搜索引擎关键词优化在审
申请号: | 201710268840.X | 申请日: | 2017-04-23 |
公开(公告)号: | CN107016121A | 公开(公告)日: | 2017-08-04 |
发明(设计)人: | 金平艳 | 申请(专利权)人: | 四川用联信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610054 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 贝叶斯 模糊 均值 算法 实现 搜索引擎 关键词 优化 | ||
1.基于贝叶斯的模糊c均值算法实现搜索引擎关键词优化,本发明涉及语义网络技术领域,具体涉及基于贝叶斯的模糊c均值算法实现搜索引擎关键词优化,
其特征是,包括如下步骤:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:
这里相关关键词个数为m,既有下列矩阵:
、、、、依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数再降维
为四维,即
为搜索效能,为价值率,即为下式:
步骤4:基于贝叶斯的模糊c均值算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于领域的k-means算法初始化为c类
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件
步骤4.3:初始化每个领域的概率分布,构建c类总目标函数,综合隶属约束条件,构建m个方程组,对其进行求解,即可得聚类结果
步骤4.4:根据上式、、的收敛性,重新计算各簇中心
步骤4.5:如果发生变化,则转到步骤4.2,重新计算隶属矩阵J,否则迭代结束,输出聚类结果
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
2.根据权利要求1中所述的基于贝叶斯的模糊c均值算法实现搜索引擎关键词优化,其特征是,以上所述步骤4中的具体计算过程如下:
步骤4:基于贝叶斯的模糊c均值聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于领域的k-means算法初始化为c类
步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件;其具体计算过程如下:
根据领域初始化数据对象集合D划分为C类;
初始化隶属矩阵J为:
为关键词i属于j类的程度系数,即、
隶属的整个约束条件为:
步骤4.3:初始化每个领域的概率分布,构建c类总目标函数,综合隶属约束条件,构建m个方程组,对其进行求解,即可得聚类结果,其具体计算过程如下:
上式为关键词,为j类
上式为类j中心向量,为数据对象集合的全局最优位置,为k类的概率,n总数据对象个数,为j类簇中数据对象个数
综合隶属约束条件,构建m个方程组:
是m个约束式的拉格朗日算子,对上述式子进行求导,对所有输入参量求导,即可求得使达到最大的必要条件、:
上式为关键词i所对应的向量;
步骤4.4:根据上式、、的收敛性,重新计算各簇中心,其具体计算过程如下:
当收敛于一定值时,就收敛一定值,进而收敛于一定值,则找到了最佳聚类结果,否则没有找到
步骤4.5:如果发生变化,则转到步骤4.2,重新计算隶属矩阵J,否则迭代结束,输出聚类结果
基于贝叶斯的模糊c均值聚类算法的具体结构流程如图2 。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川用联信息技术有限公司,未经四川用联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710268840.X/1.html,转载请声明来源钻瓜专利网。