[发明专利]一种基于密度词聚类的微博推送方法及装置有效
申请号: | 201310090524.X | 申请日: | 2013-03-20 |
公开(公告)号: | CN103198103A | 公开(公告)日: | 2013-07-10 |
发明(设计)人: | 冯扬;姜贵彬;宋莉;刘莹莹;桑军 | 申请(专利权)人: | 微梦创科网络科技(中国)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于密度词聚类的微博推送方法及装置,用以解决现有技术中服务器压力大,浪费网络资源的问题。该方法服务器确定各词汇之间的词间距,据此确定核心词,并针对每个核心词划分词集,再采用OPTICS聚类算法对每个词集中的词汇进行聚类,得到若干个待合并词簇,然后对若干个待合并词簇进行合并得到已合并词簇,最后根据用户的兴趣词所在的已合并词簇以及待推送微博的内容推送待推送微博。上述方法在划分词集时可将具有概括性含义的词汇排除在划分的词集以外,而且聚类时不受初始值的影响,因此可提高聚类的准确性,服务器根据得到的已合并词簇可对待推送微博进行准确的推送,从而可以有效减小服务器压力,也节省了网络资源。 | ||
搜索关键词: | 一种 基于 密度 词聚类 推送 方法 装置 | ||
【主权项】:
一种基于密度词聚类的微博推送方法,其特征在于,包括:服务器根据各词汇的共现词集,确定各词汇之间的词间距;并根据各词汇之间的词间距确定核心词;以及针对确定的每个核心词,将与该核心词的词间距最小的N个词汇以及该核心词划分为一个词集,N为预设的第一数量;针对划分出的每个词集,采用OPTICS聚类算法对该词集中的词汇进行聚类,得到若干个待合并词簇;并根据得到的各待合并词簇中的词汇,对得到的各待合并词簇进行合并处理,得到已合并词簇;所述服务器根据用户的兴趣词所在的已合并词簇以及待推送微博的内容,推送所述待推送微博。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微梦创科网络科技(中国)有限公司,未经微梦创科网络科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310090524.X/,转载请声明来源钻瓜专利网。