[发明专利]一种微博用户位置的推测方法有效
申请号: | 201310260384.6 | 申请日: | 2013-06-26 |
公开(公告)号: | CN103324723B | 公开(公告)日: | 2016-11-02 |
发明(设计)人: | 徐明;王黠;任一支;张海平;徐建;郑宁 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杜军 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种微博用户位置的推测方法。该方法包括:位置特征词汇学习过程和微博用户位置推测过程两个部分。位置特征词汇学习过程包括:采集已填写位置信息的用户微博语料;提取语料中的名词;基于特征提取方法提取位置特征词汇并计算其相应的权值。微博用户位置推测过程包括:获取待推测用户的微博和互粉好友位置信息作为输入;提取得到用户微博地理词汇集和其互粉好友地理词汇集;计算用户微博地理词汇代表位置相应的权值;计算用户互粉好友地理词汇代表位置相应的权值;对位置词汇权值进行加权相加,将权值最高的位置词汇作为用户的推测位置输出。利用本发明的方法使微博用户位置推测更具有针对性,可以更准确地推测出微博用户的位置。 | ||
搜索关键词: | 一种 用户 位置 推测 方法 | ||
【主权项】:
一种微博用户位置的推测方法,所述的微博用户位置是指微博用户长期所在的省或市一级的地理位置;该方法包括:位置特征词汇学习过程和微博用户位置推测过程两个部分;所述的位置特征词汇是指代表省或市一级的地理位置显著特征或特色的词汇,其特征在于:所述的位置特征词汇学习过程包括:首先,采集那些已经填写具体所在位置信息的用户微博语料;其次,对采集的微博语料进行分词并且提取文本中的名词;最后,利用基于特征提取方法从名词中提取位置特征词汇并计算其中每个位置特征词汇相应的权值,根据权值从大到小选择词汇,每个位置选取若干个位置特征词汇;所述的微博用户位置推测过程包括:步骤1.获取待推测用户发布的微博和其互粉好友位置信息作为输入;步骤2.利用地理词汇对用户发布的微博和互粉好友位置信息分别进行地理词汇提取得到用户微博地理词汇集和其互粉好友地理词汇集;所述的地理词汇包括位置特征词汇和地名字典;步骤3.计算用户微博地理词汇集中地理词汇代表位置相应的权值,并得到用户微博位置集,该位置集包含位置词汇及其权值的二元组集合;步骤4.计算用户互粉好友地理词汇集中地理词汇代表位置相应的权值,并得到互粉好友位置集;步骤5.对用户微博位置集和互粉好友位置集中位置词汇权值进行加权相加,将权值最高的位置词汇作为用户的推测位置输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310260384.6/,转载请声明来源钻瓜专利网。