[发明专利]网络标签自动识别方法及其系统有效
申请号: | 201210140186.1 | 申请日: | 2012-05-08 |
公开(公告)号: | CN103389981B | 公开(公告)日: | 2018-01-05 |
发明(设计)人: | 邹维;曹越;杨俊松;赵隽;柳睿 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州华进联合专利商标代理有限公司44224 | 代理人: | 王茹,黄晓庆 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 标签 自动识别 方法 及其 系统 | ||
1.一种网络标签自动识别方法,其特征在于,包括以下步骤:
输入用户的待识别标签;
判断所述待识别标签对应的标签分类是否多于一个;
如果所述待识别标签对应的标签分类只有一个,则将所述待识别标签直接划分至对应的标签分类;
如果所述待识别标签对应的标签分类多于一个,则在记载所述待识别标签的源文本中搜索与各个所述标签分类相关的特征词;
根据所述特征词识别所述待识别标签的标签分类;
如果根据所述特征词不能识别所述待识别标签的标签分类,则进一步获取该用户的用户信息,所述用户信息包括用户的属性和用户的已有标签;根据所述用户信息进行用户关联性搜索,查找出具有与所述待识别标签相同的标签并且与该用户关联性最高的其他用户;
将所述其他用户已有的相同标签的标签分类识别为所述待识别标签的标签分类。
2.如权利要求1所述的网络标签自动识别方法,其特征在于,所述在记载所述待识别标签的源文本中搜索与各个所述标签分类相关的特征词的步骤包括:
根据所述标签对应的多个标签分类,分别在所述源文本中搜索与各个所述标签分类相关的特征词;
所述根据所述特征词识别所述待识别标签的标签分类的步骤包括:
根据每一所述特征词对相应的标签分类的权值,累计每一所述标签分类的总权值,将所述总权值最高的标签分类识别为所述待识别标签的标签分类。
3.如权利要求1所述的网络标签自动识别方法,其特征在于,所述在记载所述待识别标签的源文本中搜索与各个所述标签分类相关的特征词的步骤包括:
根据所述标签对应的多个标签分类,分别在所述源文本中搜索与各个所述标签分类相关的特征词;
所述根据所述特征词识别所述待识别标签的标签分类的步骤包括:
根据每一所述特征词对相应的标签分类的权值,累计每一所述标签分类的总权值,将所述总权值最高并且超过预设的权值门限的标签分类识别为所述待识别标签的标签分类。
4.如权利要求1至3任意一项所述的网络标签自动识别方法,其特征在于,如果根据关联性最高的其他用户的已有标签也不能识别所述待识别标签的标签分类,则进一步执行以下步骤:
获取所述待识别标签对应的所有标签分类,将统计匹配成功率最高的标签分类识别为所述待识别标签的标签分类。
5.一种网络标签自动识别系统,其特征在于,包括:
标签输入模块,用于输入用户的待识别标签;
第一判断模块,判断所述待识别标签对应的标签分类是否多于一个;
第一分类模块,用于在所述待识别标签对应的标签分类只有一个时,将所述待识别标签直接划分至对应的标签分类;
文本解析模块,用于在所述待识别标签对应的标签分类多于一个时,在记载所述待识别标签的源文本中搜索与各个所述标签分类相关的特征词;
第二分类模块,用于根据所述特征词识别所述待识别标签的标签分类;
用户关联模块,用于在所述第二分类模块不能识别所述待识别标签的标签分类时,获取该用户的用户信息,所述用户信息包括用户的属性和用户的已有标签;根据所述用户信息进行用户关联性搜索,查找出具有与所述待识别标签相同的标签并且与该用户关联性最高的其他用户;
第三分类模块,用于将所述其他用户已有的相同标签的标签分类识别为所述待识别标签的标签分类。
6.如权利要求5所述的网络标签自动识别系统,其特征在于:
所述文本解析模块根据所述标签对应的多个标签分类,分别在所述源文本中搜索与各个所述标签分类相关的特征词;
所述第二分类模块根据每一所述特征词对相应的标签分类的权值,累计每一所述标签分类的总权值,将所述总权值最高的标签分类识别为所述待识别标签的标签分类。
7.如权利要求5所述的网络标签自动识别系统,其特征在于:
所述文本解析模块根据所述标签对应的多个标签分类,分别在所述源文本中搜索与各个所述标签分类相关的特征词;
所述第二分类模块根据每一所述特征词对相应的标签分类的权值,累计每一所述标签分类的总权值,将所述总权值最高并且超过预设的权值门限的标签分类识别为所述待识别标签的标签分类。
8.如权利要求5至7任意一项所述的网络标签自动识别系统,其特征在于,第四分类模块,用于在所述第三分类模块不能识别所述待识别标签的标签分类时,获取所述待识别标签对应的所有标签分类,将统计匹配成功率最高的标签分类识别为所述待识别标签的标签分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210140186.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种油水井自生泡沫解堵剂及解堵工艺
- 下一篇:堵漏剂及其制备方法