[发明专利]一种标签自动提取方法和系统无效
申请号: | 201110440739.0 | 申请日: | 2011-12-23 |
公开(公告)号: | CN103177036A | 公开(公告)日: | 2013-06-26 |
发明(设计)人: | 陈运文;宋海涛;刘作涛 | 申请(专利权)人: | 盛乐信息技术(上海)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 逯长明;王宝筠 |
地址: | 201203 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及网络技术领域,特别是一种标签自动提取方法和系统,所述方法包括:抓取中文词汇和训练网页,分别生成中文词典和训练样本库;根据所述中文词典和所述训练样本库中的训练网页生成训练分类模型;根据所述中文词典和训练分类模型对待提取网页进行标签提取,生成标签。本发明实施例通过定期抓取中文词汇和训练网页,生成中文词典和训练样本库,并利用训练样本库中的训练网页生成训练模型,并利用训练模型以及中文词典对待提取网页自动进行标签提取,提取的标签结果准确,效率高。 | ||
搜索关键词: | 一种 标签 自动 提取 方法 系统 | ||
【主权项】:
一种标签自动提取方法,其特征在于,所述方法包括:抓取中文词汇和训练网页,分别生成中文词典和训练样本库;根据所述中文词典和所述训练样本库中的训练网页生成训练分类模型;根据所述中文词典和训练分类模型对待提取网页进行标签提取,生成标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盛乐信息技术(上海)有限公司,未经盛乐信息技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110440739.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种安全钳和限速器的联动结构
- 下一篇:超薄型电梯显示器