首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]根据浏览网页确定用户感兴趣的网页文本的方法和系统在审

申请号：	201310163619.X	申请日：	2013-05-06
公开（公告）号：	CN103235824A	公开（公告）日：	2013-08-07
发明（设计）人：	刘臻;吕琳媛;肖思源;刘润然;佘莉	申请（专利权）人：	上海河广信息科技有限公司
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	上海顺华专利代理有限责任公司 31203	代理人：	陈淑章
地址：	200433 上海市杨***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	根据浏览网页确定用户感兴趣文本方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种根据浏览网页URL确定用户感兴趣的相关网页文本的方法，其特征在于：包括步骤：

对一定时段内用户浏览的网页进行过滤处理，去除掉无用网页和某些无法访问的网页，对经过筛选剩下的URL地址进行链接，获得页面的文本内容，提取标题和文本信息；

按照预先定义的主题类别，为网页文档集合的每个网页文档确定一个类别；

对每个类进行访问频度统计，

访问频度值最高的网页集作为用户感兴趣的相关网页。

2.如权利要求1所述的一种根据浏览网页URL确定用户感兴趣的相关网页文本的方法，其特征在于：网页分类步骤中需要构建和训练网页分类器，输入训练文本集，通过文本表示和特征选择，根据特征词库构建分类器模型，输出为类似于树形结构的分类规则集，

网页分类器的训练过程即是对训练样本不断分组，通过建立目标变量关于各个输入变量的分类预测模型，全面实现输入变量和目标变量不同取值下的数据分组，进而用于对新数据对象的分类和预测。

3.如权利要求2所述的一种根据浏览网页URL确定用户感兴趣的相关网页文本的方法，其特征在于：网页分类器使用决策树分类方法，其步骤为：

①将测试样本表达成和训练样本同样的形式；

②t←决策树根结点；

③取决策树结点t的测试属性和阈值，将待测试样本对应特征的值与之比较，

然后根据t结点分裂的标准决定是

t←t的左孩子or t←t的右孩子；

④递归执行⑶，直到t为叶子结点；

⑤测试样本的类别为叶子t代表的类别。

4.如权利要求2所述的一种根据浏览网页URL确定用户感兴趣的相关网页文本的方法，其特征在于：网页分类步骤中，输入经过文本预处理模块处理过的待分类文本，通过文本表示，根据特征词库进行特征选择，与训练所生成的分类器模型的分类规则进行文本分类，输出为各文本所属类别信息。

5.如权利要求2或4所述的一种根据浏览网页URL确定用户感兴趣的相关网页文本的方法，其特征在于：文本表示步骤中，采用特征向量空间表示文本特征，文档i可以表示成如下公式的特征向量：

W_ij=(W_i1,W_i2,...,W_im)

其中，W_ij为词条j在文档i中出现频率f_ij的函数,直接使用词条在文档的出现频率作为特征值，计算公式为：

W_ij=f_ij。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海河广信息科技有限公司，未经上海河广信息科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310163619.X/1.html，转载请声明来源钻瓜专利网。

上一篇：燃气涡轮发动机燃料回流阀和系统
下一篇：安全门

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code