首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种文本训练方法和分类方法无效

申请号：	200810225033.0	申请日：	2008-10-24
公开（公告）号：	CN101727463A	公开（公告）日：	2010-06-09
发明（设计）人：	谭松波;许洪波;程学旗	申请（专利权）人：	中国科学院计算技术研究所
主分类号：	G06F17/30	分类号：	G06F17/30;G06K9/62
代理公司：	北京泛华伟业知识产权代理有限公司 11280	代理人：	王勇
地址：	100190 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文本训练方法分类
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种文本训练方法，包括下列步骤：

1)计算每类训练样本集的中心向量；

2)根据训练样本集的中心向量对所述训练样本集中的样本进行分类；

3)对分类不正确的样本，根据设定的拉近权dragweight和推远权pushweight修正所述分类不正确的样本的所属类别A的中心向量或/和被错分到的类别B的中心向量。

2.根据权利要求1所述的方法，其特征在于，所述步骤3)包括：

31)对样本向量d中特征l的权重d_l大于0的情况，根据公式对所述分类不正确的样本的所属类别A的中心向量进行修正，其中C^S表示类别的中心向量，o表示迭代步数；

32)如果根据公式对所述C_A，l^S，o+1进行归一化，其中C^N表示将所述C^S归一化后的中心向量。

3.根据权利要求1所述的方法，其特征在于，所述步骤3)包括：

33)对样本向量d中特征l的权重d_l大于0的情况，根据公式对所述分类不正确的样本被错分到的类别B的中心向量进行修正，其中C^S表示类别的中心向量，o表示迭代步数；

34)如果根据公式对所述C_B，l^S，o+1进行归一化，其中C^N表示将所述C^S归一化后的中心向量。

4.根据权利要求3所述的方法，其特征在于，所述步骤33)还包括：

331)如果所述C_B，l^S，o+1小于0，则将C_B，l^S，o+1置为0。

5.根据权利要求2所述的方法，其特征在于，所述步骤3)还包括：

33)对样本向量d中特征l的权重d_l大于0的情况，根据公式对所述分类不正确的样本被错分到的类别B的中心向量进行修正，其中C^S表示类别的中心向量，o表示迭代步数；

34)如果根据公式对所述C_B，l^S，o+1进行归一化，其中C^N表示将所述C^S归一化后的中心向量。

6.根据权利要求5所述的方法，其特征在于，所述步骤33)还包括：

331)如果所述C_B，l^S，o+1小于0，则将C_B，l^S，o+1置为0。

7.根据权利要求1所述的方法，其特征在于，所述拉近权dragweight是1.0。

8.根据权利要求1所述的方法，其特征在于，所述推远权pushweight是1.0。

9.根据权利要求1所述的方法，其特征在于，所述步骤2)和步骤3)执行迭代步数的最大值次。

10.根据权利要求9所述的方法，其特征在于，所述迭代步数的最大值的取值范围是[5，8]。

11.一种文本分类方法，包括下列步骤：

根据权利要求1至10任一项所述的文本训练方法所得到的中心向量对新文本进行分类。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所，未经中国科学院计算技术研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200810225033.0/1.html，转载请声明来源钻瓜专利网。

上一篇：获取别称匹配对的方法及装置
下一篇：图像处理方法和设备

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top