[发明专利]基于可变边界支撑向量机的重要信息获取方法有效

申请号：	200910219450.9	申请日：	2009-12-11
公开（公告）号：	CN101710392A	公开（公告）日：	2010-05-19
发明（设计）人：	张莉;郑小皇;王婷;冯骁;焦李成	申请（专利权）人：	西安电子科技大学
主分类号：	G06N5/00	分类号：	G06N5/00;G06F17/30
代理公司：	陕西电子工业专利中心 61205	代理人：	王品华;朱红星
地址：	710071***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于可变边界支撑向量重要信息获取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于可变边界支撑向量机的重要信息获取方法，包括：

搜集需求信息步骤；针对待评价信息对象，通过smart搜索引擎，按照查询需求，将需收集的信息提取成一个文本集合；

信息预处理步骤：利用文本集合的词频和逆向文件频率的t维原始特征t＞44，对文本集合进行特征提取，将这些提取的特征转换为45维数值特征向量，对这些特征向量进行降维，得到样本集(x_i，y_i)，i＝1.......n，x₁，…x_n是二维样本特征矢量，y_i为样本重要度标识，n为样本数；

信息评价模型的训练步骤：

将上步得到的样本集中的r个样本作为原始训练集r＜n，在原始训练集((x₁，y₁)，…，(x_r，y_r))中，由任意两个二维样本特征矢量形成对式样本若第一样本特征矢量的重要度标识大于第二样本特征矢量的重要度标识，则将对式样本标识为z_i＝1，反之z_i＝-1，构造出新的训练集：i＝1，2，…m，m＝O(n²)，m为新训练集样本数，为可变边界因子，体现了对式样本信息重要度的差异；

利用如下可变边界的支持向量机信息评价方法，对新的训练集进行训练，得到信息评价函数f(x)＝w·x，w为训练得到的权值参数，x为输入的二维样本特征矢量：

首先，输入训练样本集i＝1，2，…m；

然后，根据支持向量机理论，通过下式计算输入训练集的权值参数w：

w=Σi=1mdiziαi(xi(1)-xi(2)),]]>