首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种维-汉文可比语料自动获取方法在审

申请号：	201711342028.3	申请日：	2017-12-14
公开（公告）号：	CN108153835A	公开（公告）日：	2018-06-12
发明（设计）人：	米尔夏提·力提甫;吐尔根·依布拉音;卡哈尔江·阿布都热西提;艾山·吾买尔;买合木提·买买提;瓦热斯·帕尔哈提;王路路;古丽尼格尔·阿不都外力	申请（专利权）人：	新疆大学
主分类号：	G06F17/30	分类号：	G06F17/30;G06K9/62
代理公司：	北京彭丽芳知识产权代理有限公司 11407	代理人：	彭丽芳
地址：	830046 新疆维***	国省代码：	新疆;65
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语料自动获取分类器待检测文本离线训练扩展性覆盖面实时性准确率表现
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种维-汉文可比语料自动获取方法，其特征在于，包括如下步骤：

获取多个维-汉文可比语料，采用Adaboost方法对BP神经网络进行离线训练，得到一个分类器；

通过分类器完成待检测文本内维-汉文可比语料的获取。

2.如权利要求1所述的一种维-汉文可比语料自动获取方法，其特征在于，所述分类器通过以下步骤获取：

S1、通过BP算法对所获取的多个维-汉文可比语料进行一次训练，生成学习器；

S2、采用Adaboost方法对所得学习器进行3次迭代，分别得到弱学习器l₁(x)、l₂(x)、l₃(x)，然后进行加权输出一个用于维-汉文可比语料预测的分类器。

3.如权利要求1所述的一种维-汉文可比语料自动获取方法，其特征在于，所述多个维-汉文可比语料为人工获取所得。

4.如权利要求1所述的一种维-汉文可比语料自动获取方法，其特征在于，所述Adaboost方法具体包括如下步骤：

(1)给定一个训练算法和训练集；

(2)初始化训练集中各个训练样本的分布，将初始时的样本分布设为均匀分布；

(3)根据训练样本的概率分布采集训练样本，得到一个弱学习器l_t(x)，其中，t为当前迭代次数；

(4)计算在当前得到的学习器下各训练样本的误差以及误差的平均值；

(5)计算当前学习器的权重；；

(6)调整下次迭代时的样本分布，对样本分布进行归一化处理，确保各样本的采样概率和为1；

(7)重复步骤(3)-(6)，直至迭代次数为T为止；

(8)将T个弱学习器的权重归一化之后加权结合，得到最终的分类器。

5.如权利要求1所述的一种维-汉文可比语料自动获取方法，其特征在于，包括如下步骤：

获取多个维-汉文可比语料，对所述多个维-汉文可比语料进行关键字的提取，通过BP算法对所获取的关键字进行一次训练，生成学习器；

采用Adaboost方法对所得学习器进行3次迭代，分别得到弱学习器l₁(x)、l₂(x)、l₃(x)，然后进行加权输出一个用于维-汉文可比语料预测的分类器；

通过分类器完成待检测文本内维-汉文可比语料的获取。

6.如权利要求1所述的一种维-汉文可比语料自动获取方法，其特征在于，所述关键字为人工标注所得。

7.如权利要求1所述的一种维-汉文可比语料自动获取方法，其特征在于，所述多个维-汉文可比语料通过数据挖掘模块获取，该数据挖掘模块连接有一挖掘算法编辑模块，用于进行各种维-汉文可比语料挖掘算法的编辑，从而实现多种维-汉文可比语料的获取。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于新疆大学，未经新疆大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201711342028.3/1.html，转载请声明来源钻瓜专利网。

上一篇：一种商业智能应用查询数据的方法、装置及电子设备
下一篇：一种时序数据访问系统及方法

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top