[发明专利]稿件基因的选取方法、装置与电子设备有效
申请号: | 201811096577.1 | 申请日: | 2018-09-19 |
公开(公告)号: | CN109299738B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 张芃 | 申请(专利权)人: | 语联网(武汉)信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/06 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 430000 湖北省武汉市东湖开发区光谷软件*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 稿件 基因 选取 方法 装置 电子设备 | ||
1.一种稿件基因的选取方法,其特征在于,包括:
从备选稿件基因列表中,分别选取多组不同的基因,构成多个稿件基因组;
对于每一个所述稿件基因组,将该稿件基因组中的基因与译员基因进行多次匹配处理,获取多个匹配成功率样本,并基于所述多个匹配成功率样本,计算该稿件基因组对应的匹配成功率的均值和标准差;
选取所有所述均值中的最大者对应的稿件基因组,定义为最大稿件基因组,并将所述最大稿件基因组的所述均值定义为最大均值,将所述最大稿件基因组的所述标准差定义为最大标准差;
对于所有所述稿件基因组中除所述最大稿件基因组之外的每一个所述稿件基因组,基于该稿件基因组对应的所述均值和所述标准差,以及所述最大均值和所述最大标准差,计算该稿件基因组对应的Z值;
基于所有所述稿件基因组中除所述最大稿件基因组之外的每一个所述稿件基因组对应的所述Z值,从所有所述稿件基因组中选取满足设定条件的稿件基因组,并将所述满足设定条件的稿件基因组中的基因和所述最大稿件基因组中的基因合并,获取最终选取的稿件基因;
其中,所述Z值表示大样本差异性验证中Z值。
2.根据权利要求1所述的方法,其特征在于,在所述从备选稿件基因列表中,分别选取多组不同的基因的步骤之前,还包括:
分别从稿件的所有项目相关信息、稿件相关信息和过程相关信息中提取相应的基因,并对应形成稿件的项目相关基因、稿件相关基因和过程相关基因;
基于所述项目相关基因、稿件相关基因和过程相关基因,构成所述备选稿件基因列表。
3.根据权利要求1所述的方法,其特征在于,所述基于该稿件基因组对应的所述均值和所述标准差,以及所述最大均值和所述最大标准差,计算该稿件基因组对应的Z值的步骤进一步包括:
利用如下计算公式,计算所有所述稿件基因组中,除所述最大稿件基因组之外的每一个所述稿件基因组对应的所述Z值:
式中,Zi表示第i个稿件基因组对应的所述Z值,n表示每个稿件基因组对应的所述匹配成功率样本的个数,Ei表示第i个稿件基因组对应的所述均值,Si表示第i个稿件基因组对应的所述标准差,Emax表示所述最大均值,Smax表示所述最大标准差。
4.根据权利要求3所述的方法,其特征在于,所述基于所有所述稿件基因组中除所述最大稿件基因组之外的每一个所述稿件基因组对应的所述Z值,从所有所述稿件基因组中选取满足设定条件的稿件基因组的步骤进一步包括:
若所述多个匹配成功率样本符合正态分布,则根据预设置信度确定预设Z值,并剔除所述最大稿件基因组和Z值大于所述预设Z值的稿件基因组,以所有所述稿件基因组中剩余的稿件基因组作为所述满足设定条件的稿件基因组。
5.根据权利要求4所述的方法,其特征在于,在所述从所有所述稿件基因组中选取满足设定条件的稿件基因组的步骤之后,还包括:
若所有除所述最大稿件基因组之外的所述稿件基因组中,Z值不大于所述预设Z值的稿件基因组的数量小于预设阈值,则重新从所述备选稿件基因列表中选择多组基因,进行所述将该稿件基因组中的基因与译员基因进行多次匹配处理至所述获取最终选取的稿件基因之间的选取步骤。
6.根据权利要求1所述的方法,其特征在于,在所述将该稿件基因组中的基因与译员基因进行多次匹配处理,获取多个匹配成功率样本的步骤之前,还包括:
根据基因匹配精度需求,设定进行匹配处理的总次数阈值;
则相应的,对于每一个所述稿件基因组,提取的所述匹配成功率样本的个数不少于所述总次数阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811096577.1/1.html,转载请声明来源钻瓜专利网。