[发明专利]生态种养系统中昆虫智能界定算法有效
申请号: | 202010331676.4 | 申请日: | 2020-04-24 |
公开(公告)号: | CN111444984B | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 金倩;姜帆;王飞飞;张智慧;王夏雯;王信海 | 申请(专利权)人: | 江苏省农业科学院宿迁农科所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/12 |
代理公司: | 宿迁市永泰睿博知识产权代理事务所(普通合伙) 32264 | 代理人: | 丁雪 |
地址: | 223800 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生态 系统 昆虫 智能 界定 算法 | ||
本发明公开了一种生态种养系统中昆虫智能界定算法,采用轮廓阴影聚类算法,本算法不依赖事先构建的数据库和Yule模型,能够自主进行物种划分,与现有技术相比(jMOTU算法、ABGD算法、GMYC模型算法),本技术提出的轮廓阴影聚类算法克服了阈值划分的主观性,不需要进行系统发育重建和先验推断,结合遗传算法,直接基于分子信息进行昆虫智能界定。
技术领域
本发明涉及智能算法,具体涉及一种生态种养系统中昆虫智能界定算法。
背景技术
昆虫作为生态种养系统中重要组成部分,是食物链和食物网的重要一环。然而因其个体小,种类和数量繁多,对其进行大空间尺度、长时间实时监测显得尤其困难,基于DNA条形码快速识别技术为解决该问题提供了新的思路。
作为监督式学习范畴的DNA条形码技术,DNA序列信息仅仅被用来与经典的形态分类建立关联,与未知DNA序列最相近的数据库内的物种就被定义为未知DNA序列,这种方法识别物种的准确性很大程度上依赖于数据库中相关类群的取样情况。因此,当数据库中信息不全时,大量新标本迫切需要快速地“再鉴定”,这个需求一方面固然突出了分类学家的重要作用,但另一方面也让分类学家陷入了大量简单重复劳动中,从而无暇顾及许多更重要的创造性的研究工作,从某种程度上来讲,DNA条形码的介入并没有减轻分类学家的负担,相反加重了分类学家的负担。
能否直接利用分子本身的信息对群落内的物种多样性进行评估?即不依赖事先建立的数据库,直接基于分子信息有效界定物种。jMOTU算法(Jones et al.,2011)、ABGD算法(Puillandre et al.,2012)、GMYC模型(Pons et al.,2006b)、基于Bayesian模型(Yangand Rannala,2010)等方法的相继提出,试图解决物种界定问题,但各自都存在一定的局限性:
(1)阈值划分较为主观:jMOTU算法采用分子序列差异阈值(Cutoff value)划分MOTU,最终结果由用户根据图形出现平台期来确定,较为主观;
(2)先验推断依赖性强:ABGD算法对于最近成种事件较为敏感,而且必须进行先验推断,若没有先验知识则无法对物种进行正确划分;
(3)超度量树影响较大:GMYC算法主要用于单分子的MOTU界定,也有学者在尝试用于多分子的界定,但效果还不稳定,而且该方法严重依赖Yule模型,对大数据集所有序列进行系统发育重建时,速度也较慢;
(4)计算效率较低:基于Bayesian模型能进行多分子的MOTU界定,但对计算的要求高,目前只能运用在小规模的数据集上。
发明内容
本申请针对背景技术中的问题,研究了一种生态种养系统中昆虫智能界定算法,提出无导师的学习算法,进行自主的物种划分。
为实现上述目的,本发明采用如下技术方案:
生态种养系统中昆虫智能界定算法,采用轮廓阴影聚类算法,具体包括以下步骤:
(1)设群落内含有K个物种:sp1,sp2,sp3,…,spk,每个物种内含有n条序列,n=1,2,3...,i,...,序列i属于sp1,除了i以外sp1还包含其他序列;a(i)表示种内差异,等于序列i到sp1内所有序列距离的平均值;d(i,spk)等于序列i到spk内所有序列的距离,选择d(i,spk)中最小的距离作为b(i),
(2)每条序列i通过如下公式计算得到s(i),然后将所有序列得到的s(i)值进行排序并绘制轮廓阴影图,选择最优的物种界定聚类结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏省农业科学院宿迁农科所,未经江苏省农业科学院宿迁农科所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010331676.4/2.html,转载请声明来源钻瓜专利网。