[发明专利]一种基于DNA序列的文本处理方法和系统有效
申请号: | 201110079135.8 | 申请日: | 2011-03-30 |
公开(公告)号: | CN102200967A | 公开(公告)日: | 2011-09-28 |
发明(设计)人: | 张成岗;周扬;屈武斌 | 申请(专利权)人: | 中国人民解放军军事医学科学院放射与辐射医学研究所 |
主分类号: | G06F17/22 | 分类号: | G06F17/22;G06F17/27 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 黄健 |
地址: | 100850*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于DNA序列的文本处理方法和系统。该文本处理方法包括:为两个以上文本的字符分配DNA序列码,使用DNA序列处理方法对分配好DNA序列码的两个以上文本进行相似性分析,所述字符为数字、字、单词或符号中的一种或多种,所述字或单词为一个或多个语种的字或单词。为两个以上文本的字符分配DNA序列码包括:为两个以上文本中的字符分配十进制数,将所述十进制数转换为四进制数;使四进制数中的0、1、2、3分别对应四种脱氧核糖核酸中的一种,将四进制数转换为DNA序列码。本发明还提供了实现该方法的系统。本发明的方法和系统不依赖于已有数据库的建立,关键词的抽提,没有字符以及字符组合数目的限制,可对文本信息实现高效、全面的分析。 | ||
搜索关键词: | 一种 基于 dna 序列 文本 处理 方法 系统 | ||
【主权项】:
一种基于DNA序列的文本处理方法,其特征在于,包括:为两个以上文本的字符分配DNA序列码,其中文本中相同的字符分配相同的DNA序列码;使用DNA序列处理方法对分配好DNA序列码的两个以上文本进行相似性分析。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事医学科学院放射与辐射医学研究所,未经中国人民解放军军事医学科学院放射与辐射医学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110079135.8/,转载请声明来源钻瓜专利网。