[发明专利]一种行业应用软件词根表的分类进退方法有效
申请号: | 201310077358.X | 申请日: | 2013-03-12 |
公开(公告)号: | CN103116658A | 公开(公告)日: | 2013-05-22 |
发明(设计)人: | 左春;张正;庞朴;魏萍 | 申请(专利权)人: | 中科软科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 余长江 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 行业 应用软件 词根 分类 进退 方法 | ||
1.一种行业应用软件词根表的分类进退方法,其步骤为:
1)在词根表数据库中建立一当前库和一历史库,将当前库中的词根按照递进分类方法进行分组,每一分组设有一最大容量值;
2)当一新词根需要加入词根表时,根据词根的适合系数确定其所对应的分组Ti,将其添加到该分组Ti并自动补充该词根的属性;
3)如果该Ti分组中词根总数超过其最大容量值ki,则进行降级操作:将该分组Ti中所有词根按适合系数排序,适合系数最小的词根进入其前一分组Ti-1;
4)依次触发降级操作直到某一分组中的词根总数未超过其最大容量值,如果适合系数最低分组T1发生降级,则将分组T1中适合系数最小词根移到历史库。
2.如权利要求1所述的方法,其特征在于根据词根的适合系数将词根表划分为当前库和历史库;将词根表数据库中的词根按照适合系数进行排序,将排序靠前的N个词根放入当前库,剩余的词根进入历史库。
3.如权利要求1或2所述的方法,其特征在于所述递进分类方法为按照词根的使用频率将当前库中的词根分为具有递进关系的多个分组。
4.如权利要求3所述的方法,其特征在于所述分组的划分方法为:
1)根据实际业务中的数据字段名/数据表名,程序变量名/程序表名生成数据字典;
2)检索数据字典,确定词根表中每一词根的使用频率;
3)按照词根的使用频率从大到小的顺序,依次将词根表当前库中的词根分为k个使用频
率依次降低的分组(Tk、…,T2,T1),Ti分组的最大容量设为ki,∑ki=N。
5.如权利要求1或2所述的方法,其特征在于根据规范文件ACORD文件、金融术语文件、《精编英汉保险词典》、保险术语表和保险术语文件计算所述适合系数,其方法为:
51)检索保险术语表是否存在该词根英文名称,记为v1,存在则v1=1,反之则为0;
52)检索ACORD文件是否存在该词根英文名称,记为v2,存在则v2=1,反之则为0;
53)检索《精编英汉保险词典》,确认该词根英文名称的中文含义中是否有对应的中文名称,记为v3,存在则v3=1,反之则为0;
54)检索保险术语文件是否存在该词根中文名称,记为v4,存在则v4=1,反之则为0;
55)检索金融术语文件是否存在该词根中文名称,记为v5,存在则v5=1,反之则为0;
56)检索《精编英汉保险词典》,确认该词根中文名称的含义中是否有对应的中文含义,记为v6,,存在则v6=1,反之则为0;
57)计算该词根的适合系数fitness=α1v1+α2v2+α3v3+α4v4+α5v5+α6v6,其中,α1+α2+α3+α4+α5+α6=1。
6.如权利要求1或2所述的方法,其特征在于对所述当前库进行定期巡查更新,其方法为:首先定期检索数据字典,确认使用频率变化的词根;然后计算使用频率变化的词根的适合系数,根据适合系数将其插入到相应的目标分组;若目标分组中词根总数超过该分组的最大容量值,则触发降级操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科软科技股份有限公司,未经中科软科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310077358.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可变锤筛间隙粉碎机转子
- 下一篇:一种训练用篮球架