[发明专利]翻译文件的拆分和分配方法有效
申请号: | 201210085140.4 | 申请日: | 2012-03-28 |
公开(公告)号: | CN102622340A | 公开(公告)日: | 2012-08-01 |
发明(设计)人: | 张马成;王兴强;伍华;杨明;王小龙 | 申请(专利权)人: | 成都优译信息技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/28 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 谢敏 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 翻译 文件 拆分 分配 方法 | ||
1.一种翻译文件的拆分和分配方法,其特征在于:包括以下步骤:
步骤1,开始;
步骤2,导入文件;
步骤3,进行处理前需要的参数设置或采用默认设置,包括设置误差值D;
步骤4,预处理,得到导入文件格式,打开文件,检测里面的内容,分析出可分成的份数最大值;
步骤5,判断用户是否需要隐藏相同段落,如果是进入步骤6,如果不是直接进入步骤7;
步骤6:遍历文件找出相同段落,去除相同段落;
步骤7:根据步骤4或步骤6的处理后得到的可拆分份数进行选择,确定需要拆分成的份数N;
步骤8:导出拆分文件选择路径;
步骤9:根据用户所选的需要拆分成的份数N和用户自定义参数设置或默认参数设置进行拆分,根据误差值D进行以段为主,字数为辅的拆分法,具体包括:
步骤9-1,算出总字数M和找出总段数G,用总字数除以份数得到平均字数A;
步骤9-2,拆分出第一份:依次遍历第一至第G段,从第一段开始,若第一段的字数大于或等于A-A*D,则将第一段作为第一份拆分出来,若第一段的字数小于A-A*D,则计算第一段和第二段的总字数,若总字数次大于或等于A-A*D,则将第一、二段作为第一份拆分出来,若不是,则再计算第一、第二、第三段的总字数……直到各段总字数满足大于或等于A-A*D,就可以将第一份拆分出来;
步骤9-3,拆分出第二份:依次遍历步骤9-2拆分之后余下的段落,从余下的第一段开始,若余下第一段的字数大于或等于A-A*D,则将余下的第一段作为第一份拆分出来,若余下的第一段的字数小于A-A*D,则计算余下的第一段和余下的第二段的总字数,若总字数大于或等于A-A*D,则将余下的第一、二段作为第一份拆分出来,若不是,则再计算余下的第一、第二、第三段的总字数……直到各段总字数满足大于或等于A-A*D,就可以将第二份拆分出来;
步骤9-4,拆分出第三份:依次遍历步骤9-3拆分之后余下的段落,从余下的第一段开始,若余下第一段的字数大于或等于A-A*D,则将余下的第一段作为第一份拆分出来,若余下的第一段的字数小于A-A*D,则计算余下的第一段和余下的第二段的总字数,若总字数大于或等于A-A*D,则将余下的第一、二段作为第一份拆分出来,若不是,则再计算余下的第一、第二、第三段的总字数……直到各段总字数满足大于或等于A-A*D,就可以将第三份拆分出来;
……
以此类推直至步骤9-N, 拆分出第N-1份:依次遍历步骤9-N-2拆分之后余下的段落,从余下的第一段开始,若余下第一段的字数大于或等于A-A*D,则将余下的第一段作为第一份拆分出来,若余下的第一段的字数小于A-A*D,则计算余下的第一段和余下的第二段的总字数,若总字数大于或等于A-A*D,则将余下的第一、二段作为第一份拆分出来,若不是,则再计算余下的第一、第二、第三段的总字数……直到各段总字数满足大于或等于A-A*D,就可以将第N-1份拆分出来;
步骤9-N+1,如果余下段落数目大于零,则将余下的段落拆分成第N份并进入步骤10;如果当进行完步骤9-N后,余下段落数目为零时,则提示客户由于总字数和总段数过少,需要回到步骤3将调整误差值D调大,之后再回到步骤9-1重新开始至步骤9-N+1,直至满足拆成N份为止再进入步骤10;
步骤10,将拆分好的文件保存到用户指定的路径。
2.根据权利要求1所述的翻译文件的拆分和分配方法,其特征在于:所述的误差值D的选择范围为4%——40%,当文件字数越多时,误差值就越小,而当文件字数越少时,误差值D应越大。
3.根据权利要求1所述的翻译文件的拆分和分配方法,其特征在于:所述的步骤9-N+1中,若余下段落的总字数低于平均字数的4%时,则提示客户拆分数量过分不均,需要将调整误差值D调大,之后再回到步骤9-1重新开始步骤9-1至步骤9-N+1,直至满足拆成的第N份大于或等于平均字数的4%为止。
4.根据权利要求1所述的翻译文件的拆分和分配方法,其特征在于:所述的总字数包括标点和文字。
5.根据权利要求1所述的翻译文件的拆分和分配方法,其特征在于:所述的总字数仅包括文字,不包括标点。
6.根据权利要求2所述的翻译文件的拆分和分配方法,其特征在于:所述的误差值D=70/A-N/G/10,若算出来的D小于4%,则将D设置为4%,若算出来的D大于40%,则将D设置为40%。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都优译信息技术有限公司,未经成都优译信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210085140.4/1.html,转载请声明来源钻瓜专利网。