[发明专利]翻译文件的拆分和分配方法有效
申请号: | 201210085140.4 | 申请日: | 2012-03-28 |
公开(公告)号: | CN102622340A | 公开(公告)日: | 2012-08-01 |
发明(设计)人: | 张马成;王兴强;伍华;杨明;王小龙 | 申请(专利权)人: | 成都优译信息技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/28 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 谢敏 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 翻译 文件 拆分 分配 方法 | ||
技术领域
本发明涉及一种办公文件拆分和分配方法,具体涉及翻译文件的拆分和分配方法。
背景技术
对于现在的社会,国际交上的交流成家常便饭。随之带来的翻译量越来越大,文件字数越来越多。
以现在CAT技术的流行,翻译速度大大提升。但是在翻译前的准备过程往往占据了相当长的时间。例如对于翻译公司来说,一份约3万字的文件分别给10个人做,在前期需要用时半天甚至更久的时间来完成文件拆分和分配。更严重的事,犹豫文字过多,很容易导致分割时视觉混淆导致拆分有误。许多文件中会有很多段落是完全相同的,这样翻译只是多了一些无用的事。这样无形的增加了翻译成本。
而目前市面上所有的拆分工具器目的是为了将文件化整为零,方便携带,其算法按字节流分割。此方法对文字的分割基本是无用的。所以翻译界在翻译文字过多文件时往往需要多个人同时进行翻译,翻译前都会花大量时间用于文字的拆分。
发明内容
本发明克服了现有技术的不足,提供一种对需要翻译的文件进行拆分和分配的方法,该方法将多种办公文件按段算字数的方法直接拆分成指定份数,再分发给译员进行翻译,而且在拆分之前先对是否有隐藏文件进行处理,该方法从文件的分割,隐藏相同段落,到分配可以将整个时间减少到3-10分钟。这样就提高了翻译效率,避免了重复翻译,解决了现有技术中存在的技术问题。
为解决上述的技术问题,本发明采用以下技术方案:
一种翻译文件的拆分和分配方法,包括以下步骤:
步骤1,开始;
步骤2,导入文件;
步骤3,进行处理前需要的参数设置或采用默认设置,包括设置误差值D;
步骤4,预处理,得到导入文件格式,打开文件,检测里面的内容,分析出可分成的份数 ;
步骤5,判断用户是否需要隐藏相同段落,如果是进入步骤6,如果不是直接进入步骤7;
步骤6:遍历文件找出相同段落,去除相同段落;
步骤7:根据步骤4或步骤6的处理后得到的可拆分份数进行选择,确定分成的份数为N;
步骤8:导出拆分文件选择路径;
步骤9:根据用户所选份数N和用户自定义参数设置或默认参数设置进行拆分,根据误差百分比进行以段为主,字数为辅的拆分法,具体包括:
步骤9-1,算出总字数M和找出总段数G,用总字数除以份数得到平均字数A;
步骤9-2,拆分出第一份:依次遍历第一至第G段,从第一段开始,若第一段的字数大于或等于A-A*D,则将第一段作为第一份拆分出来,若第一段的字数小于A-A*D,则计算第一段和第二段的总字数,若总字数次大于或等于A-A*D,则将第一、二段作为第一份拆分出来,若不是,则再计算第一、第二、第三段的总字数……直到各段总字数满足大于或等于A-A*D,就可以将第一份拆分出来;
步骤9-3,拆分出第二份:依次遍历步骤9-2拆分之后余下的段落,从余下的第一段开始,若余下第一段的字数大于或等于A-A*D,则将余下的第一段作为第一份拆分出来,若余下的第一段的字数小于A-A*D,则计算余下的第一段和余下的第二段的总字数,若总字数大于或等于A-A*D,则将余下的第一、二段作为第一份拆分出来,若不是,则再计算余下的第一、第二、第三段的总字数……直到各段总字数满足大于或等于A-A*D,就可以将第二份拆分出来;
步骤9-4,拆分出第三份:依次遍历步骤9-3拆分之后余下的段落,从余下的第一段开始,若余下第一段的字数大于或等于A-A*D,则将余下的第一段作为第一份拆分出来,若余下的第一段的字数小于A-A*D,则计算余下的第一段和余下的第二段的总字数,若总字数大于或等于A-A*D,则将余下的第一、二段作为第一份拆分出来,若不是,则再计算余下的第一、第二、第三段的总字数……直到各段总字数满足大于或等于A-A*D,就可以将第三份拆分出来;
……
以此类推直至步骤9-N, 拆分出第N-1份:依次遍历步骤9-N-2拆分之后余下的段落,从余下的第一段开始,若余下第一段的字数大于或等于A-A*D,则将余下的第一段作为第一份拆分出来,若余下的第一段的字数小于A-A*D,则计算余下的第一段和余下的第二段的总字数,若总字数大于或等于A-A*D,则将余下的第一、二段作为第一份拆分出来,若不是,则再计算余下的第一、第二、第三段的总字数……直到各段总字数满足大于或等于A-A*D,就可以将第N-1份拆分出来;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都优译信息技术有限公司,未经成都优译信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210085140.4/2.html,转载请声明来源钻瓜专利网。