[发明专利]一种程序文本的编码处理方法、装置以及存储介质在审
申请号: | 202110289407.0 | 申请日: | 2021-03-18 |
公开(公告)号: | CN113033150A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 刘均;李河金 | 申请(专利权)人: | 深圳市元征科技股份有限公司 |
主分类号: | G06F40/126 | 分类号: | G06F40/126;G06F40/151 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 厉洋洋 |
地址: | 518000 广东省深圳市龙*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 程序 文本 编码 处理 方法 装置 以及 存储 介质 | ||
本申请公开了一种程序文本的编码处理方法、装置以及存储介质,用于提高多语言文本库的构建效率。本申请方法包括:获取目标程序的目标文本;根据目标文本的特征信息确定目标文本的结构信息;根据结构信息确定目标文本的目标编码;利用目标编码对目标文本进行编码转化,得到转换文本;判断转换文本与目标文本是否一致;根据判断结果对转换文本进行处理。
技术领域
本申请涉及数据处理领域,尤其涉及一种程序文本的编码处理方法、装置以及存储介质。
背景技术
软件的多语言一般都是基于多语言文本库来实现的,多语言文本库包含了多国语言对应的文本,不同国家的语言往往编码格式不同,例如有UTF-8、UTF-16以及GBK2312等。
现有技术提供的方案中,在构建多语言文本库时,一般是通过人工进行整理的,文本在复制粘贴的过程中很容易造成编码混乱。现有技术中程序在加载多语言文本库时,会在显示界面显示相应语言文本,这些语言文本都是按照固定的编码格式去加载解析的,如果一条文本包含有多种编码,那么在构建多语言文本库时容易造成编码混乱,导致多语言文本库构建效率低下。
发明内容
为了解决上述技术问题,本申请提供了一种程序文本的编码处理方法、装置以及存储介质,用于用于提高多语言文本库的构建效率。
本申请第一方面提供了一种程序文本的编码处理方法,所述方法包括:
获取目标程序的目标文本;
根据所述目标文本的特征信息确定所述目标文本的结构信息;
根据所述结构信息确定所述目标文本的目标编码;
利用所述目标编码对所述目标文本进行编码转化,得到转换文本;
判断所述转换文本与所述目标文本是否一致;
根据判断结果对所述转换文本进行处理。
可选的,在所述获取目标程序的目标文本之前,所述方法还包括:
加载所述目标程序;
获取所述目标程序的程序文本;
按照预定义的结构体存储所述程序文本,生成程序文本结构;
提取所述程序文本的特征信息;
构建所述程序文本特征信息与所述程序文本结构的映射关系。
可选的,在所述按照预定义的结构体存储所述程序文本之前,所述方法还包括:
按预设数据格式存储所述程序文本;
以类型标签作为标识对所述程序文本的语言类型进行标记;
以属性标签作为标识对所述程序文本的默认编码进行标记。
可选的,所述利用所述目标编码对所述目标文本进行编码转化,具体为:
根据所述结构信息确定所述目标文本的源编码;
利用所述源编码调用编码转换接口将所述目标文本按照目标编码进行编码转换。
可选的,当所述转换文本与所述目标文本一致时,
所述根据判断结果对所述转换文本进行处理,具体包括:
确定所述目标文本仅包含一种编码;
对所述目标文本进行正常显示。
可选的,当所述转换文本与所述目标文本不一致时,
所述根据判断结果对所述转换文本进行处理,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市元征科技股份有限公司,未经深圳市元征科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110289407.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多次迭代对折词汇层级分类方法及系统
- 下一篇:一种直线位移测量装置和方法