[发明专利]字符串的解码方法和装置无效
申请号: | 201210165444.1 | 申请日: | 2012-05-24 |
公开(公告)号: | CN102722544A | 公开(公告)日: | 2012-10-10 |
发明(设计)人: | 何恺铎;黄健;张文涛;戴飞 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 吴贵明;李志刚 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符串 解码 方法 装置 | ||
技术领域
本发明涉及数据处理领域,具体而言,涉及一种字符串的解码方法和装置。
背景技术
在复杂互联网环境下,由于各种浏览器和http协议限制,很多复杂字符(包括中文和各种符号),不能被浏览器直接接收和传输。业界通用的做法是对整个字符串进行网址编码(urlencoding),然后再网址解码(decode)。
例如:在百度中搜索“字符串”,我们看到浏览器栏的地址是:
http://www.baidu.com/s?tn=monline_5_dg&bs=javascript+%D7%D6%B7%FB%B4%AEcontain&f=8&rsv_bp=1&wd=%D7%D6%B7%FB%B4%AE&inputT=3935
“wd=%D7%D6%B7%FB%B4%AE”中的“%D7%D6%B7%FB%B4%AE”就是“字符串”三个字编码后的内容。如果使用各种编程语言提供的decode方法,可以恢复成“字符串”三个字。但是在复杂的互联网环境下,对于已经urlencoding的字符串,解码的时候却有问题,收到的字符串不可控。发明人发现对于已经编码的字符串在解码时容易出现问题的主要原因是:在对编码数据进行解码时直接调用通用的解码函数进行解码,而不考虑对字符串进行编码时所使用的编码方式,造成指定解码时的信息缺失或错误,进而导致解码出错。
针对相关技术中对字符串进行解码时容易出现错误的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种字符串的解码方法和装置,以解决现有技术中对字符串进行解码时容易出现错误的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种字符串的解码方法,包括:读取编码数据;获取与编码数据对应的解码方式;以及按照获取到的解码方式对编码数据进行解码。
进一步地,通过以下方式获取与编码数据对应的解码方式:获取编码数据的编码方式;以及查找与编码方式对应的解码方式,得到与编码数据对应的解码方式。
进一步地,采用正则表达式对编码数据进行探测以获取编码数据的编码方式。
进一步地,按照获取到的解码方式对编码数据进行解码包括:按照获取到的解码方式对编码数据进行第一次解码;判断第一次解码后的数据是否包含第一特征符号;以及在判定第一次解码后的数据包含第一特征符号时,按照获取到的解码方式对编码数据进行第二次解码。
进一步地,在按照获取到的解码方式对编码数据进行解码之后,解码方法还包括:扫描解码后的字符;以及筛除扫描到的字符中的第一字符,得到解码数据,其中,第一字符为不可识别的字符。
进一步地,筛除扫描到的字符中的第一字符包括:将第一字符与预设字符库中的字符进行对比以判断第一字符与预设字符库中的字符是否相匹配;以及在判定第一字符与预设字符库中的字符不相匹配时,筛除第一字符。
进一步地,在筛除扫描到的字符中的第一字符,得到解码数据之后,解码方法还包括:判断解码数据是否包含第二特征符号;以及在判定解码数据包含第二特征符号时,重新按照获取到的解码方式对编码数据进行解码。
进一步地,在筛除扫描到的字符中的第一字符,得到解码数据之后,解码方法还包括:获取解码数据中的字符的类型数量;判断获取到的类型数量是否大于预设数量;以及在判定获取到的类型数量大于预设数量时,重新按照获取到的解码方式对编码数据进行解码。
为了实现上述目的,根据本发明的另一方面,提供了一种字符串的解码装置,该解码装置用于执行上述本发明所提供的任一种字符串的解码方法。
为了实现上述目的,根据本发明的另一方面,提供了一种字符串的解码装置,包括:第一处理模块,用于读取编码数据;第二处理模块,与第一处理模块相连接,用于获取与编码数据对应的解码方式;以及第三处理模块,与第二处理模块相连接,用于按照获取到的解码方式对编码数据进行解码。
进一步地,第三处理模块包括:第一处理子模块,用于按照获取到的解码方式对编码数据进行第一次解码;第二处理子模块,与第一处理子模块相连接,用于判断第一次解码后的数据是否包含第一特征符号;以及第三处理子模块,与第二处理子模块相连接,用于在判定第一次解码后的数据包含第一特征符号时,按照获取到的解码方式对编码数据进行第二次解码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210165444.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:无线网络利用率的获取方法和网管设备
- 下一篇:一种同步通信装置及其控制方法