[发明专利]编码格式检测方法及装置有效
申请号: | 201310179933.7 | 申请日: | 2013-05-15 |
公开(公告)号: | CN104156373B | 公开(公告)日: | 2017-06-06 |
发明(设计)人: | 吴建勋;纪勇士;蔡孟达 | 申请(专利权)人: | 宏碁股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同立钧成知识产权代理有限公司11205 | 代理人: | 臧建明 |
地址: | 中国台湾新北市*** | 国省代码: | 台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 编码 格式 检测 方法 装置 | ||
技术领域
本发明是有关于一种编码格式检测方法及装置,且特别是有关于一种识别标签的编码格式检测方法及装置。
背景技术
在现今信息传播的过程中,由于不同国家的不同语言导致需要在不同的字符编码之间转码,以进行一致化的处理。以网页服务器而言,为了处理来自世界各处的信息及其来源编码,例如互联网协议地址(Internet Protocol Address,以下简称IP Address)或是浏览器的预设语言等背景信息可做为网页服务器转码成内部统一处理的编码依据。
然而,在其它不同的应用上,并没有足够的背景信息来判断来源编码,而造成后续处理上的困扰。举例而言,MP3(MPEG Layer3)是目前最为普遍的数字音乐格式,MP3文件的识别标签称为MP3文件识别标签(Identify MP3,以下简称ID3),其用以记载例如是曲名、演唱者、专辑名称、年代等音乐相关信息。但由于不同国家的不同语言导致这些音乐相关信息是以各式各样的格式进行编码。以现今存在的数字播放器而言,由于这些音乐相关信息相当简短使得背景数据不足,以现有的经验法则(启发式算法)来检测编码格式的结果往往不尽理想而产生乱码,带来负面的使用经验。
发明内容
有鉴于此,本发明提供一种编码格式检测方法及装置,其可更精确地检测文件的识别标签的编码格式。
本发明提供一种编码格式检测方法,用以检测文件的识别标签的编码格式。此方法先获取识别标签内的信息,并聚集为一个字符串。接着使用多种编码格式检测此字符串所使用的编码格式,以获得多个检测结果及各个检测结果的信心分数。然后,判断各信心分数是否大于门限值,而当所有检测结果的信心分数均不大于门限值时,将各个检测结果转码为通用编码格式,并且利用搜索引擎搜索转码后的各个检测结果,将搜索次数最多的检测结果对应的编码格式设定为识别标签的编码格式。
本发明提供一种编码格式检测装置,用以检测文件的识别标签的编码格式。此装置包括标签获取模块、编码检测模块、信心分数判断模块、通用编码转换模块以及决策模块。标签获取模块会获取标签内的信息,并聚集为一个字符串。编码检测模块利用多种编码格式检测字符串所使用的编码格式,以获得多个检测结果及各个检测结果的信心分数。信心分数判断模块会判断各个检测结果的信心分数是否大于门限值。当所有检测结果的信心分数均不大于门限值时,通用编码转换模块将各个检测结果转码为通用编码格式。决策模块会利用搜索引擎搜索转码后的各个检测结果,将搜索次数最多的检测结果对应的编码格式设定为识别标签的编码格式。
基于上述,本发明通过启发式检测器来检测文件的识别标签内的信息所使用的编码格式,获得多个检测结果及各所述检测结果的信心分数。当所有检测结果的信心分数均不大于门限值时,将各个检测结果转码为通用编码格式,并且利用搜索引擎搜索转码后的各个检测结果,将搜索次数最多的检测结果对应的编码格式设定为识别标签的编码格式。藉此,本发明可在背景数据不足的情况下,利用搜索引擎的能力结合启发式演算器来检测编码格式,提供更精确的估测结果。
为让本发明的上述特征和优点能更明显易懂,下文特举实施例,并配合附图作详细说明如下。
附图说明
图1为依据本发明一实施例的一种编码格式检测装置的功能方块示意图;
图2为依据本发明一实施例的一种编码格式检测方法流程图。
附图标记说明:
100:编码格式检测装置;
110:标签获取模块;
120:编码检测模块;
130:信心分数判断模块;
140:通用编码转换模块;
150:决策模块;
S201~S211:编码格式检测方法流程。
具体实施方式
图1为依据本发明一实施例的一种编码格式检测装置的功能方块示意图,图2为依据本发明一实施例的一种编码格式检测方法流程图。请先参照图1,编码格式检测装置100包括标签获取模块110、编码检测模块120、信心分数判断模块130、通用编码转换模块140以及决策模块150。这些模块例如是以逻辑电路元件组成的硬件装置,而可执行编码格式的检测功能。这些模块也可以是存储在电脑主机的硬盘或存储器中的软件程序或固件程序,其可载入电脑主机的处理器,而执行编码格式的检测功能,在此不设限。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宏碁股份有限公司,未经宏碁股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310179933.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网页加载方法、装置及设备
- 下一篇:一种中文事件的处理方法及系统