[发明专利]一种创建中文名称索引的方法及装置在审
申请号: | 201710616016.9 | 申请日: | 2017-07-26 |
公开(公告)号: | CN107220390A | 公开(公告)日: | 2017-09-29 |
发明(设计)人: | 丛锐;谢恩鹏;刘磊 | 申请(专利权)人: | 山东浪潮商用系统有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 济南信达专利事务所有限公司37100 | 代理人: | 李世喆 |
地址: | 250100 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 创建 中文名称 索引 方法 装置 | ||
技术领域
本发明涉及数据处理技术领域,特别涉及一种创建中文名称索引的方法及装置。
背景技术
随着计算机技术的不断发展与进步,各种智能设备被广泛应用于生活、生产中的各个领域。用户在使用智能设备的过程中,经常遇到需要对中文名称进行检索的情况,比如,用户在使用智能机顶盒点播中文电视节目时,需要通过遥控器对所要观看电视节目的中文名称进行搜索。但是,在一些特定场景下,用户无法通过输入中文来对中文名称进行检索,比如通过遥控器难以输入中文,因此需要为中文名称创建索引,以方便对中文名称进行检索。
目前,在为中文名称创建索引时,获取中文名称所包括各个汉字的拼音首字母,形成包括中文名称中第一个汉字的拼音首字母的至少一个字符串作为中文名称的索引,以实现通过拼音对中文名称记性检索。例如,中文名称包括3个汉字,3个汉字的拼音首字母依次为h、l和s,则将h、hl和hls作为该中文名称的索引。
针对目前为中文名称创建索引的方法,由于中文名称的索引均包括中文名称中第一个汉字的拼音首字母,用户在对中文名称进行检索时,必须要知道中文名称的第一个汉字,否则无法成功检索到中文名称。因此,现有为中文名称创建索引的方法,造成用户对中文名称进行检索时的体验较差。
发明内容
本发明实施例提供了一种创建中文名称索引的方法及装置,能够提高用户对中文名称进行检索时的体验。
第一方面,本发明实施例提供了一种创建中文名称索引的方法,包括:
获取中文名称中各个汉字的拼音首字母;
分别获取以每一个所述拼音首字母开头的至少一个字符串,其中,所述字符串中任意两个相邻所述拼音首字母对应的两个汉字在所述中文名称中相邻,且所述字符串中各个所述拼音首字母的顺序与对应汉字在所述中文名称中的顺序相同;
将获取到的各个所述字符串与所述中文名称相关联,作为所述中文名称的索引。
可选地,当所述中文名称包括有至少两个汉字时,所述分别获取以每一个所述拼音首字母开头的至少一个字符串,包括:
按照对应汉字在所述中文名称中的顺序,对各个所述拼音首字母进行顺序组合,形成待切分字符串;
以不同的切分位置和切分次数对所述待切分字符串进行至少一次切分,获得至少两个所述字符串,其中,每一个所述字符串包括有至少一个所述拼音首字母。
可选地,所述以不同的切分位置和切分次数对所述待切分字符串进行至少一次切分,包括:
通过递归算法,以所述待切分字符串作为初始输入,对所述待切分字符串进行切分运算,将每一次切分运算输出的至少两个运算结果作为对应数量的所述字符串。
可选地,在所述形成待切分字符串之后,进一步包括:
将所述待切分字符串与所述中文名称相关联,作为所述中文名称的一个索引。
可选地,所述获取中文名称中各个汉字的拼音首字母,包括:
通过预先定义的Java归档文件jar包,分别将所述中文名称包括的每一个汉字翻译为对应的拼音全拼;
针对每一个所述汉字,通过所述jar包,从该汉字对应拼音全拼中提取第一个字母作为该汉字的所述拼音首字母。
第二方面,本发明实施例还提供了一种创建中文名称索引的装置,包括:获取单元、切分单元和关联单元;
所述获取单元,用于获取中文名称中各个汉字的拼音首字母;
所述切分单元,用于分别获取以所述获取单元获取到的每一个所述拼音首字母开头的至少一个字符串,其中,所述字符串中任意两个相邻所述拼音首字母对应的两个汉字在所述中文名称中相邻,且所述字符串中各个所述拼音首字母的顺序与对应汉字在所述中文名称中的顺序相同;
所述关联单元,用于将所述切分单元获取到的各个所述字符串与所述中文名称相关联,作为所述中文名称的索引。
可选地,当所述中文名称包括有至少两个汉字时,
所述切分单元包括:组合子单元和切分子单元;
所述组合子单元,用于按照对应汉字在所述中文名称中的顺序,对各个所述拼音首字母进行顺序组合,形成待切分字符串;
所述切分子单元,用于以不同的切分位置和切分次数对所述组合子单元形成的所述待切分字符串进行至少一次切分,获得至少两个所述字符串,其中,每一个所述字符串包括有至少一个所述拼音首字母。
可选地,
所述切分子单元,用于通过递归算法,以所述待切分字符串作为初始输入,对所述待切分字符串进行切分运算,将每一次切分运算输出的至少两个运算结果作为对应数量的所述字符串。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮商用系统有限公司,未经山东浪潮商用系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710616016.9/2.html,转载请声明来源钻瓜专利网。