[发明专利]汉语词组库的建立及更新方法无效
申请号: | 201010244321.8 | 申请日: | 2010-08-04 |
公开(公告)号: | CN101916268A | 公开(公告)日: | 2010-12-15 |
发明(设计)人: | 樊滨温 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04N5/445 |
代理公司: | 深圳市科吉华烽知识产权事务所 44248 | 代理人: | 胡吉科 |
地址: | 518055 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 汉语 词组 建立 更新 方法 | ||
【技术领域】
本发明涉及汉语词组库的建立及更新方法,尤其涉及在机顶盒中建立汉语词组库及更新方法。
【背景技术】
在机顶盒中,若想从EPG信息中搜索感兴趣的节目,例如想在EPG信息中搜索哪个电视台正在播放电视剧“亮剑”,必须有汉字输入法的支持,汉字输入法中必须有汉字库,而高级的汉字输入法一般不光支持全拼输入还支持头拼音字母组合的输入。例如输入词组“亮剑”时,只需输入每个汉字的头字母组合“LJ”,而不必输入全拼“liangjian”,这就提高了效率,但是要完成这种功能,系统必须有常用词组库。一方面,常用词组库的词条数要适当,太小,不能囊括常用的词语,太大又占存储空间太多,另一方面,词条应该能更新,电视节目中经常会出现一些新的词汇,例如电影名字和电视剧的名字等等,这些新的词组应该不断地加进词库中,而对机顶盒这种电子产品,卖出去就很难再收回来更新词库。
【发明内容】
本发明要解决的技术问题是,提供一种在机顶盒中能够建立并能更新的汉语词组库方法。
本发明提供了一种汉语词组库的建立及更新方法,从EPG相关信息中提取常用词组,从而建立常用词组库;按照设定对常用词组库进行更新,以使常用词组库中的汉语词组与当前EPG信息相匹配。
作为本发明的进一步改进,所述EPG相关信息为从每个电视台的每一档节目中提取出节目名称、演员姓名、导演姓名、主持人姓名、节目详细信息中的关键词。
作为本发明的进一步改进,常用词组库的建立方法为:步骤一:从EPG信息中提取相关信息;步骤二:提取出的信息中如果有非汉字的部分,将其去除并分解成一个或几个标准的汉语词组;步骤三:将标准的汉语词组存入常用词组库,相同的词组不必存入。
作为本发明的进一步改进,所述常用词组库更新方式为:首先将所述常用词组库删除,再从当前EPG中获取相关信息,提取汉语词组,建立新的常用词组库。
作为本发明的进一步改进,所述常用词组库更新方式为:首先将所述常用词组库中的所有汉语词组清空,再从当前EPG中获取相关信息,提取全部汉语词组并计算全部汉语词组所占用的空间;判断全部汉语词组所占用的空间是否大于所述常用词组库空间,如果大于所述常用词组库空间,那么将所述常用词组库删除,并建立新的常用词组库,然后将所述全部汉语词组存入所述新的常用词组库中,或者增加所述常用词组库空间,然后将所述全部汉语词组存入增加空间后的常用词组库中;如果全部汉语词组所占用的空间不大于所述常用词组库空间,那么将所述全部汉语词组存入所述常用词组库中。
作为本发明的进一步改进,所述常用词组库更新方式为:步骤一:从当前EPG信息中获取相关信息,提取全部汉语词组,并建立汉语词组列表;步骤二:将所述常用词组库中的每个汉语词组分别与所述汉语词组列表中的汉语词组进行逐个比较;步骤三:判断常用词组库中的汉语词组是否与汉语词组列表中的汉语词组相同;如果常用词组库中的某个汉语词组与汉语词组列表中的相应汉语词组相同,那么执行步骤四,将汉语词组列表中的相应汉语词组进行标识;如果常用词组库中的某个汉语词组与汉语词组列表中的每个汉语词组均不相同,那么执行步骤五,将常用词组库中的该汉语词组删除;最后执行步骤六:将汉语词组列表中未进行标识的汉语词组存入常用词组库中。
作为本发明的进一步改进,所述常用词组库更新时机为用户设定或系统设定或机顶盒开机初始化时,所述常用词组库进行更新。
作为本发明的进一步改进,根据EPG信息的不同,建立多个常用词组库,每个常用词组库均与不同的EPG信息相对应。
作为本发明的进一步改进,在常用词组库建立完毕之后,根据用户输入的查找信息提取常用词组库中的常用词组,再根据该常用词组,快速搜索到电视节目。
本发明的有益效果是:通过从EPG相关信息中获取常用词组并建立常用词组库,且按照设定对所述常用词组库进行更新,使得常用词组库中的汉语词组一直保持与当前EPG信息相匹配,从而使用户可以非常方便快捷的寻找到电视节目,并且使常用词组库的大小更合理更有效。
【附图说明】
图1是本发明汉语词组库的建立及更新方法的框图;
图2是本发明汉语词组库更新方法的第一种实施方式流程图;
图3是本发明汉语词组库更新方法的第二种实施方式流程图;
图4是本发明汉语词组库更新方法的第三种实施方式流程图;
图5是本发明汉语词组库更新方法的第四种实施方式流程图;
图6是本发明汉语词组库更新方法的第四种实施方式演示图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院,未经哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010244321.8/2.html,转载请声明来源钻瓜专利网。