[发明专利]汉语词组库的建立及更新方法无效
申请号: | 201010244321.8 | 申请日: | 2010-08-04 |
公开(公告)号: | CN101916268A | 公开(公告)日: | 2010-12-15 |
发明(设计)人: | 樊滨温 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04N5/445 |
代理公司: | 深圳市科吉华烽知识产权事务所 44248 | 代理人: | 胡吉科 |
地址: | 518055 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 汉语 词组 建立 更新 方法 | ||
1.一种汉语词组库的建立及更新方法,其特征在于:从EPG相关信息中提取常用词组,从而建立常用词组库;按照设定对常用词组库进行更新,以使常用词组库中的汉语词组与当前EPG信息相匹配。
2.根据权利要求1所述的汉语词组库的建立及更新方法,其特征在于:所述EPG相关信息为从每个电视台的每一档节目中提取出节目名称、演员姓名、导演姓名、主持人姓名、节目详细信息中的关键词。
3.根据权利要求1所述的汉语词组库的建立及更新方法,其特征在于:常用词组库的建立方法为:步骤一:从EPG信息中提取相关信息;步骤二:提取出的信息中如果有非汉字的部分,将其去除并分解成一个或几个标准的汉语词组;步骤三:将标准的汉语词组存入常用词组库,相同的词组不必存入。
4.根据权利要求1所述的汉语词组库的建立及更新方法,其特征在于:所述常用词组库更新方式为:首先将所述常用词组库删除,再从当前EPG中获取相关信息,提取汉语词组,建立新的常用词组库。
5.根据权利要求1所述的汉语词组库的建立及更新方法,其特征在于:所述常用词组库更新方式为:首先将所述常用词组库中的所有汉语词组清空,再从当前EPG中获取相关信息,提取全部汉语词组并计算全部汉语词组所占用的空间;
判断全部汉语词组所占用的空间是否大于所述常用词组库空间,如果大于所述常用词组库空间,那么将所述常用词组库删除,并建立新的常用词组库,然后将所述全部汉语词组存入所述新的常用词组库中,或者增加所述常用词组库空间,然后将所述全部汉语词组存入增加空间后的常用词组库中;
如果全部汉语词组所占用的空间不大于所述常用词组库空间,那么将所述全部汉语词组存入所述常用词组库中。
6.根据权利要求1所述的汉语词组库的建立及更新方法,其特征在于:所述常用词组库更新方式为:步骤一:从当前EPG信息中获取相关信息,提取全部汉语词组,并建立汉语词组列表;步骤二:将所述常用词组库中的每个汉语词组分别与所述汉语词组列表中的汉语词组进行逐个比较;步骤三:判断常用词组库中的汉语词组是否与汉语词组列表中的汉语词组相同;如果常用词组库中的某个汉语词组与汉语词组列表中的相应汉语词组相同,那么执行步骤四,将汉语词组列表中的相应汉语词组进行标识;如果常用词组库中的某个汉语词组与汉语词组列表中的每个汉语词组均不相同,那么执行步骤五,将常用词组库中的该汉语词组删除;最后执行步骤六:将汉语词组列表中未进行标识的汉语词组存入常用词组库中。
7.根据权利要求1所述的汉语词组库的建立及更新方法,其特征在于:所述常用词组库更新时机为用户设定或系统设定或机顶盒开机初始化时,所述常用词组库进行更新。
8.根据权利要求3至6任一项所述的汉语词组库的建立及更新方法,其特征在于:根据EPG信息的不同,建立多个常用词组库,每个常用词组库均与不同的EPG信息相对应。
9.根据权利要求8所述的汉语词组库的建立及更新方法,其特征在于:在常用词组库建立完毕之后,根据用户输入的查找信息提取常用词组库中的常用词组,再根据该常用词组,快速搜索到电视节目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院,未经哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010244321.8/1.html,转载请声明来源钻瓜专利网。