[发明专利]节目搜索装置和节目搜索方法无效
申请号: | 200810161199.0 | 申请日: | 2008-08-08 |
公开(公告)号: | CN101365104A | 公开(公告)日: | 2009-02-11 |
发明(设计)人: | 折原良平;村上知子;森纮一郎 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | H04N7/173 | 分类号: | H04N7/173;H04N5/445;G06F17/30 |
代理公司: | 北京市中咨律师事务所 | 代理人: | 杨晓光;于静 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 节目 搜索 装置 方法 | ||
技术领域
本申请涉及一种节目搜索装置和节目搜索方法,用于在电视接收/积累/重放系统中搜索相似于特定节目(组)的节目,所述电视接收/积累/重放系统允许在多个频道上浏览广播节目以及以电子节目指南(EPG)的形式利用有关广播节目内容的元信息。
背景技术
近年来,除了传统地面TV广播之外,BS/CS广播得到广泛利用,正来到真正的多频道时代。在此背景下,提出了基于包括类型的节目元数据来向用户推荐节目的系统和/或服务。某些这样的系统和服务基于用户浏览历史和喜好来得知用户的偏好,并根据所得知的偏好来推荐节目。例如,在本身提供功能作为主要特征的节目搜索装置中,可以利用对相似于某个节目的节目进行搜索的功能。这样的功能还可以应用于识别节目(所述节目相似于虽然在节目推荐装置中被推荐过但没有被观看的节目(B)和/或相似于虽然没有被推荐但被观看过的节目(W)),以及考虑所识别节目而做出推荐,以便提高推荐的适合程度。通过将在信息检索领域研究出的相似文档搜索应用到节目元数据中来实现此类相似节目的搜索。
然而,上面简述的常规技术存在下面的缺陷。
通常,信息检索通过基于“tf-idf”(词频/反转文档频率)给词分配权重来矢量化文档的方式定义文档间的相似度,但是“tf”(文档中的词频)在像EPG(电子节目指南)这样的短文档中通常是没有意义的,因而使得信息检索不太有效。
同样,除了经过自然语言处理得到的词/短语类型以外,EPG还包括基于文档结构(例如,执行者名称)所获得的类型,诸如语言或语义类别的一部分。然而,并不能仅仅通过以简单方式采用信息检索来利用这种信息。
此外,出现在EPG上的某些节目具有少量的节目信息,例如,其中的描述非常短,以及用这样的节目作为搜索查询来进行相似性搜索具有很低的可靠性,引起用户对节目搜索装置能力的抱怨。同样,考虑与节目“B”和/或“W”相似的节目的节目推荐过分概括节目“B”和/或“W”,其可能导致推荐合理程度的降低。
发明内容
根据本发明的一个方面,提出了一种节目搜索装置,包括:
EPG获取单元,被配置为通过网络或广播网络来获取EPG(电子节目指南)数据,所述EPG数据包括描述多个节目的内容的多个节目信息;
关键词提取单元,被配置为提取在所述多个节目信息中描述的并且彼此不同的词或短语作为关键词;
识别单元,被配置为识别所述关键词所属的类别;
第一计算单元,被配置为分别计算包含每个关键词的节目信息数量作为第一计算信息;
第二计算单元,被配置为分别计算属于每个类别的关键词数量作为第二计算信息;
指定单元,被配置为从所述多个节目中指定至少一个节目作为搜索查询;
权重计算单元,被配置为对于从所述搜索查询的节目信息提取的关键词的每个查询关键词,基于对应于所述查询关键词的第一计算信息和对应于所述查询关键词所属类别的第二计算信息来分别计算权重;
检测单元,被配置为在所述多个节目中检测在与不同于所述搜索查询的每个搜索目标节目对应的每个节目信息中包含的查询关键词;
相似度计算单元,被配置为对于每个搜索目标节目根据与所检测的查询关键词对应的权重来分别计算相对于所述搜索查询的相似度等级;
相似节目识别单元,被配置为从所述搜索目标节目中基于每个计算出的相似度等级来识别相似于所述搜索查询的相似搜索目标节目;以及
输出单元,被配置为输出用于指示所述相似搜索目标节目的信息。
根据本发明的另一方面,提供了一种节目搜索方法,包括:
通过网络或广播网络来获取EPG(电子节目指南)数据,所述EPG数据包括描述多个节目的内容的多个节目信息;
提取在所述多个节目信息中描述的并且彼此不同的词或短语作为关键词;
识别所述关键词所属类别;
分别计算包含每个关键词的节目信息数量作为第一计算信息;
分别计算属于每个类别的关键词数量作为第二计算信息;
从所述多个节目中指定至少一个节目作为搜索查询;
对于从所述搜索查询的节目信息提取的关键词的每个查询关键词,基于对应于所述查询关键词的第一计算信息和对应于所述查询关键词所属类别的第二计算信息来分别计算权重;
在所述多个节目中检测在与不同于所述搜索查询的每个搜索目标节目对应的每个节目信息中包含的查询关键词;
对于每个搜索目标节目,根据与所检测的查询关键词对应的权重来分别计算相对于所述搜索查询的相似度等级;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810161199.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水冷永磁同步牵引电机
- 下一篇:机组下线模板