[发明专利]主题挖掘方法和设备、以及查询扩展方法和设备在审
申请号: | 201310301260.8 | 申请日: | 2013-07-18 |
公开(公告)号: | CN104298676A | 公开(公告)日: | 2015-01-21 |
发明(设计)人: | 黄耀海;张碧川;李荣军;王钊 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 欧阳帆 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及主题挖掘方法和设备及查询扩展方法和设备。该主题挖掘方法包括:从知识库中获取多个句子;将至少一个句子转换为由多模因素的一个模式、条件及多值属性的一个值构成的条件三元组形式的第一断言声明;针对第一断言声明产生多模因素和多值属性分别与第一断言声明的条件三元组中的相同而多值属性的值不同的条件三元组形式的假设;计算每个假设的置信度并提取出置信度大于预定第一阈值的假设作为第二断言声明;将第一和第二断言声明组合以获得从多值属性到多模因素的映射,并且验证该映射是否是满射;在映射是满射的情况下,输出表示多值属性是多模因素的前提的前提断言对主题。得益于本发明,可以挖掘出隐含的用户查询主题从而提高召回率。 | ||
搜索关键词: | 主题 挖掘 方法 设备 以及 查询 扩展 | ||
【主权项】:
一种主题挖掘方法,包括:获取步骤,从至少一个知识库中获取多个句子;转换步骤,将所获取的句子中的至少一个转换为条件三元组形式的第一断言声明,其中所述第一断言声明的条件三元组由多模因素的一个模式、条件、以及多值属性的一个值构成;产生步骤,针对第一断言声明产生条件三元组形式的假设,其中所产生的假设的条件三元组中的多模因素和多值属性分别与第一断言声明的条件三元组中的多模因素和多值属性相同,所产生的假设中的多值属性的值不同于第一断言声明中的多值属性的值;计算步骤,通过使用存储在所述至少一个知识库中的证据来计算每个假设的置信度,并且从所述假设中提取出一个或更多个假设作为第二断言声明,其中每个第二断言声明的置信度大于预定的第一阈值;组合步骤,将第一断言声明和第二断言声明组合以获得从所述多值属性到所述多模因素的映射,并且验证所述映射是否是满射;以及输出步骤,在从所述多值属性到所述多模因素的映射是满射的情况下,输出表示所述多值属性是所述多模因素的前提的前提断言对主题。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310301260.8/,转载请声明来源钻瓜专利网。