[发明专利]词法答案类型置信度估计和应用有效
申请号: | 201180056262.4 | 申请日: | 2011-09-21 |
公开(公告)号: | CN103221952A | 公开(公告)日: | 2013-07-24 |
发明(设计)人: | J·J·范;D·A·弗鲁茨;D·C·贡德克;A·A·卡利安普;A·P·拉利;J·W·默多克四世;W·W·扎德罗兹尼 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 于静;张亚非 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 词法 答案 类型 置信 估计 应用 | ||
1.一种用于自动生成问题答案的计算机实现的方法,所述方法包括以下步骤:
确定与输入查询关联的词法答案类型(LAT);
计算输入查询LAT的第一得分,其中所述第一得分指示所述查询LAT的质量;
从信息源获得所述输入查询的候选答案;
确定所述候选答案的答案类型(AT);
比较所述查询LAT与候选答案AT;
计算表示所比较的查询LAT与所述候选答案AT之间的匹配度的第二得分;以及
组合所述第一得分与所述第二得分,以便提供指示所述候选答案的质量的总得分,
其中处理设备自动执行所述确定查询LAT、计算所述第一得分和第二得分、获得候选答案、确定AT、比较以及组合步骤中的一个或多个。
2.根据权利要求1的计算机实现的方法,其中计算与所述输入查询关联的所述查询LAT的第一得分包括:
提取描述所确定的查询LAT的特性集合;以及
向所述特性集合应用模型,以便产生表示所确定的查询LAT的估计准确性的LAT置信度值,所述第一得分包括所述置信度值。
3.根据权利要求2的计算机实现的方法,其中所应用的模型是以下项中的一个或多个:逻辑回归模型,或从先前训练实例集合手动或自动构造的决策树模型。
4.根据权利要求2的计算机实现的方法,其中所提取的特性集合中的一个特性包括模式规则,所述提取特性集合包括:
标识与所述查询关联的句法模式规则,从定义通用LAT的模式规则集合来标识所述模式规则。
5.根据权利要求2的计算机实现的方法,其中所提取的特性集合中的一个特性包括查询单词是候选答案LAT的频率,所述提取特性集合进一步包括:
检查检测到的LAT单词的先前实例;以及
根据所述先前实例计算LAT单词频率。
6.根据权利要求2的计算机实现的方法,其中所提取的特性集合中的一个特性包括所述候选答案LAT的词性,所述提取特性集合进一步包括:
获得与所述查询关联的解析树数据结构;以及
遍历所述解析树,以便标识与所述候选答案LAT关联的单词之间的语法关系。
7.根据权利要求2的计算机实现的方法,其中所提取的特性集合中的一个特性包括共同参考信息,所述提取特性集合进一步包括:确定候选答案LAT单词是否共同参考所述查询中识别为LAT的某一其它单词。
8.根据权利要求2的计算机实现的方法,其中并行提取所提取的特性集合中的一个或多个特性。
9.根据权利要求2的计算机实现的方法,其中计算表示所比较的查询LAT与所述候选答案AT之间的匹配度的第二得分包括:
将所述候选答案与语料库或知识库中的实例相匹配;
检索与所述语料库或所述知识库中的实例关联的类型;以及
将所述查询LAT与所检索的类型相匹配,以便产生类型强制(TyCor)值,所述第二得分包括所述TyCor值。
10.根据权利要求9的计算机实现的方法,其中查询最多具有n个候选答案LAT,组合以便提供所述总得分的步骤是根据以下公式的求和:
(置信度得分LAT1)(TyCorLAT1)+(置信度得分LAT2)(TyCorLAT2)+…+(置信度得分LATn)(TyCorLATn)
其中置信度得分LAT1、置信度得分LAT2和置信度得分LATn是所产生的置信度值,所述置信度值表示所述查询的每个所确定的LAT的估计准确性,并且TyCorLAT1、TyCorLAT2和TyCorLATn是候选答案对于每个LAT的所产生的类型强制(TyCor)值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180056262.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:点火线圈
- 下一篇:预测查询建议高速缓存