[发明专利]一种评价问答对质量的方法和装置在审
申请号: | 201510981511.0 | 申请日: | 2015-12-23 |
公开(公告)号: | CN106909573A | 公开(公告)日: | 2017-06-30 |
发明(设计)人: | 孙林;陈培军;秦吉胜 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京国昊天诚知识产权代理有限公司11315 | 代理人: | 许志勇,黄熊 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 评价 答对 质量 方法 装置 | ||
1.一种评价问答对质量的方法,其特征在于,包括:
获取待评价问答对的问题内容中的词语和答案内容中的词语;
从问答知识库中选取与获取到的问题内容中的词语和答案内容中的词语均相匹配的问答记录,其中,一条问答记录包括一个问题词语、与所述问题词语相关联的多个答案词语,以及每个答案词语分别和所述问题词语之间的语义相关度;
根据相匹配的问答记录中的问题词语和答案词语之间的语义相关度,对问答对的质量进行评价。
2.根据权利要求1所述的方法,其特征在于,从问答知识库中选取与获取到的问题内容中的词语和答案内容中的词语均相匹配的问答记录,具体包括:
将获取到的问题内容中的词语与问答记录中的问题词语相匹配,如果匹配成功,则标记该问答记录;
然后将将获取到的答案内容中的词语与标记的问答记录中的答案词语相匹配,如果匹配成功,则选取该问答记录。
3.根据权利要求1所述的方法,其特征在于,获取待评价问答对的问题内容中的词语和答案内容中的词语之前,所述方法还包括:
预先提取出多个问答对,并获取每个问答对对应的类别,构建包含有多条问答记录的问答知识库。
4.根据权利要求3所述的方法,其特征在于,构建包含有多条问答记录的问答知识库,具体包括:
对提取的每一个问答对,提取该问答对的问题内容和答案内容中的词语,得到问题词语集合和答案词语集合;
令问题词语集合中的每个问题词语和答案词语集合中的每个答案词语分别在与该问答对对应的每个类别上形成一条信息记录;
对每一条信息记录,执行以下操作:
计算该答案词语属于该类别的概率,计算在该类别上该答案词语对该问题词语的解释的专一程度,计算在该类别上该问题词语用该答案词语进行解释的强度;
将上述概率、专一程度和强度相乘,所得到的乘积是该答案词语和该问题词语的语义相关度;
令该问题词语,多个答案词语和多个答案词语中的每个答案词语和所述问题词语之间的语义相关度形成一条对应于所述类别的问答记录。
5.根据权利要求4所述的方法,其特征在于,
计算该答案词语属于该类别的概率,具体包括:
计算在该类别上该答案词语对该问题词语的解释的专一程度,具体包括:
计算在该类别上该问题词语用该答案词语进行解释的强度,具体包括:
将概率、专一程度和强度相乘,具体包括:
weight(QWi,AWj|C=Ck)=P(Ck|AWj)*specific(QWi,AWj|C=Ck)*interpret(QWi,AWj|C=Ck)
其中:
P(Ck|AWj)为答案词语AWj属于类别Ck的概率;
specific(QWi,AWj|C=Ck)为在类别Ck上答案词语AWj对问题词语QWi的解释的专一程度;
interpret(QWi,AWj|C=Ck)为在类别Ck上问题词语QWi用答案词语AWj进行解释的强度;
P(CK)表示类别Ck出现的概率;P(AWj)表示答案为AWj的概率;P(AWj|Ck)表示Ck类别属于AWj的概率;#(QWi,AWj)表示问题词语为QWi且答案词语为AWj的次数;#(AWj)表示答案词语为AWj的次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510981511.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:腰挂饰(墨玉)
- 下一篇:护肘(QH1509)