[发明专利]一种用于问答系统的答案排序方法有效
申请号: | 201810284245.X | 申请日: | 2018-04-02 |
公开(公告)号: | CN108647233B | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 雷凯;沈颖;邓扬 | 申请(专利权)人: | 北京大学深圳研究生院 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 胡佳炜;郭燕 |
地址: | 518055 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 问答 系统 答案 排序 方法 | ||
1.一种用于问答系统的答案排序方法,其特征在于,包括以下步骤:
步骤S10,获取输入的问题及其候选答案集合;
步骤S20,分别获取所述问题基于文本的句子向量表示,以及候选答案集合中每个候选答案基于文本的句子向量表示;
步骤S30,分别获取所述问题基于知识的句子向量表示,以及候选答案集合中每个候选答案基于知识的句子向量表示;
步骤S40,对于候选答案集合中每个候选答案,根据该候选答案基于文本的句子向量表示和基于知识的句子向量表示,以及所述问题基于文本的句子向量表示和基于知识的句子向量表示,计算得到该候选答案基于知识感知的句子向量,以及该候选答案下所述问题基于知识感知的句子向量;
步骤S50,对于候选答案集合中每个候选答案,根据该候选答案基于知识感知的句子向量和该候选答案下所述问题基于知识感知的句子向量,计算该候选答案与所述问题的相关程度;
步骤S60,根据候选答案集合中每个候选答案与所述问题的相关程度,对候选答案集合中各候选答案进行排序,得到针对所述问题的答案的排序;
其中,所述步骤S20具体包括步骤S21、S23和S25;
步骤S21,分别获取所述问题和每个候选答案的文本信息及其对应的句子实体向量,其中每个文本信息包括若干个词,每个词对应一个句子实体向量;
步骤S23,对于所述问题,根据该问题的文本信息对应的各个句子实体向量,计算得到所述问题基于文本的句子向量表示;
步骤S25,对于候选答案集合中的每个候选答案,根据该候选答案的文本信息对应的各个句子实体向量,计算得到该候选答案基于文本的句子向量表示;
其中,所述步骤S30具体包括步骤S31、S32和S35;
步骤S31,对于所述问题对应的每个句子实体向量,根据一知识图谱的分布式向量表示从该知识图谱中为该问题对应的每个句子实体向量都选择若干个候选实体,以得到该问题对应的每个句子实体向量对应的候选实体集;对于候选答案集合中每个候选答案对应的每个句子实体向量,根据所述知识图谱的分布式向量表示从该知识图谱中为该候选答案对应的每个句子实体向量都选择若干个候选实体,以得到每个候选答案对应的每个句子实体向量对应的候选实体集;
步骤S33,对于所述问题,在所述问题基于文本的句子向量表示的指导下,分别根据所述问题的每个句子实体向量对应的候选实体集,计算得到所述问题的每个句子实体向量对应的候选实体集所对应的实体向量表示;对于候选答案集合中每个候选答案,在该候选答案基于文本的句子向量表示的指导下,分别根据该候选答案的每个句子实体向量对应的候选实体集,计算得到该候选答案的每个句子实体向量对应的候选实体集所对应的实体向量表示;
步骤S35,对于所述问题,根据所述问题的每个句子实体向量对应的候选实体集所对应的实体向量表示,计算得到该问题基于知识的句子向量表示;对于候选答案集合中每个候选答案,根据该候选答案的每个句子实体向量对应的候选实体集所对应的实体向量表示,计算得到该候选答案基于知识的句子向量表示。
2.如权利要求1所述的答案排序方法,其特征在于,
所述步骤S23包括:将所述问题的文本信息对应的各个句子实体向量输入到一个双向长短期记忆网络中进行计算,以得到所述问题基于文本的句子向量表示;
所述步骤S25包括:对于候选答案集合中的每个候选答案,将该候选答案的文本信息对应的各个句子实体向量输入到一个双向长短期记忆网络中进行计算,以得到该候选答案基于文本的句子向量表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学深圳研究生院,未经北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810284245.X/1.html,转载请声明来源钻瓜专利网。