[发明专利]基于主述位的自动问答系统及其实现方法有效

专利信息
申请号: 201610156326.2 申请日: 2016-03-18
公开(公告)号: CN105824933B 公开(公告)日: 2019-02-26
发明(设计)人: 周国栋;奚雪峰;孔芳;王鹏 申请(专利权)人: 苏州大学
主分类号: G06F16/332 分类号: G06F16/332
代理公司: 江苏圣典律师事务所 32237 代理人: 王玉国
地址: 215021 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了基于主述位的自动问答系统及实现方法,包含预处理模块、问题理解模块、信息检索模块、答案抽取模块以及知识库模块,预处理模块,用于对用户问句的分词、词性标注;问题理解模块,对问句进行问题分类、主述位切分;信息检索模块,对问句进行答案检索、相似度排序;答案抽取模块,对检索出的答案进行成分抽取、答案合成;知识库模块,构建答案语料知识库。基于语义理解提出基于主述位的问答系统答案相似度搜索匹配方法,先将答案语料库中的篇章切分为小句,将小句分为主位和述位,来表示小句的篇章结构,通过分析问句的主位以及述位,理解用户提问的意图,了解用户已知的信息,从答案中寻找用户未知的内容,以提高自动问答的正确率。
搜索关键词: 基于 主述位 自动 问答 系统 及其 实现 方法
【主权项】:
1.基于主述位的自动问答系统,其特征在于:包含预处理模块(1)、问题理解模块(2)、信息检索模块(3)、答案抽取模块(4)以及知识库模块(5),所述预处理模块(1),用于对用户问句的分词、词性标注;所述问题理解模块(2),用于对问句进行问题分类、主述位切分;所述信息检索模块(3),用于对问句进行答案检索、相似度排序;所述答案抽取模块(4),用于对检索出的答案进行成分抽取、答案合成;所述知识库模块(5),用于答案语料知识库的构建;所述信息检索模块(3)包含答案检索模块(301)和相似度排序模块(302);所述答案检索模块(301)根据问句的主述位和答案语料的主述位进行相似度计算,根据问句的主述位以及答案语料的主述位进行计算,采用基于统计的VSM相似度计算,将问句去除疑问词语,并判断剩下的成分是在主位还是述位,并与答案语料的主述位分别都用n维的词向量T=(T1,T2,...,Tn)表示,T表示某个文本向量,Ti表示某个特征值,向量中的特征值通过统计的方法得到,再根据余弦公式,则问句成分T和答案语料的主位或述位T’的相似度为引入权值ωi,赋予某些关键的特征值较高的权值进行计算,公式为计算后得到问句剩下的成分与答案语料主位的相似度以及述位的相似度这一结果集,相似度排序模块(302)将计算的结果集进行由大到小排序,提取最相关的答案语料。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610156326.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top