[发明专利]医疗领域深度问答方法及医学检索系统无效
申请号: | 201210125157.8 | 申请日: | 2012-04-25 |
公开(公告)号: | CN102663129A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 徐安莹;吉宗诚;徐飞;王斌 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 领域 深度 问答 方法 医学 检索系统 | ||
1.一种深度问答方法,包括:
步骤1、接收提问数据;
步骤2、在知识库数据库中进行第一检索;所述知识库数据库包括百科中的事实性信息;和
步骤3、在自定义数据集中进行第三检索,包括:
步骤3.1、基于句型模式集,利用机器学习的方法给所述问题分类,确定问题的句型模式;和
步骤3.2、用句型模式匹配问题,得到第二类关键字,用第二类关键字检索自定义数据集。
2.根据权利要求1所述的深度问答方法,还包括:
步骤4、在问答对数据库中进行第二检索;所述问答对数据库包括已经证实准确的问答对信息;该步骤在步骤2之前或之后执行。
3.根据权利要求1所述的深度问答方法,步骤3.1的句型模式集的生成方法包括:
步骤3.1.1、建立自定义数据集;
步骤3.1.2a、人工建立句型模式集;和/或
步骤3.1.2b、通过人工标注数据,训练数据得到句型模式集。
4.根据权利要求1所述的深度问答方法,所述步骤3还包括:
步骤3.3、利用第二类关键词检索知识库数据库。
5.根据权利要求1所述的深度问答方法,其中,步骤1包括:从所述提问数据中提取问题的文本信息。
6.根据权利要求1所述的深度问答方法,其中,步骤2包括:
步骤2.1、以问题中的句子为单位,对每个句子进行分词处理;
步骤2.2、从分词处理结果中提取第一类关键词;和
步骤2.3、利用第一类关键词检索知识库数据库。
7.根据权利要求2所述的深度问答方法,其中,步骤4包括:
步骤4.1、检索问答对数据库,计算所述问题和问答对数据库中的记录的相似度;和
步骤4.2、如果存在相似度达到一定阈值的记录,按照相似度的大小对所述记录进行排名,得到前N个匹配结果,N为自然数。
8.一种医学检索系统,包括:
输入模块,用于接收来自用户的输入;
第一检索模块,用于检索知识库数据库;所述知识库数据库包括百科中的事实性信息;和
第三检索模块,用于检索自定义数据集;
其中,所述第三检索模块还包括:
句型模式分析模块,用于基于句型模式集,利用机器学习的方法给所述问题分类,确定问题的句型模式;和
第二类键字提取和检索模块,用于利用句型模式来匹配问题以得到第二类关键字,然后用第二类关键字检索自定义数据集。
9.根据权利要求8所述的医学检索系统,还包括:
第二检索模块,用于检索问答对数据库;所述问答对数据库包括已经证实准确的问答对信息。
10.根据权利要求9所述的医学检索系统,其中,所述第二检索模块还包括:
相似度计算模块,用于检索问答对数据库,计算所述问题和问答对数据库中的记录的相似度;和
结果反馈模块,如果存在相似度达到一定阈值的记录,按照相似度的大小对所述记录进行排名,得到前N个匹配结果,N为自然数。
11.根据权利要求8所述的医学检索系统,其中,所述输入模块还用于从所述提问数据中提取问题的文本信息。
12.根据权利要求8所述的医学检索系统,其中,所述第一检索模块还包括:
分词模块,用于以问题中的句子为单位,对每个句子进行分词处理;和
第一类关键词提取和检索模块,用于从分词处理结果中提取第一类关键词,然后利用第一类关键词检索知识库数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210125157.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:花生杀菌剂
- 下一篇:一种含乙烯利与氯吡脲的植物生长调节组合物