[发明专利]医疗领域深度问答方法及医学检索系统无效
申请号: | 201210125157.8 | 申请日: | 2012-04-25 |
公开(公告)号: | CN102663129A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 徐安莹;吉宗诚;徐飞;王斌 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 领域 深度 问答 方法 医学 检索系统 | ||
技术领域
本发明涉及医学信息处理和检索领域,尤其涉及一种医疗领域深度问答方法及医学检索系统。
背景技术
计算机辅助技术目前已经渗透到医疗、制造、设计、金融、商业咨询等各个领域,加速了各行各业的发展。在医疗领域,医学专家咨询系统一般包括问答模块,用于系统与病人或医生进行交互。
由于医学专家咨询系统返回的答案会影响患者的判断,其结果会引起生命和财产的双重风险,所以,在医学专家咨询系统的准确度达到一定程度之前还不能广泛采用。
现有的医学专家咨询系统中应用的问答方式主要有两种:社区问答和自动问答。
社区问答属于人与人之间的问答,用户在网站中提交问题,一定的时间内,其他用户回答此问题,或者系统根据以前有过的相似问题,返回相关答案。这要基于网站用户的知识结构,往往出现答案形式不确定、不够准确的情况,且回答问题的时间较长。
自动问答系统提供的自动问答功能可以回答简单的问题,基本都是开放领域的,即任何领域的问题都可以输入,这样造成答案准确率低,回答形式固定,不是很人性化。
基于上述问答方法的医学领域的专家咨询系统提供的知识和信息的精度、可信性存在瓶颈,制约了医学专家咨询系统的发展。
发明内容
本发明要解决的技术问题是提供医疗领域深度问答方法及医学检索系统,提高问答结果精度。
根据本发明的一个方面,提供一种深度问答方法,包括:
步骤1、接收提问数据;
步骤2、在知识库数据库中进行第一检索;所述知识库数据库包括百科中的事实性信息;和
步骤3、在自定义数据集中进行第三检索,包括:
步骤3.1、基于句型模式集,利用机器学习的方法给所述问题分类,确定问题的句型模式;和
步骤3.2、用句型模式匹配问题,得到第二类关键字,用第二类关键字检索自定义数据集。
可选的,所述的深度问答方法还包括:
步骤4、在问答对数据库中进行第二检索;所述问答对数据库包括已经证实准确的问答对信息。
可选的,步骤3.1的句型模式集的生成方法包括:
步骤3.1.1、建立自定义数据集;
步骤3.1.2a、人工建立句型模式集;和/或
步骤3.1.2b、通过人工标注数据,训练数据得到句型模式集。
可选的,所述步骤3还包括:
步骤3.3、利用第二类关键词检索知识库数据库。
可选的,步骤1包括:从所述提问数据中提取问题的文本信息。
可选的,步骤2包括:
步骤2.1、以问题中的句子为单位,对每个句子进行分词处理;
步骤2.2、从分词处理结果中提取第一类关键词;和
步骤2.3、利用第一类关键词检索知识库数据库。
可选的,步骤4包括:
步骤4.1、检索问答对数据库,计算所述问题和问答对数据库中的记录的相似度;和
步骤4.2、如果存在相似度达到一定阈值的记录,按照相似度的大小对所述记录进行排名,得到前N个匹配结果,N为自然数。
根据本发明另一个方面,提供一种医学检索系统,包括:
输入模块,用于接收来自用户的输入;
第一检索模块,用于检索知识库数据库;所述知识库数据库包括百科中的事实性信息;和
第三检索模块,用于检索自定义数据集;
其中,所述第三检索模块还包括:
句型模式分析模块,用于基于句型模式集,利用机器学习的方法给所述问题分类,确定问题的句型模式;和
第二类键字提取和检索模块,用于利用句型模式来匹配问题以得到第二类关键字,然后用第二类关键字检索自定义数据集。
可选的,所述医学检索系统还包括:
第二检索模块,用于检索问答对数据库;所述问答对数据库包括已经证实准确的问答对信息。
可选的,所述第二检索模块还包括:
相似度计算模块,用于检索问答对数据库,计算所述问题和问答对数据库中的记录的相似度;和
结果反馈模块,如果存在相似度达到一定阈值的记录,按照相似度的大小对所述记录进行排名,得到前N个匹配结果,N为自然数。
可选的,所述输入模块还用于从所述提问数据中提取问题的文本信息。
可选的,所述第一检索模块还包括:
分词模块,用于以问题中的句子为单位,对每个句子进行分词处理;和
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210125157.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:花生杀菌剂
- 下一篇:一种含乙烯利与氯吡脲的植物生长调节组合物