[发明专利]一种老年健康领域知识问答系统构建方法在审
申请号: | 201811325709.3 | 申请日: | 2018-11-08 |
公开(公告)号: | CN109471948A | 公开(公告)日: | 2019-03-15 |
发明(设计)人: | 初佃辉;高见;李春山;申义;黎阳;王涛 | 申请(专利权)人: | 威海天鑫现代服务技术研究院有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/951;G06F16/332;G06F17/27;G16H70/00 |
代理公司: | 威海恒誉润达专利代理事务所(普通合伙) 37260 | 代理人: | 亢会晓 |
地址: | 264209 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 老年健康 领域知识 问答系统 构建 自动问答系统 检索用户 领域数据 医疗健康 准确度 算法 存储 融合 健康 | ||
1.一种老年健康领域知识问答系统构建方法,其特征在于:包括以下步骤:
(1)建立老年健康领域数据模型
通过百科网站和医疗健康的网站提取用户对老年科的疾病所提的问题,根据老年科的疾病所提的问题建立老年健康领域数据模型;
(2)老年健康领域知识的获取
通过老年健康领域数据模型抽取老年健康领域结构化数据、半结构化数据和非机构化数据的实体与关系;
(3)老年健康领域知识的融合
将从老年健康领域数据模型不同源抽取到的老年健康领域的实体和关系进行融合,所述老年健康领域的实体和关系进行融合的主要原则为选择来源更可信的知识以及选择来源更多的知识;
(4)老年健康领域知识的存储
通过三元组的方式对步骤(3)选取的实体和关系进行存储以构建老年健康领域知识图谱;
(5)自动问答系统算法
根据用户数据输入问题的类别、用户历史问答信息和老年健康领域的知识图谱提供构建老年健康领域知识问答系统。
2.根据权利要求1所述的老年健康领域知识问答系统构建方法,其特征在于:所述老年健康领域数据模型抽取老年健康领域的半结构化数据实体和关系的方法为:
首先,所述结构化数据通过D2R的映射将表名转化成对应的实体,其次,所述结构化数据通过D2R的映射将行数据的主键转化成资源的主键,最后,所述结构化数据通过D2R的映射将列数据及外键数据转化成对应的属性形成三元组数据。
3.根据权利要求1所述的老年健康领域知识问答系统构建方法,其特征在于:所述老年健康领域数据模型抽取老年健康领域的半结构化数据实体和关系的方法为:
所述半结构化数据通过包装器从百科网站数据和老年健康相关网站的页面进行分析后爬取实体和关系。
4.根据权利要求1所述的老年健康领域知识问答系统构建方法,其特征在于:所述老年健康领域数据模型抽取老年健康领域的非结构化数据实体和关系的方法为:
所述非结构化数据通过斯坦福自然语言处理NLP工具进行分词并使用实体链接技术将文本中候选实体链接到本地的知识库,当不存在斯坦福自然语言处理NLP工具进行分词的实体时,所述非结构化数据通过命名实体识别进行实体的抽取。
5.根据权利要求4所述的老年健康领域知识问答系统构建方法,其特征在于:所述结构化数据通过命名实体识别进行实体的抽取的方法为:通过基于统计学的方法将老年健康领域数据模型中识别实体间关系的问题转化为分类问题,以老年健康领域数据模型中实体之间关系作为标签,以老年健康领域数据模型中两个实体之间的关系作为训练样本,选取合适的特征,放入到分类模型中进行训练。
6.根据权利要求4所述的老年健康领域知识问答系统构建方法,其特征在于:所述非结构化数据的实体和关系抽取的主要步骤为:
(1)文本数据预处理
对老年健康领域数据模型数据库中的文章数据通过Standford NLP工具以每个句子为单位进行解析,所述解析结果存放到sentences表中为后续特征抽取做准备;
(2)候选实体抽取
以句为单位抽取老年健康领域数据模型数据库文本中的候选实体;
(3)候选实体对生成
筛选出在同句中的不同实体,生成候选实体对;
(4)特征抽取
抽取候选实体对的文本特征;
(5)样本标注
通过人工根据健康领域知识进行实体关系的部分标注;
(6)利用标注好的数据训练分类模型,进行迭代训练;
(7)利用训练好的模型,结合步骤(4)所形成的候选实体对的特征信息进行信息的抽取。
7.根据权利要求1-6任意一项所述的老年健康领域知识问答系统构建方法,其特征在于:所述老年健康领域的实体和关系进行融合的方法为:利用养老服务领域中的实体的余弦相似度进行比较,当其难以准确判别时,利用属性信息相似度的方法判定异构知识来源中的实体是否可以对齐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于威海天鑫现代服务技术研究院有限公司,未经威海天鑫现代服务技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811325709.3/1.html,转载请声明来源钻瓜专利网。