[发明专利]实体关系挖掘方法及设备有效
申请号: | 201910514578.1 | 申请日: | 2019-06-14 |
公开(公告)号: | CN110287270B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 王春宇;夏源;施振辉;陆超;黄海峰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/2458;G16H50/70 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 关系 挖掘 方法 设备 | ||
1.一种实体关系挖掘方法,其特征在于,包括:
将预设疾病列表输入词向量模型,获得第一列表;所述第一列表中包括每种疾病对应的多种症状分别与该疾病之间的相似度;
从所述词向量模型导出症状词表,所述症状词表包括每种症状对应的词频;
针对每种症状,将所述词表中对应于所述症状的词频进行对数运算后,获得词频对数值,并计算所述词频对数值与所述症状对应的相似度之间的乘积,作为所述症状与对应疾病之间的第一概率,获得包括所述第一概率的第二列表;
根据所述第二列表和预设疾病科室列表,确定各症状与对应科室之间的第二概率,获得包括所述第二概率的第三列表;
将所述第三列表作为最终医学实体关系列表输出,以对原有的医学实体关系列表进行更新。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第二列表和预设疾病科室列表,确定各症状与对应科室之间的第二概率,获得包括所述第二概率的第三列表之后,还包括:
将所述第三列表中各症状输入深度学习模型,获得第四列表;所述第四列表包括每种症状与对应科室之间的第三概率;
针对第三列表中每个科室,对该科室对应所有第二概率进行分区,并分别对各分区内的第二概率进行分桶操作,确定每种症状与对应科室之间的第四概率,并获得包括该第四概率的第五列表;
根据预设融合策略,将所述第四列表中的第三概率和所述第五列表中的第四概率进行融合,获得第六列表;
所述将所述第三列表作为最终医学实体关系列表输出,以对原有的医学实体关系列表进行更新,包括:
将所述第六列表作为最终医学实体关系列表输出,以对原有的医学实体关系列表进行更新。
3.根据权利要求2所述的方法,其特征在于,所述根据预设融合策略,将所述第四列表中的第三概率和所述第五列表中的第四概率进行融合,包括:
针对每个第四概率,计算所述第四概率与对应的第三概率之间的比值,以及所述第四概率与对应的第三转移概率之间的差值,并根据所述比值和所述差值,确定所述第四概率对应的最终概率;
根据各最终概率及各最终概率分别对应的症状和科室,获得所述第六列表。
4.根据权利要求3所述的方法,其特征在于,所述根据所述比值和所述差值,确定所述第四概率对应的最终概率,包括:
将所述比值与第一预设阈值进行比较,将所述差值的绝对值与第二预设阈值进行比较;
若所述比值大于第一预设阈值,则将所述第四概率和所述第三概率中的较大值,作为所述第四概率对应的症状和科室所对应的最终转移概率;
若所述差值的绝对值大于第二预设阈值,则将所述第四概率和所述第三概率的平均值,作为所述第四概率对应的症状和科室所对应的最终转移概率;
若所述比值小于第一预设阈值并且所述差值的绝对值小于所述第二预设阈值,则将所述第四概率和所述第三概率中的较小值,作为所述第四概率对应的症状和科室所对应的最终转移概率。
5.根据权利要求1-4任一项所述的方法,其特征在于,在所述将预设疾病列表输入词向量模型之前,还包括:
获取多条自然问询语句,并对每条自然问询语句进行NLU解析,获得多条NLU问询语句;
根据所述多条自然问询语句和所述多条NLU问询语句对待训练模型进行训练,获得所述词向量模型。
6.根据权利要求5所述的方法,其特征在于,所述多条自然问询语句包括第一预设数量的医生与患者之间的多轮交互问诊语句,和/或,第二预设数量的患者单方描述病情的语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910514578.1/1.html,转载请声明来源钻瓜专利网。