[发明专利]数据处理方法、医学用语处理系统和医学诊疗系统有效
申请号: | 201710642037.8 | 申请日: | 2017-07-31 |
公开(公告)号: | CN107480135B | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 张振中 | 申请(专利权)人: | 京东方科技集团股份有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/30;G06F16/33;G16H50/20 |
代理公司: | 北京金信知识产权代理有限公司 11225 | 代理人: | 黄威;喻嵘 |
地址: | 100015 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 医学 用语 处理 系统 诊疗 | ||
1.一种数据处理方法,应用于诊疗系统中,其特征在于,包括:
获取用户输入的语句信息;
利用预设算法将所述语句信息划分为多个信息片段,所述多个信息片段包括第一信息片段;
建立各个信息片段的高斯分布;
利用相似度模型计算所述第一信息片段与数据库中的词语之间的相似度;其中,所述数据库用于存储关于医学词语的信息;
所述利用相似度模型计算所述第一信息片段与数据库中的词语之间的相似度,包括:根据计算得到的第一信息片段和所述数据库中的词语的高斯分布的协方差和期望值,建立相似度模型;所述相似度模型的表达式为
其中,d为常数,u信息片段的高斯分布的期望,∑为信息片段的高斯分布的协方差,w1和w2为两个信息片段,N为信息片段的矩阵形式的多维高斯分布;
计算所述第一信息片段与所述数据库中的词语之间的相似度;
获取至少一个用于描述所述第一信息片段的第二信息片段;
所述获取至少一个用于描述所述第一信息片段的第二信息片段包括:
根据所述数据库中的词语与所述第一信息片段的相似度,对所述数据库中的词语进行排序,得到相似度最大的预设数目个词语;
将所述预设数目个词语作为所述第二信息片段;
其中建立各信息片段的高斯分布包括:
以矩阵的形式表示各个所述信息片段的高斯分布;
利用随机梯度下降算法计算各个所述信息片段的高斯分布的协方差和期望值;
基于计算得到的协方差和期望值建立高斯分布。
2.根据权利要求1所述的方法,其中,所述利用预设算法将所述语句信息划分为多个信息片段包括:
利用自然语言处理算法按照词性将所述语句信息划分成多个信息片段。
3.根据权利要求1所述的方法,其中利用随机梯度下降算法计算各个所述信息片段的高斯分布的协方差和期望值包括:
通过求解目标函数最小化的方式计算所述协方差和期望值,其中目标函数的表达式为:
L(w,cp,cn)=max(0,1-S1(w,cp)+S1(w,cn));
其中,w表示信息片段的信息,cp表示在语句中出现在w的上下文中的信息片段,cn表示在语句中没有出现在w的上下文中的词语,函数S1(w,cn)表示w和cn相似度函数,S1(w,cp)表示w和cp的相似度,max()表示最大值函数。
4.根据权利要求1所述的方法,其中,所述以矩阵的形式表示各个所述信息片段的高斯分布包括:
所述高斯分布为多维高斯分布,并且所述矩阵形式的多维高斯分布的表达式为N(μw,∑w),
其中,∑w表示信息片段w的高斯分布的协方差,uw表示信息片段w的高斯分布的期望。
5.根据权利要求1所述的方法,其中,所述数据库包括:医学文献、医学知识库和电子病历中的至少一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司,未经京东方科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710642037.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法和系统
- 下一篇:一种应用于电影剧本中情感曲线分析的方法