[发明专利]用于将医疗非标准名称标准化的方法及装置在审

申请号：	201711385974.6	申请日：	2017-12-20
公开（公告）号：	CN109949938A	公开（公告）日：	2019-06-28
发明（设计）人：	严君;张永磊;常剑;於今	申请（专利权）人：	北京亚信数据有限公司
主分类号：	G16H50/70	分类号：	G16H50/70
代理公司：	北京中博世达专利商标代理有限公司 11274	代理人：	申健
地址：	100193 北京市海淀区西北旺东路***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了一种用于将医疗非标准名称标准化的方法及装置，涉及医疗、数据分析技术领域，能够提高非标准名称标准化的准确性。其中该方法包括：收集标准名称相关数据和待标准化名称；利用标准名称相关数据训练DL词向量模型和TF‑IDF统计模型；根据DL词向量模型计算待标准化名称与每个标准名称的DL词向量相似度A_i，根据TF‑IDF统计模型计算待标准化名称与每个标准名称的TF‑IDF相似度B_i，根据A_i和B_i计算综合相似度C_i，选择C_i最大的标准名称作为待标准化名称的标准名称。上述方法应用于将医疗非标准名称转化为标准名称的过程中。
搜索关键词：	标准化非标准词向量统计模型相似度医疗数据分析技术综合相似度模型计算数据训练转化
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种用于将医疗非标准名称标准化的方法，其特征在于，所述方法包括以下步骤：S1：收集标准名称相关数据和待标准化名称，其中所述标准名称数据包括：医疗领域中的标准名称与非标准名称的对应关系数据，和医疗领域中的文本数据；S2：利用所述标准名称相关数据，训练DL词向量模型和TF‑IDF统计模型；S3：根据所述DL词向量模型，计算所述待标准化名称与所述标准名称相关数据中的每个标准名称的DL词向量相似度A_i；根据所述TF‑IDF统计模型，计算所述待标准化名称与所述标准名称相关数据中的每个标准名称的TF‑IDF相似度B_i；根据A_i和B_i，计算所述待标准化名称与所述每个标准名称的综合相似度C_i，选择C_i最大的标准名称作为所述待标准化名称的标准名称；其中，i＝1～N，N为所述标准名称相关数据中所包括的标准名称的数量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京亚信数据有限公司，未经北京亚信数据有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201711385974.6/，转载请声明来源钻瓜专利网。

上一篇：基于语音交互的信息安全自助全面健康评估系统
下一篇：慢病管理方法及系统

同类专利

专利分类

G 物理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于将医疗非标准名称标准化的方法及装置在审

专利文献下载