[发明专利]问诊正则表达式生成方法、装置、设备及存储介质在审
申请号: | 202110482326.2 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113191141A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 周尚思 | 申请(专利权)人: | 康键信息技术(深圳)有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F16/332;G06F16/36;G06K9/46;G06K9/62;G16H50/20 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问诊 正则 表达式 生成 方法 装置 设备 存储 介质 | ||
1.一种问诊正则表达式生成方法,其特征在于,所述问诊正则表达式生成方法包括:
获取多个问诊数据和对应的诊断结果,并基于所述诊断结果对对应的问诊数据进行标注,得到表达式生成样本集;
利用预设的疾病知识图谱识别模型,对所述表达式生成样本集中的每个样本进行病症特征的提取,生成每个样本的特征集;
根据所有样本的特征集生成共现矩阵,并计算所述共现矩阵中各病症特征之间的组合频率;
筛选所述组合频率中满足预设值的病症特征组合进行向量化处理,并基于向量化后的特征组合生成对应的正则表达式。
2.根据权利要求1所述的问诊正则表达式生成方法,其特征在于,所述基于所述诊断结果对对应的问诊数据进行标注,得到表达式生成样本集包括:
根据所述诊断结果,从预设的诊断标签表中查询出与所述诊断结果对应的标签;
确定与所述诊断结果对应的问诊数据,利用中文标记算法对所述问诊数据中的每个字设置上所述标签的标记,得到标记数据;
根据所述标签对所有所述标记数据进行分类,生成多个标记数据子集,其中所述分类为将所有所述标记数据中标签相同的进行合并,得到一个标记数据子集;
将多个标记数据子集生成表达式样本集。
3.根据权利要求2所述的问诊正则表达式生成方法,其特征在于,所述将多个标记数据子集生成表达式样本集包括:
根据中文语法规则对每个标记数据子集中的标记数据进行单独分析,确定所述标记数据子集的主体内容和非主体内容;
利用分词工具将所述非主体内容从对应的标记数据子集中的标记数据中去除,直到所有标记数据子集完成去除非主体内容后,生成表达式样本集。
4.根据权利要求3所述的问诊正则表达式生成方法,其特征在于,所述根据中文语法规则对每个标记数据子集中的标记数据进行单独分析,确定所述标记数据子集的主体内容和非主体内容包括:
根据中文语法规则对每个标记数据子集中的标记数据进行分词处理,得到所述标记数据子集的字词及对应的词性;
根据语法规则和所述标记数据子集中的字词和对应的词性,对所述标记数据子集中的标记数据进行句式进行分析,得到所述标记数据子集的句式结构;
根据所述句式结构,提取出所述标记数据子集中每个标记数据的主体内容和非主体内容。
5.根据权利要求2-4中任一项所述的问诊正则表达式生成方法,其特征在于,所述疾病知识图谱识别模型包括停用词识别网络和病症识别网络,所述利用预设的疾病知识图谱识别模型,对所述表达式生成样本集中的每个样本进行病症特征的提取,生成每个样本的特征集包括:
利用所述停用词识别网络对所述标记数据子集的主体内容中的每个字词进行语义的识别,并基于识别的结果筛选出无明显语义的字词进行标注,得到标注主体内容;
利用分析技术将所述标注主体内容中无明显语义的字词进行删除,得到样本分词;
通过所述病症识别网络对所述样本分词进行病症特征的识别和分割,得到所述标记数据子集的特征集。
6.根据权利要求5所述的问诊正则表达式生成方法,其特征在于,所述根据所有样本的特征集生成共现矩阵,并计算所述共现矩阵中各病症特征之间的组合频率包括:
根据各所述标记数据子集的特征集中的病症特征构建对应的矩阵表,其中,所述矩阵表包括矩阵表头和矩阵内容表,所述矩阵表头包括列表头和行表头,每个矩阵表中的列表头和行表头中均包含有对应标记数据子集的特征集中的所有病症特征;
统计各标记数据子集中的所述列表头和行表头的病症特征组合在同一个标记数据中出现的次数,并添加到对应的矩阵内容表中,得到各标记数据子集的共现矩阵;
将所述次数计算对应的病症特征组合的组合频率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于康键信息技术(深圳)有限公司,未经康键信息技术(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110482326.2/1.html,转载请声明来源钻瓜专利网。