[发明专利]一种基于贝叶斯文本分类模型的辅助挂号方法在审
申请号: | 201410273989.3 | 申请日: | 2014-06-18 |
公开(公告)号: | CN104021302A | 公开(公告)日: | 2014-09-03 |
发明(设计)人: | 崔晓艳;王枞;徐冉;韩旭;古恒 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 斯文 分类 模型 辅助 挂号 方法 | ||
1.一种基于贝叶斯文本分类模型的挂号辅助方法,包括:
对获得的症状主诉文本数据进行预处理;
根据预处理后的数据,训练获得挂号辅助模型;
对得到的挂号辅助分类模型进行评估;
将评估达到要求的模型应用到网络预约挂号系统中进行辅助挂号;
其中,挂号辅助模型是利用贝叶斯文本分类算法训练获得,并根据症状主诉文本数据特征进行了优化。
2.根据权利要求1所述的方法,其中对获得的症状主诉文本数据进行预处理步骤还包括:
中文分词和去停用词,其中中文分词利用症状词表,针对症状主诉文本数据对分词器性能进行优化;去停用词则利用针对疾病主诉文本数据建立的常见停用词表,去掉不具有辨别力的词。
3.根据权利要求1所述的方法,其中根据预处理后的数据,训练获得挂号辅助模型还包括:
根据改进的tf-idf公式对每种疾病向量关键词赋予权重;
根据疾病典型症状词表,为每种疾病的典型症状词赋予绝对权重;
利用分层的贝叶斯算法对加权文本向量进行训练。
4.根据权利要求1所述的方法,对得到的挂号辅助模型进行评估还包括:利用准确率、召回率和F值评价指标和3-折交叉验证的方法建立评估模型,对该模型性能进行评估。
5.根据权利要求1所述的将评估达到要求的挂号辅助模型应用到挂号系统中进行辅助挂号还包括,根据患者输入的主诉症状数据,推荐其对证的专科专家,指导其就医。
6.根据权利要求5所述的模型应用,还包括:
对患者输入的主诉症状进行分词,去停用词,根据症状词表和停用词表抽取具有鉴别力的关键词,并建立关键词向量,再根据keyword表给向量中的词赋予权重,最后根据贝叶斯概率模型,计算各类疾病的概率,获取概率最大的前5条疾病列表,再进行专科专家匹配。
7.根据权利要求3所述的分层贝叶斯算法还包括:
利用疾病大类和疾病所属科室将分类过程划分层次,即先推荐挂号科室和疾病大类,如果仍具有辨别力,再进一步对证的专科专家,如果不具有辨别力,则仅返回疾病大类和科室,不再做进一步分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410273989.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用