[发明专利]一种基于流行性感冒智能认知模型的系统及设备在审
申请号: | 202011060346.2 | 申请日: | 2020-09-30 |
公开(公告)号: | CN112242200A | 公开(公告)日: | 2021-01-19 |
发明(设计)人: | 杜登斌;杜小军;杜乐 | 申请(专利权)人: | 吾征智能技术(北京)有限公司 |
主分类号: | G16H50/80 | 分类号: | G16H50/80;G06F40/216;G06F40/289;G06K9/62 |
代理公司: | 武汉红观专利代理事务所(普通合伙) 42247 | 代理人: | 李季 |
地址: | 100000 北京市海淀区西三旗沁春*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 流行性感冒 智能 认知 模型 系统 设备 | ||
1.一种基于流行性感冒智能认知模型的系统,其特征在于:包括文本预处理单元、文本表示单元、模型建立单元和学习更新单元;
文本预处理单元,获取流行性感冒症状描述的文本,采用词组为特征单位对症状描述的文本进行分词处理,将症状描述的文本用词组来表示,去掉其中的停用词,得到待分类的文本,并将待分类的文本输入文本表示单元中;
文本表示单元,将待分类文本表示为观测序列,由高维空间映射到低维空间,得到维数约简后的待分类文本;将维数约简后的各待分类文本分别向量化,得到观测序列X,X={x1,x2,…xi,…xN},x1,x2,…xi,…xN为各待分类文本分别向量化后的观测向量;获取引发流行性感冒症状所有对应的类型,并对其向量化,作为与观测序列对应的状态序列Y,Y={y1,y2,…yi,…yN},y1,y2,…yi,…yN为观测向量对应的状态值;将观测序列X和状态序列Y构成训练集并输入模型建立单元中;
模型建立单元,通过上述观测序列X和状态序列Y构建线链条件随机场,计算观测序列中的观测向量所对应的状态值;
学习更新单元,对线链条件随机场进行迭代学习,并获取观测向量中有效特征词组的数量和词组频率,按词组频率的高低进行排序。
2.如权利要求1所述的一种基于流行性感冒智能认知模型的系统,其特征在于:所述分词处理,是采用中文分词工具jieba分词进行搜索引擎模式分词处理。
3.如权利要求2所述的一种基于流行性感冒智能认知模型的系统,其特征在于:所述对待分类的文本的维数约简,是采用t-SNE降维算法,将待分类的文本的维数约简为3维—5维,具体内容为:
令高维空间的条件概率A表示待分类文本所在的高维空间;Ai、Aj和Ak为高维空间A内的症状特征词组的样本;Pji表示Ai分布在Aj周围的概率;σi为以Ai为中心的高斯均方差;令高维空间内的症状特征词组约简后的低维空间为B,Ai、Aj和Ak在低维空间B对应的样本为Bi、Bj和Bk;Qji表示在低维空间中的样本Bi分布在样本Bj周围的概率;用散度C表示两个分布Pji和Qji的差距:则梯度公式为:
4.如权利要求3所述的一种基于流行性感冒智能认知模型的系统,其特征在于:所述σi的取值范围为[0.25,1]。
5.如权利要求4所述的一种基于流行性感冒智能认知模型的系统,其特征在于:所述构建线链条件随机场,是令状态值y1,y2,…yN之间存在一阶马尔科夫独立性,设线链条件随机场为P(Y|X):
其中fk(yi-1,yi,X,i)是特征函数,特征函数依赖当前状态值yi和前一个状态值yi-1,特征函数的取值范围为1或者0;λk是特征函数的权值,λk={λ1,λ2,…λK},k=1,2,3…,K,λk取值范围[0,1];Z(X)为规范化因子:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吾征智能技术(北京)有限公司,未经吾征智能技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011060346.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于临时表的发票数据批量入库方法
- 下一篇:一种工业废水处理用环保设备