[发明专利]一种基于深度强化学习的云边协同文档分类系统及方法有效
申请号: | 202110222422.3 | 申请日: | 2021-03-01 |
公开(公告)号: | CN112579784B | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 马勇;邵诗韵;李辉;戴梦轩;徐凡;钱辉;赵从俊 | 申请(专利权)人: | 江西师范大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南昌金轩知识产权代理有限公司 36129 | 代理人: | 黄亮亮 |
地址: | 330022 *** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 强化 学习 协同 文档 分类 系统 方法 | ||
1.一种基于深度强化学习的云边协同文档分类系统,其特征在于,包括:机器文档关键词分析模块,机器文档摘要分析模块,机器文档内容分类模块,人工分类模块,文档分类效率评价模块,专家文档分类模块,结果存储模块和机器在线学习模块;
所述机器文档关键词分析模块,用于利用训练好的关键词提取模型得到待分类文档的文档关键词;
所述机器文档摘要分析模块,用于利用训练好的摘要生成模型得到待分类文档的文档摘要;
所述机器文档内容分类模块,用于利用所述文档关键词和所述文档摘要得到待分类文档的第一分类标签;
所述人工分类模块,用于提供所述待分类文档的文档摘要、文档关键词和第一分类标签来辅助文档分类人员进行文档分类得到第二分类标签;
所述文档分类效率评价模块,用于记录文档分类人员在所述人工分类模块进行文档分类时的效率参数,并计算分类效率值;分类效率值超过设定阈值时,将第二分类标签作为最终分类标签,与待分类文档及文档摘要、文档关键词一起发送到结果存储模块;将分类效率值小于设定阈值的待分类文档及文档摘要、文档关键词和第一分类标签发到专家文档分类模块;
所述专家文档分类模块,用于将所述待分类文档的文档摘要、文档关键词和第一分类标签呈现给专家来进行文档分类得到第三分类标签;将第三分类标签作为最终分类标签,与专家进行过文档分类得到的已分类文档、文档摘要和文档关键词一起发送到结果存储模块;
所述结果存储模块,用于存储已分类的文档,文档摘要,文档关键词,第一分类标签,第二分类标签,第三分类标签,最终分类标签,效率参数和分类效率值;
所述机器在线学习模块,用于定期,或者当结果存储模块中新增的已分类文档及文档摘要、文档关键词和最终分类标签达到设定数量时使用已分类文档及文档摘要、文档关键词和最终分类标签作为训练集更新关键词提取模型、摘要生成模型和文档分类模型的参数;统计所有已分类文档中最终分类标签与第一分类标签相同的文档的比例作为文档分类模型的正确率,当正确率低于设定正确率时使用已分类文档及文档摘要、文档关键词和最终分类标签作为训练集更新关键词提取模型、摘要生成模型和文档分类模型的参数;
所述效率参数包括文档分类时间、文档分类变更次数、模型最高分类标签概率和人工标签分类概率;
其中,所述机器文档内容分类模块采用训练好的文档分类模型对待分类文档进行分类得到的第一分类标签;文档分类模型为SVM模型、KNN模型、决策树模型或基于循环神经网络的分类模型;模型最高分类标签概率,是计算机预处理模块处理当前文档对应于各个分类的概率最大值;人工标签分类概率= 1/分类标签总数。
2.如权利要求1所述的一种基于深度强化学习的云边协同文档分类系统,其特征在于,所述计算分类效率值,使用的计算方式如下:
若时间耗费比0.3,则分类效率值=0.8;
否则,分类效率值=时间权值*exp(-文档分类变更次数)*模型最高分类标签概率*人工标签分类概率;
其中,时间耗费比=文档分类时间/文档分类平均时间,时间权值=exp(1-时间耗费比);exp(x)表示e的x次方;模型最高分类标签概率,是计算机预处理模块处理当前文档对应于各个分类的概率最大值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西师范大学,未经江西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110222422.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:燃气管道加工用对接固定装置
- 下一篇:一种多数据库数据处理方法及系统