[发明专利]一种确定汽车维修文档主题的方法及相关设备在审
申请号: | 201811075837.7 | 申请日: | 2018-09-14 |
公开(公告)号: | CN109446318A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 刘均;刘新;邓思超 | 申请(专利权)人: | 深圳市元征科技股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/21;G06F17/22;G06F17/27 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518000 广东省深圳市龙*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 汽车维修 待分类文档 文档主题 特征词 文档 概率计算 维修技术 维修 概率 申请 词汇 辨别 | ||
1.一种确定汽车维修文档主题的方法,其特征在于,包括:
获取待分类文档和维修主题,所述待分类文档包含汽车维修信息,所述维修主题为与汽车维修相关的主题;
获得所述待分类文档的特征词集,所述特征词集为所述待分类文档的特征词汇的集合;
依据所述特征词集以及词汇概率计算主题概率,所述词汇概率为所述特征词集中各特征词汇在语意上表达所述维修主题的概率,所述主题概率为所述待分类文档对应到所述维修主题的概率;
依据所述主题概率,确定所述维修主题是否作为所述待分类文档的主题。
2.根据权利要求1所述方法,其特征在于,所述获取待分类文档和维修主题,包括:
接收待分类的维修数据;将所述维修数据转化为所述待分类文档。
3.根据权利要求1所述方法,其特征在于,所述获得所述待分类文档的特征词集,包括:
通过文本分词算法对所述待分类文档进行分词,得到所述待分类文档的词汇集;
删除所述词汇集中的停用词,得到所述特征词集。
4.根据权利要求1所述方法,其特征在于,在所述获取待分类文档和维修主题之后,在所述依据所述特征词集以及词汇概率计算主题概率之前,还包括:
获取训练文档集,所述训练文档集为训练文档的集合,所述训练文档包含汽车维修信息;
获取所述训练文档集的训练词集;所述训练词集为所述训练文档集的特征词汇的集合;
将所述训练词集和所述维修主题输入隐含狄利克雷分布LDA模型中,输出所述词汇概率。
5.根据权利要求1或4所述方法,其特征在于,所述依据所述特征词集以及词汇概率计算主题概率,包括:
将所述特征词集和所述词汇概率输入隐含狄利克雷分布LDA模型中,输出所述主题概率。
6.一种确定汽车维修文档主题的设备,其特征在于,包括:
第一获取单元,用于获取待分类文档和维修主题,所述待分类文档包含汽车维修信息,所述维修主题为与汽车维修相关的主题;
第二获取单元,用于获取所述待分类文档的特征词集,所述特征词集为所述待分类文档的特征词汇的集合;
主题概率计算单元,用于依据所述特征词集以及词汇概率计算主题概率,所述词汇概率为所述特征词集中各特征词汇在语意上表达所述维修主题的概率,所述主题概率为所述待分类文档对应到所述维修主题的概率;
确定单元,用于依据所述主题概率,确定所述维修主题是否作为所述待分类文档的主题。
7.根据权利要求6所述设备,其特征在于,还包括:
第三获取单元,用于获取训练文档集,所述训练文档集为训练文档的集合,所述训练文档包含汽车维修信息;
第四获取单元,用于获取所述训练文档集的特征词集,所述训练词集为所述训练文档集的特征词汇的集合;
词汇概率计算单元,用于将所述训练词集和所述维修主题输入隐含狄利克雷分布LDA模型中,输出所述词汇概率。
8.根据权利要求6或者7所述设备,其特征在于,所述计算单元具体用于将特征词集和所述词汇概率输入隐含狄利克雷分布LDA模型中,输出主题概率。
9.一种确定汽车维修文档主题的设备,其特征在于,包括处理器、存储器、数据库单元、网络接口、通信总线和用户接口;所述处理器、所述存储器、所述数据库单元、所述网络接口和所述用户接口通过所述通信总线相互连接;其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1~6任一项所述的一种确定汽车维修文档主题方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1~5任一项所述的一种确定汽车维修文档主题的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市元征科技股份有限公司,未经深圳市元征科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811075837.7/1.html,转载请声明来源钻瓜专利网。