[发明专利]一种确定汽车维修文档主题的方法及相关设备在审
申请号: | 201811075837.7 | 申请日: | 2018-09-14 |
公开(公告)号: | CN109446318A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 刘均;刘新;邓思超 | 申请(专利权)人: | 深圳市元征科技股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/21;G06F17/22;G06F17/27 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518000 广东省深圳市龙*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 汽车维修 待分类文档 文档主题 特征词 文档 概率计算 维修技术 维修 概率 申请 词汇 辨别 | ||
本申请公开了一种确定汽车维修文档主题的方法以及相关设备,该方法包括:获取待分类文档和维修主题;获得所述待分类文档的特征词集;依据所述特征词集以及词汇概率计算主题概率;依据所述主题概率,确定所述维修主题是否作为所述待分类文档的主题。采用本申请,可以准确地识别汽车维修文档的主题,提高辨别汽车维修文档的效率,节省维修技术人员的时间。
技术领域
本申请涉及计算机技术领域,尤其涉及一种确定汽车维修文档主题的方法及相关设备。
背景技术
在汽车维修过程中,会产生大量的维修文档。这些文档包含许多与汽车维修相关的信息,对这些信息进行有效利用,可以提高汽车维修厂维修水平,增加客户的满意度。而识别汽车维修文档所描述的主题,可以针对上述主题给出相应的建议和方案,给维修过程带来有益效果。上述主题的类型包括车型、故障模块、车辆品牌等。一般来说,由于汽车零配件繁多,系统复杂,一篇维修文档中通常会提到多个车型、零部件或者系统,维修技术人员需要仔细阅读,才能准确地判断这些维修文档所描述的主题。在这个过程中,维修技术人员耗费了大量时间和精力。
现有技术通过关键词匹配方法,搜索汽车维修文档中与某个主题相匹配的关键词,进而判断该文档的主题。但是,这种方法层次比较简单,无法准确地判断汽车维修文档的主题。
发明内容
本申请提出一种确定汽车维修文档主题的方法及相关设备,可以用于确定汽车维修文档的主题,提高辨别汽车维修文档的效率。
第一方面,本申请提出一种确定汽车维修文档主题的方法,包括:
获取待分类文档和维修主题,所述待分类文档包含汽车维修信息,所述维修主题为与汽车维修相关的主题;
获得所述待分类文档的特征词集,所述特征词集为所述待分类文档的特征词汇的集合;
依据所述特征词集以及词汇概率计算主题概率,所述词汇概率为所述特征词集中各特征词汇在语意上表达所述维修主题的概率,所述主题概率为所述待分类文档对应到所述维修主题的概率;
依据所述主题概率,确定所述维修主题是否作为所述待分类文档的主题。
结合第一方面,在一种可能的实现方式中,在所述获取待分类文档和维修主题之后,在所述依据所述特征词集以及词汇概率计算主题概率之前,还包括:
获取训练文档集,所述训练文档集为训练文档的集合,所述训练文档包含汽车维修信息;
获取所述训练文档集的训练词集;所述训练词集为所述训练文档集的特征词汇的集合;
将所述训练词集和所述维修主题输入隐含狄利克雷分布LDA模型中,输出所述词汇概率。
结合第一方面,在一种可能的实现方式中,所述依据所述特征词集以及词汇概率计算主题概率,包括:
将所述特征词集和所述词汇概率输入隐含狄利克雷分布LDA模型中,输出所述主题概率。
结合第一方面,在一种可能的实现方式中,在依据所述主题概率,确定所述维修主题是否作为所述待分类文档的主题之后,还包括:
若确定所述维修主题作为所述待分类文档的维修主题,则将所述维修主题添加到所述待分类文档的标题中;或者,将所述待分类文档存储到所述维修主题所对应的存储区域。
第二方面,本申请实施例提供了一种确定汽车维修文档主题的设备,包括:
第一获取单元,用于获取待分类文档和维修主题,所述待分类文档包含汽车维修信息,所述维修主题为与汽车维修相关的主题;
第二获取单元,用于获取所述待分类文档的特征词集,所述特征词集为所述待分类文档的特征词汇的集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市元征科技股份有限公司,未经深圳市元征科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811075837.7/2.html,转载请声明来源钻瓜专利网。