[发明专利]基于NLP的维保车况智能识别方法及装置在审
申请号: | 201910890998.X | 申请日: | 2019-09-20 |
公开(公告)号: | CN110610007A | 公开(公告)日: | 2019-12-24 |
发明(设计)人: | 钟建锋;陈美兰 | 申请(专利权)人: | 广州穗圣信息科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06Q40/08 |
代理公司: | 11303 北京方韬法业专利代理事务所(普通合伙) | 代理人: | 党小林 |
地址: | 510000 广东省广州市越秀区沿江中*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分词处理 故障类型 智能识别 车况 专家规则 专业评估 规则库 评估师 词库 匹配 保证 | ||
本发明提供了一种基于NLP的维保车况智能识别方法及装置。所述方法包括:根据由结合评估师整理的专家规则以及程序利用相关技术共同形成的分词库,对维保内容进行分词处理;对分词处理的结果进行语序判断;根据专业评估师整理得出的部件规则库,对语序判断的结果进行匹配,识别是否出现故障,以及出现的故障类型。本发明提供的基于NLP的维保车况智能识别方法及装置能够保证在维保过程中保证故障类型被准确的识别。
技术领域
本发明涉及自然语言处理技术领域,特别是涉及一种基于NLP的维保车况智能识别方法及装置。
背景技术
目前,制约NLP发展的因素也构成了NLP的难点,这些主要难点有:
中文分词:汉语的博大精深,使得中文分词技术在实际应用中很难表现得如最初预期,同一个模型在英文文本中的表现上一般要比中文文本好。而作为NLP的其他技术领域的底层技术,分词结果不好的话,其他部分再怎么努力也都是无济于事。
词义消歧与二义性:有些句子,指代或者意义表述并不明确,需要通过上下文进行学习,如果文本本身带有歧义,则计算机是永远都无法处理的。
文本相似度计算:目前没有一种方法能够从理论证明哪种计算方法是比较准确的,依然属于经验阶段,主流使用的是余弦相似度,也有用欧式距离、曼哈顿距离、直接向量内积等等。
由于车辆维保记录是由专业的维修人员在4S店维修系统上录入的,存在很多专业的车辆相关术语描述外行人不一定能够分析出,那么就可能会需要专业人士进行解读,这时会出现的问题有:
信息不透明、个人不诚信的问题:由于利益牵扯的各方较多,有可能会造成专业人士不能公平公正解读的情况。
无法形成稳定可靠的分析结果:由于个人主观因素影响,不同人对维保内容的解读有可能不一定完全一致,结果也不存在客观性。
耗费精力和时间:在寻找专业人士解读的过程是比较费时的,同时人工解读的过程也是比较费时费力的。
发明内容
本发明要解决的技术问题是提供一种基于NLP的维保车况智能识别方法及装置,从而保证在维保过程中保证故障类型被准确的识别。
为解决上述技术问题,本发明提供了一种基于NLP的维保车况智能识别方法,所述方法包括:根据由结合评估师整理的专家规则以及程序利用相关技术共同形成的分词库,对维保内容进行分词处理;对分词处理的结果进行语序判断;根据专业评估师整理得出的部件规则库,对语序判断的结果进行匹配,识别是否出现故障,以及出现的故障类型。
在一些实施方式中,所述分词库中存储有:规则库关键词,以及剔除词。
在一些实施方式中,所述分词库中存储有:部件名词,以及维保动词。
在一些实施方式中,对分词处理的结果进行语序判断,包括:对分词库筛选后的关键词,按照顺序逐个寻找与其匹配的关键词;名词与动词两两组合,得到名词与动词组合的关键词组。
在一些实施方式中,还包括:对是否出现故障,以及故障类型的识别结果进行准确度统计分析;对统计分析结果进行处理,以扩充所述分词库。
在一些实施方式中,对统计分析结果进行处理,以扩充所述分词库,包括:对由于分词库数据不全而造成的漏识别数据进行关键词识别;将识别到的关键词添加至所述分词库。
在一些实施方式中,还包括:对是否出现故障,以及故障类型的识别结果进行准确度统计分析;对统计分析结果进行处理,以扩充所述规则库。
在一些实施方式中,对统计分析结果进行处理,以扩充所述规则库,包括:对因规则库数据不全而造成的漏识别数据进行规则识别;将识别得到的规则添加至所述规则库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州穗圣信息科技有限公司,未经广州穗圣信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910890998.X/2.html,转载请声明来源钻瓜专利网。