[发明专利]一种车辆实体识别方法、电子设备、存储介质、系统有效
申请号: | 201711185953.X | 申请日: | 2017-11-23 |
公开(公告)号: | CN108170708B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 刘晨晨 | 申请(专利权)人: | 杭州大搜车汽车服务有限公司 |
主分类号: | G06F16/2452 | 分类号: | G06F16/2452;G06F40/232 |
代理公司: | 杭州华进联浙知识产权代理有限公司 33250 | 代理人: | 李丽华 |
地址: | 310000 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明一种车辆实体识别方法,包括步骤生成角色集合,角色抽取,车辆实体识别,更新角色集合,采用抽取标准车型库和车辆语料库的车辆角色生成车辆角色集合,根据车辆角色集合对原始车辆文本进行车辆角色抽取,将原始车辆角色映射为车辆角色序列,比较车辆角色序列的车辆实体字符串与标准车型库的车辆实体,获得相似度最高的车辆实体;本发明涉及电子设备与可读存储介质,用于执行一种车辆实体识别方法;本发明还涉及一种车辆实体识别系统;本发明实现对用户输入的原始车辆文本进行准确的车辆实体识别,将原始车辆角色更新至车辆角色集合,极大的减少了人工映射的工作量,无需人工制定大量规则,扩展性好,准确率高,兼容性好。 | ||
搜索关键词: | 一种 车辆 实体 识别 方法 电子设备 存储 介质 系统 | ||
【主权项】:
1.一种车辆实体识别方法,其特征在于包括以下步骤:
角色抽取,对原始车辆文本进行车辆角色抽取,获得若干原始车辆角色,将若干所述原始车辆角色映射为车辆角色序列;
车辆实体识别,获取所述车辆角色序列的车辆实体字符串,比较所述车辆实体字符串与标准车型库的车辆实体,获得相似度最高的车辆实体。
2.如权利要求1所述的一种车辆实体识别方法,其特征在于:还包括步骤生成角色集合和步骤更新角色集合,所述步骤生成角色集合为抽取所述标准车型库和车辆语料库的车辆角色生成车辆角色集合;所述步骤更新角色集合为将所述原始车辆角色添加至所述车辆角色集合。3.如权利要求2所述的一种车辆实体识别方法,其特征在于,所述步骤生成角色集合包括:抽取所述标准车型库和所述车辆语料库的车辆实体角色、车辆组成元素角色、车辆实体的上文角色、车辆实体的下文角色,根据所述车辆实体角色、车辆组成元素角色、车辆实体的上文角色、车辆实体的下文角色生成所述车辆角色集合。4.如权利要求3所述的一种车辆实体识别方法,其特征在于,所述步骤角色抽取包括:对所述原始车辆文本进行分词处理,根据所述车辆角色集合对分词处理结果进行车辆实体角色、车辆组成元素角色、车辆实体的上文角色、车辆实体的下文角色抽取,将角色抽取结果映射为所述车辆角色序列。5.如权利要求4所述的一种车辆实体识别方法,其特征在于,所述步骤车辆实体识别包括:判断所述车辆角色序列是否包含车辆实体角色,是则抽取所述车辆角色序列的车辆实体角色,并将所述车辆角色序列的车辆实体角色映射为车辆实体;否则将所述车辆角色序列与车辆字典树进行匹配,获得所述车辆角色序列的车辆实体字符串,将所述车辆实体字符串映射为车辆实体文本,比较所述车辆实体文本与所述标准车型库的车辆实体,获得相似度最高的车辆实体。6.一种电子设备,其特征在于包括:处理器;存储器;以及程序,其中所述程序被存储在所述存储器中,并且被配置成由处理器执行,所述程序包括用于执行如权利要求1‑5任意一项所述的方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行如权利要求1‑5任意一项所述的方法。8.一种车辆实体识别系统,其特征在于:包括车辆角色抽取模块、车辆实体识别模块,所述车辆角色抽取模块对原始车辆文本进行车辆角色抽取,获得若干原始车辆角色,将若干所述原始车辆角色映射为车辆角色序列;所述车辆实体识别模块获取所述车辆角色序列的车辆实体字符串,比较所述车辆实体字符串与标准车型库的车辆实体,获得相似度最高的车辆实体。9.如权利要求8所述的一种车辆实体识别系统,其特征在于:还包括车辆角色集合生成模块,所述车辆角色集合生成模块抽取所述标准车型库和车辆语料库的车辆角色生成车辆角色集合;所述车辆实体识别模块还包括车辆角色集合更新模块,所述车辆角色集合更新模块将所述原始车辆角色添加至所述车辆角色集合。10.如权利要求9所述的一种车辆实体识别系统,其特征在于:所述车辆角色集合生成模块抽取所述标准车型库和所述车辆语料库的车辆实体角色、车辆组成元素角色、车辆实体的上文角色、车辆实体的下文角色,并根据所述车辆实体角色、车辆组成元素角色、车辆实体的上文角色、车辆实体的下文角色生成所述车辆角色集合。11.如权利要求10所述的一种车辆实体识别系统,其特征在于:所述车辆角色抽取模块还包括分词模块,所述分词模块对所述原始车辆文本进行分词处理,所述车辆角色抽取模块根据所述车辆角色集合对分词处理结果进行车辆实体角色、车辆组成元素角色、车辆实体的上文角色、车辆实体的下文角色抽取,将角色抽取结果映射为所述车辆角色序列。12.如权利要求11所述的一种车辆实体识别系统,其特征在于:所述车辆角色抽取模块还包括车辆实体字符串抽取模块和相似度比较模块,所述车辆实体字符串抽取模块将所述车辆角色序列与车辆字典树进行匹配,获得所述车辆角色序列的车辆实体字符串,所述相似度比较模块将所述车辆实体字符串映射为车辆实体文本,比较所述车辆实体文本与所述标准车型库的车辆实体,获得相似度最高的车辆实体。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州大搜车汽车服务有限公司,未经杭州大搜车汽车服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711185953.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种数据质量检测的方法和系统
- 下一篇:事件格生成方法