[发明专利]一种车属性标注方法、设备及存储介质有效
申请号: | 202111523094.7 | 申请日: | 2021-12-13 |
公开(公告)号: | CN114372446B | 公开(公告)日: | 2023-02-17 |
发明(设计)人: | 董京 | 申请(专利权)人: | 北京爱上车科技有限公司 |
主分类号: | G06F40/169 | 分类号: | G06F40/169;G06F16/335 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 刘戈;张爱 |
地址: | 100015 北京市朝阳区酒仙桥北路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 属性 标注 方法 设备 存储 介质 | ||
本申请实施例提供一种车属性标注方法、设备及存储介质。在本申请实施例中,可从语料数据中抽取出车属性关键词,并为有语料对象确定所对应的车属性关键词;在此基础上,可从有语料对象中,为无语料对象选择参考对象;并基于参考对象关联的车属性关键词来确定对应的无语料对象应关联的车属性关键词。这样,可从少量语料中获取尽可能多的有代表性的车属性关键词,使语料较少或无语料的对象都能获得优良的车属性关键词,从而提高车属性标注的效率和准确性。当然,还可与专家标注相结合,在语料较少或无语料的对象下为专家精准提供候选词,从而加速专家标注效率。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种车属性标注方法、设备及存储介质。
背景技术
目前,对于车辆领域的抽象属性一般有两种标注方式,一种是专家标注,另一种是数据挖掘。
对于语料数据不足的车型,由于无法满足数据挖掘方式所需的数据量要求,因此,只能依赖专家标注方式进行抽象属性的标注,但是,专家标注方式的成本过高、效率过低,给标注工作带来困难。
发明内容
本申请的多个方面提供一种车属性标注方法、设备及存储介质,用以在语料数据不足的情况下,提高车属性的标注效率。
本申请实施例提供一种车属性标注方法,包括:
响应于车属性标注指令,确定多个待标注对象;
获取语料数据;
从所述语料数据中抽取车属性关键词;
分别确定所述多个待标注对象中已被所述语料数据覆盖的至少一个有语料对象各自对应的车属性关键词;
从所述至少一个有语料对象中,为所述多个待标注对象中未被所述语料数据覆盖的至少一个无语料对象选择参考对象;
基于所述至少一个无语料对象各自对应的参考对象关联的车辆属性关键词,确定所述至少一个无语料对象各自对应的车属性关键词;
按照所述至少一个待标注对象各自对应的车属性关键词,对所述至少一个待标注对象进行车属性标注。
本申请实施例还提供一种计算设备,包括存储器和处理器;
所述存储器用于存储一条或多条计算机指令;
所述处理器与所述存储器耦合,用于执行所述一条或多条计算机指令,以用于:
响应于车属性标注指令,确定多个待标注对象;
获取语料数据;
从所述语料数据中抽取车属性关键词;
分别确定所述多个待标注对象中已被所述语料数据覆盖的至少一个有语料对象各自对应的车属性关键词;
从所述至少一个有语料对象中,为所述多个待标注对象中未被所述语料数据覆盖的至少一个无语料对象选择参考对象;
基于所述至少一个无语料对象各自对应的参考对象关联的车辆属性关键词,确定所述至少一个无语料对象各自对应的车属性关键词;
按照所述至少一个待标注对象各自对应的车属性关键词,对所述至少一个待标注对象进行车属性标注。
本申请实施例还提供一种存储计算机指令的计算机可读存储介质,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器执行前述的车属性标注方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京爱上车科技有限公司,未经北京爱上车科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111523094.7/2.html,转载请声明来源钻瓜专利网。