[发明专利]地图兴趣点的训练模型确定方法、装置及电子设备在审
申请号: | 202011561079.7 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112559885A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 王昆 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9537;G06F16/29;G06F40/295;G06K9/62;G06N20/20 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地图 兴趣 训练 模型 确定 方法 装置 电子设备 | ||
本申请公开了一种地图兴趣点的训练模型确定方法、装置及电子设备,涉及深度学习领域的自然语言处理和大数据技术领域,所述方法包括:获取与兴趣点POI相关的至少一类预训练任务;根据预训练任务,确定第一阶段的训练模型;根据第一阶段的训练模型的参数以及至少一类与POI相关的专有任务,确定第二阶段的训练模型。本申请可以提高在地图POI名称领域的所有下游自然语言处理任务的性能,并且可以作为通用的一个模型参数进行发布,极大提高地图POI的处理效率。
技术领域
本申请公开了一种地图兴趣点的训练模型确定方法、装置、设备、介质及程序产品,尤其涉及深度学习技术领域,具体涉及自然语言处理和大数据。
背景技术
地图类应用利用互联网技术连接真实世界,随着5G和AI的发展,地图行业的数据越来越庞大和丰富,其中除了招牌图像等影像数据,还包括了招牌图像上的POI(Point ofInteresting,兴趣点)名称等文本数据,智能情报中的文本数据等,这一类文本数据都直接或者间接的和POI的名称相关。
POI领域中使用的模型各异,这导致了很多模型无法共享一部分的领域知识,例如LSTM这一类模型都需要从头开始训练相关任务,无法从与之相关的一类任务中汲取领域知识。
现有的预训练模型的参数是在通用语料库上进行反复训练获取的,还不具备POI领域的知识,POI领域中很多语义关系和特征都与通用文本具有很大的差距。虽然可以使用其提供的预训练参数来进行微调,但是在实际工程上效果不好,无法共享进行迁移训练。
发明内容
本申请提供了一种地图兴趣点的训练模型确定方法、装置、设备、介质及程序产品。
根据本申请的一方面,提供了一种地图兴趣点的训练模型确定方法,所述方法包括:
获取与兴趣点POI相关的至少一类预训练任务;
根据所述预训练任务,确定第一阶段的训练模型;
根据所述第一阶段的训练模型的参数以及至少一类与所述POI相关的专有任务,确定第二阶段的训练模型。
根据本申请的另一方面,提供了一种地图兴趣点的训练模型确定装置,包括:
获取模块,用于获取与兴趣点POI相关的至少一类预训练任务;
第一处理模块,用于根据所述预训练任务,确定第一阶段的训练模型;
第二处理模块,用于根据所述第一阶段的训练模型的参数以及至少一类与所述POI相关的专有任务,确定第二阶段的训练模型。
根据本申请的另一方面,提供了一种电子设备,包括:
至少一个处理器;
以及与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请提供的地图兴趣点的训练模型确定方法。
根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请提供的地图兴趣点的训练模型确定方法。
根据本申请的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本申请提供的地图兴趣点的训练模型确定方法。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011561079.7/2.html,转载请声明来源钻瓜专利网。