[发明专利]生成兴趣点提取模型和提取兴趣点的方法和装置在审
申请号: | 202011305756.9 | 申请日: | 2020-11-20 |
公开(公告)号: | CN112380849A | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 谢红伟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/30;G06N3/08 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 兴趣 提取 模型 方法 装置 | ||
本申请公开了生成兴趣点提取模型的方法、装置和提取兴趣点的方法、装置、设备、存储介质,涉及人工智能技术领域,具体为深度学习和地图技术。具体实现方案为:获取主任务样本集和子任务样本集,其中,主任务样本包括文本信息和标注的兴趣点,子任务样本包括兴趣点和标签;将主任务样本集中每个文本信息作为输入,将标注的兴趣点作为期望输出,训练多任务学习模型的共享层和第一条件随机场层;将子任务样本集中每个兴趣点作为输入,将标签作为期望输出,训练多任务学习模型的共享层和子任务输出层;若达到预定的训练完成条件,将共享层和第一条件随机场层确定为兴趣点提取模型。该实施方式引入多任务机制,提升了兴趣点提取的准确率和召回率。
技术领域
本申请涉及人工智能技术领域,具体为深度学习和地图技术。
背景技术
兴趣点(Point of Interest,POI)一般是电子地图中标注的地理信息点,可以用来查找地标点或者建筑物,例如商场、停车场、学校、医院、酒店、饭店、超市、公园、旅游景点等。
通用兴趣点提取技术广泛应用于互联网情报挖掘、富内容链指兴趣点和跨app相互调起等场景,是地图兴趣点建设中的通用基础技术之一。
现有兴趣点提取技术主要是基于单任务的兴趣点提取模型,适用场景也主要是互联网情报挖掘领域,缺乏全场景的应用领域。
发明内容
本公开提供了一种生成兴趣点提取模型的方法、装置和提取兴趣点的方法、装置、设备以及存储介质。
根据本公开的第一方面,提供了一种生成兴趣点提取模型的方法,包括:获取主任务样本集和子任务样本集,其中,主任务样本包括文本信息和标注的兴趣点,子任务样本包括兴趣点和标签。将主任务样本集中每个文本信息作为输入,将每个文本信息对应的标注的兴趣点作为期望输出,训练多任务学习模型的共享层和第一条件随机场层。将子任务样本集中每个兴趣点作为输入,将每个兴趣点对应的标签作为期望输出,训练多任务学习模型的共享层和子任务输出层。响应于确定出多任务学习模型达到预定的训练完成条件,将共享层和第一条件随机场层确定为兴趣点提取模型。
根据本公开的第二方面,提供了一种提取兴趣点的方法,包括:获取待提取兴趣点的文本信息。将文本信息输入根据第一方面中任一项的方法训练出的兴趣点提取模型,输出至少一个兴趣点。
根据本公开的第三方面,提供了一种生成兴趣点提取模型的装置,包括:样本获取单元,被配置成获取主任务样本集和子任务样本集,其中,主任务样本包括文本信息和标注的兴趣点,子任务样本包括兴趣点和标签。主任务训练单元,被配置成将主任务样本集中每个文本信息作为输入,将每个文本信息对应的标注的兴趣点作为期望输出,训练多任务学习模型的共享层和第一条件随机场层。子任务训练单元,被配置成将子任务样本集中每个兴趣点作为输入,将每个兴趣点对应的标签作为期望输出,训练多任务学习模型的共享层和子任务输出层。输出单元,被配置成响应于确定出多任务学习模型达到预定的训练完成条件,将共享层和第一条件随机场层确定为兴趣点提取模型。
根据本公开的第四方面,提供了一种提取兴趣点的装置,包括:文本获取单元,被配置成获取待提取兴趣点的文本信息。提取单元,被配置成将文本信息输入根据第一方面中任一项的装置训练出的兴趣点提取模型,输出至少一个兴趣点。
根据本公开的第五方面,提供了一种电子设备,其特征在于,包括:至少一个处理器。以及与至少一个处理器通信连接的存储器。其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行第一方面中任一项的方法。
根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,计算机指令用于使计算机执行第一方面中任一项的方法。
根据本申请的技术,由于引进了多任务机制,可有效解决兴趣点特征表达通用性的问题,提升了模型的泛化能力,并减少了模型过拟合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011305756.9/2.html,转载请声明来源钻瓜专利网。