[发明专利]兴趣点名称选择模型训练方法、使用方法、装置及存储介质有效
申请号: | 201910754946.X | 申请日: | 2019-08-15 |
公开(公告)号: | CN110457706B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 王宇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/289;G06F40/211;G06F40/30;G06F16/35 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 崔晓岚;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 兴趣 名称 选择 模型 训练 方法 使用方法 装置 存储 介质 | ||
1.一种兴趣点名称选择模型训练方法,其特征在于,所述方法包括:
获取不同数据来源的兴趣点数据,并对所述兴趣点数据进行分词处理,形成与所述兴趣点数据相对应的词语级向量,所述词语级向量用于进行词语向量矩阵转换;
确定每一个兴趣点数据中的核心趣点数据和普通兴趣点数据;
根据所述每一个兴趣点数据中的核心趣点数据和普通兴趣点数据,按照相应的数据集文本规则,组成相应的单一数据集样本;
确定所述单一数据集样本的标签,其中,所述标签用于表征所述述单一数据集样本中各个参数之间的比较结果;
根据所述单一数据集样本的标签,构造兴趣点名称选择模型的训练样本;
通过所述兴趣点名称选择模型的特征提取网络,提取与所述训练样本相对应的特征向量,以形成与所述训练样本相对应的待排序数据;
其中,所述待排序数据包括:第一候选名称和第二候选名称;
通过所述兴趣点名称选择模型的排序网络,对所述待排序数据进行排序处理,获取符合命名规则的兴趣点候选名称;
通过所获取的符合命名规则的兴趣点候选名称,调整所述兴趣点名称选择模型中特征提取网络的参数和排序网络的参数。
2.根据权利要求1所述的方法,其特征在于,所述对所述兴趣点数据进行分词处理,形成与所述兴趣点数据相对应的词语级向量,包括:
对所述兴趣点数据进行数据筛选处理,以实现获取符合文法要求的兴趣点数据;
触发目标分词库,并通过所述目标分词库对所述符合文法要求的兴趣点数据进行分词处理,以获得词语级兴趣点数据;
对所述词语级兴趣点数据进行向量化处理,形成兴趣点数据的多维词语级向量。
3.根据权利要求1所述的方法,其特征在于,所述通过所述兴趣点名称选择模型的特征提取网络,提取与所述训练样本相对应的特征向量,以形成与所述训练样本相对应的待排序数据,包括:
通过所述特征提取网络的嵌入层网络利用所述兴趣点数据相对应的词语级向量,对所述训练样本进行词语向量矩阵转换;
通过所述特征提取网络的卷积层网络对所述词语向量矩阵转换的结果进行点乘求和处理;
通过所述特征提取网络的池化层网络对所述点乘求和处理的结果进行池化处理,提取与所述训练样本相对应的特征向量;
确定与所述训练样本所包括的待排序数据相对应的特征向量。
4.根据权利要求1所述的方法,其特征在于,所述通过所述兴趣点名称选择模型的排序网络,对所述待排序数据进行排序处理,获取符合命名规则的兴趣点候选名称,包括:
确定所述待排序数据中的第一候选名称与核心趣点数据的相关性的第一比较结果;
确定所述待排序数据中的第二候选名称与所述核心趣点数据的相关性的第二比较结果;
通过所述兴趣点名称选择模型的排序网络对所述第一比较结果和第二比较结果进行处理,以实现在所述第一候选名称和第二候选名称中确定符合命名规则的兴趣点候选名称。
5.根据权利要求4所述的方法,其特征在于,所述通过所述兴趣点的标准文本与所获取的符合命名规则的兴趣点候选名称,调整所述兴趣点名称选择模型中特征提取网络的参数和排序网络的参数,包括:
根据所述兴趣点名称选择模型能够根据第一评分和第二评分的比值与规范性阈值的比较结果,调整所述兴趣点名称选择模型中特征提取网络的参数和排序网络的参数;以使,
直至能够实现在所述第一候选名称和第二候选名称中确定符合命名规则的兴趣点候选名称时,确定所述兴趣点名称选择模型的特征提取网络的参数和和所述排序网络的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910754946.X/1.html,转载请声明来源钻瓜专利网。