[发明专利]一种媒资数据的标签匹配方法、装置、介质及设备在审
申请号: | 202211643014.6 | 申请日: | 2022-12-20 |
公开(公告)号: | CN115858830A | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 孟金波 | 申请(专利权)人: | 广州欢网科技有限责任公司 |
主分类号: | G06F16/48 | 分类号: | G06F16/48;H04N21/466 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 赵越 |
地址: | 510000 广东省广州市番禺*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 标签 匹配 方法 装置 介质 设备 | ||
1.一种媒资数据的标签匹配方法,其特征在于,所述方法包括:
获取媒资数据和维基数据;其中,所述维基数据至少包括针对所述媒资数据的标签数据;
对所述媒资数据和所述维基数据进行正则匹配,得到正则匹配评分;
根据所述媒资数据对应的媒资特征向量、和所述维基数据对应的维基特征向量,确定所述媒资数据和所述维基数据之间的拟合评分;
对所述正则匹配评分和所述拟合评分进行加权求和,得到综合评分;
根据所述综合评分,建立所述媒资数据和所述维基数据之间的匹配关系。
2.根据权利要求1所述的方法,其特征在于,对所述媒资数据和所述维基数据进行正则匹配,得到正则匹配评分,包括:
对所述媒资数据和所述维基数据进行字符处理,得到字符处理后的目标媒资数据和目标维基数据;
根据所述目标媒资数据和所述目标维基数据的名称一致类别、导演列表重合类别和/或演员列表重合类别,确定所述正则匹配评分;
其中,所述字符处理至少包括以下一项:特殊字符替换处理、分隔符分割处理;
其中,所述名称一致类别为名称一致或者名称不一致,所述导演列表重合类别为导演列表重合或者导演列表不重合,所述演员列表重合类别为演员列表重合或者演员列表不重合。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从所述媒资数据中确定第一媒资名称数据、第一媒资简介数据、第一演员数据以及第一导演数据;
确定所述第一媒资名称数据和所述第一媒资简介数据对应的第一名称简介特征向量;
确定所述第一演员数据和所述第一导演数据对应的第一演员导演特征向量;
对所述第一名称简介特征向量和所述第一演员导演特征向量进行全连接计算,得到所述媒资特征向量。
4.根据权利要求3所述的方法,其特征在于,确定所述第一媒资名称数据和所述第一媒资简介数据对应的第一名称简介特征向量,包括:
对所述第一媒资名称数据和所述第一媒资简介数据进行分词处理,得到名称字段和简介字段;
生成与所述名称字段对应的第一嵌入矩阵,以及与所述简介字段对应的第二嵌入矩阵;
按照预定义尺寸的卷积核对所述第一嵌入矩阵进行卷积运算,得到第一特征图;以及,按照预定义尺寸的卷积核对所述第二嵌入矩阵进行卷积运算,得到第二特征图;
对所述第一特征图进行最大池化处理,得到第一池化向量;以及,对所述第二特征图进行最大池化处理,得到第二池化向量;
利用随机失活函数对所述第一池化向量进行正则化处理,得到名称特征向量;以及,利用随机失活函数对所述第二池化向量进行正则化处理,得到简介特征向量;
对所述名称特征向量和所述简介特征向量进行全连接计算,得到所述第一名称简介特征向量。
5.根据权利要求3所述的方法,其特征在于,确定所述第一演员数据和所述第一导演数据对应的第一演员导演特征向量,包括:
对所述第一演员数据进行分割,得到演员列表;以及,对所述第一导演数据进行分割,得到导演列表;
对所述演员列表和所述导演列表进行预处理,得到目标演员列表和目标导演列表;其中,所述预处理至少包括分隔符分割处理;
生成与所述目标演员列表对应的第三嵌入矩阵,以及与所述目标导演列表对应的第四嵌入矩阵;
基于所述第三嵌入矩阵,确定与所述第一演员数据相匹配的演员特征向量;以及,基于所述第四嵌入矩阵,确定与所述第一导演数据相匹配的导演特征向量;
将所述演员特征向量和所述导演特征向量进行全连接计算,得到所述第一演员导演特征向量。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从所述维基数据中确定第二媒资名称数据、第二媒资简介数据、第二演员数据以及第二导演数据;
确定所述第二媒资名称数据和所述第二媒资简介数据对应的第二名称简介特征向量;
确定所述第二演员数据和所述第二导演数据对应的第二演员导演特征向量;
对所述第二名称简介特征向量和所述第二演员导演特征向量进行全连接计算,得到所述维基特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州欢网科技有限责任公司,未经广州欢网科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211643014.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种业务流程图生成方法及装置
- 下一篇:薄型产品冲压包装收料一体设备
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置