[发明专利]一种媒资数据的标签匹配方法、装置、介质及设备在审
申请号: | 202211643014.6 | 申请日: | 2022-12-20 |
公开(公告)号: | CN115858830A | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 孟金波 | 申请(专利权)人: | 广州欢网科技有限责任公司 |
主分类号: | G06F16/48 | 分类号: | G06F16/48;H04N21/466 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 赵越 |
地址: | 510000 广东省广州市番禺*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 标签 匹配 方法 装置 介质 设备 | ||
本申请涉及一种媒资数据的标签匹配方法、装置、介质及设备,属于计算机技术领域。本申请能够获取媒资数据和维基数据;其中,所述维基数据至少包括针对所述媒资数据的标签数据;对所述媒资数据和所述维基数据进行正则匹配,得到正则匹配评分;根据所述媒资数据对应的媒资特征向量、和所述维基数据对应的维基特征向量,确定所述媒资数据和所述维基数据之间的拟合评分;对所述正则匹配评分和所述拟合评分进行加权求和,得到综合评分;根据所述综合评分,建立所述媒资数据和所述维基数据之间的匹配关系。由此,能够提高标签匹配的效率以及精准度。
技术领域
本申请属于计算机技术领域,具体涉及一种媒资数据的标签匹配方法、装置、介质及设备。
背景技术
目前,随着互联网电视业务的发展,智能运营、智能推荐等已成为互联网电视业务开展的重要组成部分。其中,智能运营、智能推荐等互联网电视业务开展需要依赖媒资数据的标签。
在实践中发现,现在的媒资数据的标签匹配方法需要依赖人工打标签和校准,由于需要打标签的媒资数据的数据量很大,因而这种依赖于人工打标签和校准的标签匹配方法存在着效率低、精准度差的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
为此,本申请提供一种媒资数据的标签匹配方法、装置、介质及设备,有助于提高标签匹配的效率以及精准度。
为实现以上目的,本申请采用如下技术方案:
第一方面,本申请提供一种媒资数据的标签匹配方法,所述方法包括:
获取媒资数据和维基数据;其中,所述维基数据至少包括针对所述媒资数据的标签数据;
对所述媒资数据和所述维基数据进行正则匹配,得到正则匹配评分;
根据所述媒资数据对应的媒资特征向量、和所述维基数据对应的维基特征向量,确定所述媒资数据和所述维基数据之间的拟合评分;
对所述正则匹配评分和所述拟合评分进行加权求和,得到综合评分;
根据所述综合评分,建立所述媒资数据和所述维基数据之间的匹配关系。
进一步的,对所述媒资数据和所述维基数据进行正则匹配,得到正则匹配评分,包括:
对所述媒资数据和所述维基数据进行字符处理,得到字符处理后的目标媒资数据和目标维基数据;
根据所述目标媒资数据和所述目标维基数据的名称一致类别、导演列表重合类别和/或演员列表重合类别,确定所述正则匹配评分;
其中,所述字符处理至少包括以下一项:特殊字符替换处理、分隔符分割处理;
其中,所述名称一致类别为名称一致或者名称不一致,所述导演列表重合类别为导演列表重合或者导演列表不重合,所述演员列表重合类别为演员列表重合或者演员列表不重合。
进一步的,所述方法还包括:
从所述媒资数据中确定第一媒资名称数据、第一媒资简介数据、第一演员数据以及第一导演数据;
确定所述第一媒资名称数据和所述第一媒资简介数据对应的第一名称简介特征向量;
确定所述第一演员数据和所述第一导演数据对应的第一演员导演特征向量;
对所述第一名称简介特征向量和所述第一演员导演特征向量进行全连接计算,得到所述媒资特征向量。
进一步的,确定所述第一媒资名称数据和所述第一媒资简介数据对应的第一名称简介特征向量,包括:
对所述第一媒资名称数据和所述第一媒资简介数据进行分词处理,得到名称字段和简介字段;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州欢网科技有限责任公司,未经广州欢网科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211643014.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种业务流程图生成方法及装置
- 下一篇:薄型产品冲压包装收料一体设备
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置