[发明专利]弹幕数据处理方法、装置、设备以及存储介质在审
申请号: | 202011481327.7 | 申请日: | 2020-12-15 |
公开(公告)号: | CN112417895A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 邓迪;陈健生;熊清亮 | 申请(专利权)人: | 广州博冠信息科技有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06K9/62 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;刘芳 |
地址: | 510663 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 弹幕 数据处理 方法 装置 设备 以及 存储 介质 | ||
1.一种弹幕数据处理方法,其特征在于,包括:
计算已获取的预设数量的训练弹幕数据之间的相似度;
根据所述相似度进行聚类,以得到多个训练弹幕数据簇;
根据多个训练弹幕数据簇分别获得第一目标训练样本和第二目标训练样本;
采用第一目标训练样本对处理模型进行训练,以及采用第二目标训练样本对判别模型进行训练,以得到已训练的处理模型和已训练的判别模型。
2.根据权利要求1所述的方法,其特征在于,计算已获取的预设数量的训练弹幕数据之间的相似度,具体包括:
获得任意两个训练弹幕数据之间的第一双语互译质量评估指标以及第二双语互译质量评估指标;
根据所述第一双语互译质量评估指标和所述第二双语互译质量评估指标计算获得任意两个训练弹幕数据之间的相似度;
其中,所述第一双语互译质量评估指标是以其中一个训练弹幕数据为参考标准时获得的,所述第二双语互译质量评估指标是以另一个训练弹幕数据为参考标准时获得的。
3.根据权利要求2所述的方法,其特征在于,根据所述第一双语互译质量评估指标和所述第二双语互译质量评估指标计算获得任意两个训练弹幕数据之间的相似度,具体包括:
根据第一公式计算获得两个训练弹幕数据之间的相似度,其中,第一公式具体为:
d=0.5[unigram_blue(a,b)+unigram_blue(b,a)]
其中,d表示相似度,a和b均表示训练弹幕数据,unigram_blue()表示一元双语互译质量评估指标算法。
4.根据权利要求1所述的方法,其特征在于,所述第二目标训练样本包括正训练样本和负训练样本;根据所述多个训练弹幕数据簇获得第二目标训练样本,具体包括:
对位于相同训练弹幕数据簇中两个训练弹幕数据组合获得正训练样本;
对位于不同训练弹幕数据簇中两个训练弹幕数据组合获得负训练样本;
所述采用第二目标训练样本对判别模型进行训练,包括:
采用所述正训练样本和所述负训练样本对预训练后的判别模型进行训练,获得所述已训练的判别模型。
5.根据权利要求1所述的方法,其特征在于,所述第一目标训练样本包括输入样本和输出样本,根据所述多个训练弹幕数据簇获得第一目标训练样本具体包括:
对位于相同训练弹幕数据簇中两个训练弹幕数据组合获得输入样本和输出样本;
所述采用第一目标训练样本对处理模型进行训练,包括:
采用所述输入样本和所述输出样本对预训练后的处理模型进行训练,获得所述已训练的处理模型。
6.根据权利要求1所述的方法,其特征在于,所述已训练的处理模型用于获取与当前弹幕数据对应的多个相似弹幕数据;所述已训练的判别模型用于计算所述相似弹幕数据的评估值,所述的评估值用于从所述多个相似弹幕中确定输出弹幕数据。
7.根据权利要求6所述的方法,其特征在于,所述评估值用于经过归一化处理后获得采样概率,所述采样概率用于对所述多个相似弹幕进行采样获得所述输出弹幕数据。
8.一种弹幕数据处理装置,其特征在于,包括:
计算模块,用于计算已获取的预设数量的训练弹幕数据之间的相似度;
获得模块,用于根据所述相似度进行聚类,以得到多个训练弹幕数据簇;
获得模块还用于根据多个训练弹幕数据簇分别获得第一目标训练样本和第二目标训练样本;
获得模块还用于采用第一目标训练样本对处理模型进行训练,以及采用第二目标训练样本对判别模型进行训练,以得到已训练的处理模型和已训练的判别模型。
9.一种电子设备,其特征在于,包括:
存储器,用于存储程序;
处理器,用于执行所述存储器存储的所述程序,当所述程序被执行时,所述处理器用于执行如权利要求1至7中任一所述的弹幕数据处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令;
所述计算机执行指令被处理器执行时用于实现如权利要求1至7任一项所述的弹幕数据处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州博冠信息科技有限公司,未经广州博冠信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011481327.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:重型气体机的钢活塞结构
- 下一篇:一种便于施工安装的LED路灯