[发明专利]弹幕处理方法、设备和存储介质有效
申请号: | 202011586426.1 | 申请日: | 2020-12-28 |
公开(公告)号: | CN112672202B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 蒋涛;陈健生 | 申请(专利权)人: | 广州博冠信息科技有限公司 |
主分类号: | H04N21/435 | 分类号: | H04N21/435;H04N21/488;H04N21/4788;G06V10/762;G06V10/82;G06N3/0442;G06N3/08 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;臧建明 |
地址: | 510663 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 弹幕 处理 方法 设备 存储 介质 | ||
本申请实施例提供一种弹幕处理方法、设备和存储介质,获取目标时间段内多个子时间段产生的多条弹幕的句向量;将同一子时间段的多条弹幕聚类为至少一个弹幕类,获得弹幕类中的聚类中心弹幕;根据同一子时间段的至少一个弹幕类的聚类中心弹幕的句向量,将多个不同子时间段的弹幕类的聚类中心弹幕聚类为N个二级弹幕类,获得每个二级弹幕类的聚类中心弹幕;确定每个二级弹幕类的聚类中心弹幕为目标时间段产生的热词弹幕。由于根据弹幕的句向量实现对弹幕的语义理解,再利用聚类算法对弹幕进行聚类,无需对弹幕进行分词,也无需统计分析弹幕中的特征信息,可以在提升热词弹幕准确性的同时,简化热词弹幕获取过程,提升热词弹幕的获得效率。
技术领域
本申请实施例涉及互联网技术领域,尤其涉及一种弹幕处理方法、设备和存储介质。
背景技术
随着互联网技术的发展,弹幕作为一种互动方法,其简洁有趣的信息交流方式而被广泛应用,例如视频播放、网络直播等均可以使用弹幕进行交互,以增加视频观看过程中的趣味性。在此过程中,服务器会提供一些热词供用户选取并发送,然后根据用户选取的热词以弹幕的形式在视频画面中对该文字信息进行显示。
现有技术中,主要通过对视频中的弹幕进行统计,根据出现次数、出现频率等信息对弹幕进行重要程度排序,再根据重要程度提供热词供用户选用,然而,上述提供热词弹幕的方法较为繁琐,且提供的热词弹幕不够准确。
发明内容
本申请实施例提供一种弹幕处理方法、设备和存储介质,用于解决现有技术中,提供热词弹幕的方法较为繁琐,且提供的热词弹幕不够准确的技术问题。
第一方面,本申请实施例提供一种弹幕处理方法,包括:
获取目标子时间段内多个不同子时间段产生的多条弹幕,并获取多条弹幕的句向量;
根据同一子时间段的弹幕的句向量,将同一子时间段的多条弹幕聚类为至少一个弹幕类,根据每个弹幕类中各条弹幕的句向量,获得每个弹幕类中的聚类中心弹幕;
根据同一子时间段的至少一个弹幕类的聚类中心弹幕的句向量,将多个不同子时间段的各个弹幕类的聚类中心弹幕聚类为N个二级弹幕类,根据二级弹幕类中包含的弹幕的句向量,获得二级弹幕类的聚类中心弹幕;
确定二级弹幕类的聚类中心弹幕为目标时间段产生的热词弹幕,热词弹幕用于供用户快捷输入弹幕。
可选的,获取多条弹幕的句向量,包括:
针对每条弹幕,获取弹幕中每个字的字向量;
根据弹幕中各字的字向量,获取弹幕的字向量均值;
根据字向量均值,获得弹幕的句向量。
可选的,获取目标时间段内多个不同子时间段产生的多条弹幕,并获取多条弹幕的句向量,包括:
针对每条弹幕,将弹幕输入至预先训练好的bert模型,获得bert模型输出的弹幕中每个字的字向量;
将弹幕中各字的字向量输入至预先训练好的双向LSTM网络,获取LSTM网络输出的弹幕的字向量均值。
可选的,根据同一子时间段的弹幕的句向量,将同一子时间段的多条弹幕聚类为至少一个弹幕类,包括:
针对同一子时间段,将子时间段的多条弹幕的句向量进行降维和归一化处理;
根据同一子时间段处理后的多条弹幕的句向量,将同一子时间段的多条弹幕聚类为至少一个弹幕类。
可选的,根据同一子时间段的每条弹幕的句向量,将同一子时间段的多条弹幕聚类为至少一个弹幕类,包括:
针对同一子时间段,根据子时间段任意两条弹幕的句向量,获得任意两条弹幕的句向量间的余弦距离;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州博冠信息科技有限公司,未经广州博冠信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011586426.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于车辆轮胎轮毂装配辅助设备
- 下一篇:输送装置及其施工方法