[发明专利]目标弹幕的识别方法、装置、终端及存储介质有效
申请号: | 201810320766.6 | 申请日: | 2018-04-11 |
公开(公告)号: | CN108537176B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 刘兵;张文明;陈少杰 | 申请(专利权)人: | 武汉斗鱼网络科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;H04N21/4788;H04N21/435 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 430070 湖北省武汉市武汉东湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 弹幕 识别 方法 装置 终端 存储 介质 | ||
1.一种目标弹幕的识别方法,其特征在于,包括:
获取待识别的目标弹幕,并基于根据所述目标弹幕中各字符的词性对所述目标弹幕进行编码;
所述基于根据所述目标弹幕中各字符的词性对所述目标弹幕进行编码,包括:
基于预先建立的词性字典确定所述目标弹幕中各字符的词性,并根据所述词性对所述目标弹幕进行编码;
所述根据所述词性对所述目标弹幕进行编码,包括:
当检测到所述词性字典中不存在与所述字符对应的词性时,将预设字符的词性标记为预设词性;
根据所述预设词性更新所述词性字典,并根据更新后的所述词性对所述目标弹幕进行编码;
所述词性包括中文、英文、阿拉伯数字、控制字符、表情图片、符号以及日语平假名中的至少一个;
根据编码后的所述目标弹幕生成预设格式的特征向量,并将所述特征向量输入至预先训练好的分类模型中对所述目标弹幕进行识别;
根据识别结果确定所述目标弹幕的类型。
2.根据权利要求1所述的方法,其特征在于,所述根据编码后的所述目标弹幕生成预设格式的特征向量,包括:
基于N-gram将编码后的所述目标弹幕进行分词,根据预设的转化规则分词后的各个字符转化为预设格式的特征向量。
3.根据权利要求1所述的方法,其特征在于,还包括:
获取弹幕样本,并基于根据所述弹幕样本中各字符的词性对所述弹幕样本进行编码;
根据编码后的所述弹幕样本生成预设格式的特征向量,并将所述特征向量输入至待训练的分类模型中得到当前输出结果;
根据当期输出结果和期望输出结果之间的误差,调节所述分类模型的模型参数。
4.根据权利要求2所述的方法,其特征在于,获取弹幕样本包括:
获取历史弹幕样本以及与所述历史弹幕样本对应的标记,确定所述历史弹幕样本中的正常弹幕样本和异常弹幕样本。
5.一种目标弹幕的识别装置,其特征在于,包括:
编码模块,用于获取待识别的目标弹幕,并基于根据所述目标弹幕中各字符的词性对所述目标弹幕进行编码;
所述编码模块可用于:
基于预先建立的词性字典确定所述目标弹幕中各字符的词性,并根据所述词性对所述目标弹幕进行编码;
所述编码模块可进一步用于:
当检测到所述词性字典中不存在与所述字符对应的词性时,将预设字符的词性标记为预设词性;
根据所述预设词性更新所述词性字典,并根据更新后的所述词性对所述目标弹幕进行编码;
所述词性可包括中文、英文、阿拉伯数字、控制字符、表情图片、符号以及日语平假名中的至少一个;
类型识别模块,用于根据编码后的所述目标弹幕生成预设格式的特征向量,并将所述特征向量输入至预先训练好的分类模型中对所述目标弹幕进行识别;
类型确定模块,用于根据识别结果确定所述目标弹幕的类型。
6.一种终端,其特征在于,所述终端包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一所述的目标弹幕的识别方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一所述的目标弹幕的识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼网络科技有限公司,未经武汉斗鱼网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810320766.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种定位参考信号传输方法及装置
- 下一篇:一种换流变检修质量综合评估方法