[发明专利]弹幕分析方法及装置有效
申请号: | 201810186987.9 | 申请日: | 2018-03-07 |
公开(公告)号: | CN110245343B | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 李明;沈一;茅越 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F40/30 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 李晓庆 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 弹幕 分析 方法 装置 | ||
本公开涉及弹幕分析方法及装置。该方法包括:对针对指定对象的各条弹幕进行分词处理,得到各条弹幕的分词结果;根据各条弹幕的分词结果中的词语的词频,确定指定对象对应的各个候选词;对于指定对象对应的第一候选词,根据第一候选词在指定对象的各个时间片段的词频,以及所有候选词在各个时间片段的词频,确定第一候选词在各个时间片段的参数值;在第一候选词在第一时间片段的参数值满足条件的情况下,将第一候选词确定为第一时间片段的关键词。本公开能够准确确定指定对象在各个时间片段的关键词,从而能够帮助业务人员了解广大用户在指定对象的各个时间片段的关注点。
技术领域
本公开涉及计算机技术领域,尤其涉及一种弹幕分析方法及装置。
背景技术
随着社交网络、移动互联网的不断普及,人们发布信息的成本越来越低,越来越多的用户乐于在互联网上分享自己的观点以及对于人物、事件、产品的评论,例如,通过弹幕的方式,发表对于视频、音频等对象的评论。弹幕反映了人们对于视频、音频等对象的观点和情感倾向,对于视频、音频等对象的分析有着重要的意义。因此,如何对弹幕进行分析成为亟待解决的问题。
发明内容
有鉴于此,本公开提出了一种弹幕分析方法及装置。
根据本公开的一方面,提供了一种弹幕分析方法,包括:
对针对指定对象的各条弹幕进行分词处理,得到所述各条弹幕的分词结果;
根据所述各条弹幕的分词结果中的词语的词频,确定所述指定对象对应的各个候选词;
对于所述指定对象对应的第一候选词,根据所述第一候选词在所述指定对象的各个时间片段的词频,以及所有候选词在所述各个时间片段的词频,确定所述第一候选词在所述各个时间片段的参数值,其中,所述第一候选词为所述各个候选词中的一个候选词;
在所述第一候选词在第一时间片段的参数值满足条件的情况下,将所述第一候选词确定为所述第一时间片段的关键词,其中,所述第一时间片段为所述各个时间片段中的一个时间片段。
在一种可能的实现方式中,对于所述指定对象对应的第一候选词,根据所述第一候选词在所述指定对象的各个时间片段的词频,以及所有候选词在所述各个时间片段的词频,确定所述第一候选词在所述各个时间片段的参数值,包括:
确定所有候选词在所述第一时间片段的词频与所有候选词在所述各个时间片段的总词频的第一比值;
将所述第一候选词在所述各个时间片段的总词频与所述第一比值的乘积确定为第一词频;
确定所述第一候选词在所述第一时间片段的词频与所有候选词在所述各个时间片段的总词频的第二比值;
确定所述第一词频与所有候选词在所述各个时间片段的总词频的第三比值;
根据所述第二比值和所述第三比值,确定所述第一候选词在所述第一时间片段的参数值。
在一种可能的实现方式中,根据所述第二比值和所述第三比值,确定所述第一候选词在所述第一时间片段的参数值,包括:
根据所述第二比值、所述第三比值、时间片段的个数以及候选词的总数,确定所述第一候选词在所述第一时间片段的参数值。
在一种可能的实现方式中,对针对指定对象的各条弹幕进行分词处理,得到所述各条弹幕的分词结果,包括:
从针对指定对象的各条弹幕中提取新词;
根据所述新词,对所述各条弹幕进行分词处理,得到所述各条弹幕的分词结果。
在一种可能的实现方式中,从针对指定对象的各条弹幕中提取新词,包括:
对针对指定对象的各条弹幕进行相邻文字切割,得到切割结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810186987.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:文本匹配的方法、装置和存储介质
- 下一篇:权利要求书的自动解构处理装置