[发明专利]弹幕分析方法及装置有效
申请号: | 201810186987.9 | 申请日: | 2018-03-07 |
公开(公告)号: | CN110245343B | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 李明;沈一;茅越 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F40/30 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 李晓庆 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 弹幕 分析 方法 装置 | ||
1.一种弹幕分析方法,其特征在于,包括:
对针对指定对象的各条弹幕进行分词处理,得到所述各条弹幕的分词结果;
根据所述各条弹幕的分词结果中的词语的词频,确定所述指定对象对应的各个候选词;
确定所有候选词在第一时间片段的词频与所有候选词在各个时间片段的总词频的第一比值;
将第一候选词在所述各个时间片段的总词频与所述第一比值的乘积确定为第一词频;
确定所述第一候选词在所述第一时间片段的词频与所有候选词在所述各个时间片段的总词频的第二比值;
确定所述第一词频与所有候选词在所述各个时间片段的总词频的第三比值;
根据所述第二比值和所述第三比值,确定所述第一候选词在所述第一时间片段的参数值;
在所述第一候选词在第一时间片段的参数值满足条件的情况下,将所述第一候选词确定为所述第一时间片段的关键词,并根据所述关键词确定用户在指定对象的各个时间片段的关注点,其中,所述第一时间片段为所述各个时间片段中的一个时间片段。
2.根据权利要求1所述的方法,其特征在于,根据所述第二比值和所述第三比值,确定所述第一候选词在所述第一时间片段的参数值,包括:
根据所述第二比值、所述第三比值、时间片段的个数以及候选词的总数,确定所述第一候选词在所述第一时间片段的参数值。
3.根据权利要求1所述的方法,其特征在于,对针对指定对象的各条弹幕进行分词处理,得到所述各条弹幕的分词结果,包括:
从针对指定对象的各条弹幕中提取新词;
根据所述新词,对所述各条弹幕进行分词处理,得到所述各条弹幕的分词结果。
4.根据权利要求3所述的方法,其特征在于,从针对指定对象的各条弹幕中提取新词,包括:
对针对指定对象的各条弹幕进行相邻文字切割,得到切割结果;
根据所述切割结果的凝固度和自由度,从针对指定对象的各条弹幕中提取新词。
5.一种弹幕分析装置,其特征在于,包括:
分词模块,用于对针对指定对象的各条弹幕进行分词处理,得到所述各条弹幕的分词结果;
第一确定模块,用于根据所述各条弹幕的分词结果中的词语的词频,确定所述指定对象对应的各个候选词;
第一确定子模块,用于确定所有候选词在第一时间片段的词频与所有候选词在各个时间片段的总词频的第一比值;
第二确定子模块,用于将第一候选词在所述各个时间片段的总词频与所述第一比值的乘积确定为第一词频;
第三确定子模块,用于确定所述第一候选词在所述第一时间片段的词频与所有候选词在所述各个时间片段的总词频的第二比值;
第四确定子模块,用于确定所述第一词频与所有候选词在所述各个时间片段的总词频的第三比值;
第五确定子模块,用于根据所述第二比值和所述第三比值,确定所述第一候选词在所述第一时间片段的参数值;
第三确定模块,用于在所述第一候选词在第一时间片段的参数值满足条件的情况下,将所述第一候选词确定为所述第一时间片段的关键词,并根据所述关键词确定用户在指定对象的各个时间片段的关注点,其中,所述第一时间片段为所述各个时间片段中的一个时间片段。
6.根据权利要求5所述的装置,其特征在于,所述第五确定子模块用于:
根据所述第二比值、所述第三比值、时间片段的个数以及候选词的总数,确定所述第一候选词在所述第一时间片段的参数值。
7.根据权利要求5所述的装置,其特征在于,所述分词模块包括:
提取子模块,用于从针对指定对象的各条弹幕中提取新词;
分词子模块,用于根据所述新词,对所述各条弹幕进行分词处理,得到所述各条弹幕的分词结果。
8.根据权利要求7所述的装置,其特征在于,所述提取子模块包括:
切割单元,用于对针对指定对象的各条弹幕进行相邻文字切割,得到切割结果;
提取单元,用于根据所述切割结果的凝固度和自由度,从针对指定对象的各条弹幕中提取新词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810186987.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:文本匹配的方法、装置和存储介质
- 下一篇:权利要求书的自动解构处理装置