[发明专利]一种直播评论分析方法、装置、电子设备及存储介质在审
申请号: | 202010938305.2 | 申请日: | 2020-09-09 |
公开(公告)号: | CN111813944A | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 张月鹏;李晓宇;李明;姜秋宇;王志慧;裴广超 | 申请(专利权)人: | 北京神州泰岳智能数据技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06F40/289 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 蒋姗 |
地址: | 100082 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 直播 评论 分析 方法 装置 电子设备 存储 介质 | ||
1.一种直播评论分析方法,其特征在于,包括:
获取在视频直播过程中产生的弹幕文本和评论文本,以获得评论数据;
使用词频-逆向文件频率分词器对所述评论数据进行分词,获得多个词语;
对所述多个词语进行聚类分析和类别标注,获得多个类别标签;
从所述多个类别标签筛选出商品名称,获得多个商品名称。
2.根据权利要求1所述的方法,其特征在于,所述对所述多个词语进行聚类分析和类别标注,获得多个类别标签,包括:
对所述多个词语进行聚类分析采样,获得多个采样簇类;
将从所述多个采样簇类的每个采样簇类中的多个词语筛选出的词语确定为该采样簇类的类别标签,获得所述多个类别标签;其中,所述每个采样簇类确定出一个类别标签。
3.根据权利要求1所述的方法,其特征在于,所述获得多个类别标签,包括:
使用手肘法或差距统计法确定需要类别标注的类别数量;
根据所述类别数量确定所述多个类别标签。
4.根据权利要求1所述的方法,其特征在于,在所述获得多个商品名称之后,还包括:
从商品信息表中查找到所述多个商品名称对应的商品信息;
输出所述多个商品名称对应的商品信息。
5.根据权利要求4所述的方法,其特征在于,所述商品信息包括:商品购买链接或者商品投票选项;所述输出所述多个商品名称对应的商品信息,包括:
向第一终端设备发送所述多个商品名称对应的商品购买链接;或者
向第二终端设备发送所述多个商品名称对应的商品投票选项,所述商品投票选项用于投选出下一次被视频直播的商品。
6.根据权利要求4所述的方法,其特征在于,所述商品信息包括:商品名称在所述评论数据中出现的频率或次数;在所述输出所述多个商品名称对应的商品信息之后,还包括:
对所述商品名称在所述评论数据中出现的频率或次数进行分析,获得分析结果,所述分析结果包括:建议视频直播的商品信息以及商品顺序信息。
7.一种直播评论分析装置,其特征在于,包括:
评论数据获得模块,用于获取在视频直播过程中产生的弹幕文本和评论文本,以获得评论数据;
评论数据分词模块,用于使用词频-逆向文件频率分词器对所述评论数据进行分词,获得多个词语;
类别标签获得模块,用于对所述多个词语进行聚类分析和类别标注,获得多个类别标签;
商品名称获得模块,用于从所述多个类别标签筛选出商品名称,获得多个商品名称。
8.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述机器可读指令被所述处理器执行时执行如权利要求1至6任一所述的方法。
9.一种存储介质,其特征在于,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至6任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神州泰岳智能数据技术有限公司,未经北京神州泰岳智能数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010938305.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数控加工车铣磨一体机
- 下一篇:药品图文信息违规检测方法及系统