[发明专利]直播平台语音收集方法、系统及存储介质在审
申请号: | 202010066065.1 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111625614A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 宁思乔;刘德友 | 申请(专利权)人: | 全息空间(深圳)智能科技有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/36;G06F16/33;G06F16/951;G06F16/958;G06F16/215;H04N21/2187;G10L15/26;G10L15/08 |
代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 田黎绒 |
地址: | 518000 广东省深圳市福田区梅林*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 直播 平台 语音 收集 方法 系统 存储 介质 | ||
本发明公开了一种直播平台语音收集方法、系统及存储介质,该语音收集方法包括如下步骤:S1:一种直播平台语音收集方法,其包括如下步骤:S1:确认用户身份、收集用户在直播平台上操作产生的原始语音文件;S2:对S1所得原始语音文件进行清洗、筛除原始语音文件中的破损文件、形成一次数据;S3:将S2所得一次数据转化为文本文件、并将该文本文件按对应用户ID进行存储;S4:对S3所得文本文件进行清洗、筛除含有乱码的文本文件、形成二次数据;S5:对S4所得二次数据进行关键词抓取、并依据关键词进行排序、形成三次数据。本发明能够能够对用户产生的语音数据进行筛选、收集和排序、从而实现对用户更精准的智能服务推送。
技术领域
本发明属于互联网直播技术领域,具体来说涉及一种直播平台语音文件收集方法,以及用于实现该方法的直播平台数据系统及存储介质。
背景技术
网络直播是一种新兴的网络社交方式。主播利用摄像头等工具在直播平台上进行视频直播。现有的直播平台无法对用户的操作数据进行收集。因而无法针对各个用户的个性进行针对性的服务优化。因此,如何开发出一种新型的直播平台语音文件收集方法,以克服上述问题,是本领域技术人员需要研究的方向。
发明内容
本发明的目的是提供一种直播平台语音收集方法,能够对用户在直播平台上产生的数据进行收集和排序、掌握用户的服务取向和在线时间,实现对用户的精准服务推送。
其采用的技术方案如下:
一种直播平台语音收集方法,其包括如下步骤:S1:确认用户身份、收集用户在直播平台上操作产生的原始语音文件;S2:对S1所得原始语音文件进行清洗、筛除原始语音文件中的破损文件、形成一次数据;S3:将S2所得一次数据转化为文本文件、并将该文本文件按对应用户ID进行存储;S4:对S3所得文本文件进行清洗、筛除含有乱码的文本文件、形成二次数据;S5:对S4所得二次数据进行关键词抓取、并依据关键词进行排序、形成三次数据。
优选的是,上述直播平台语音收集方法中,还包括步骤S6:基于S5所得三次数据生成数据报表,所述数据报表用于显示基于同一关键词的语音频次和语音所处时间段。
更优选的是,上述直播平台语音收集方法中,还包括步骤S7:基于S6所得数据报表生成数据谱图,该数据谱图中的x轴为时间t、y轴为语音频次。
为实现上述直播平台信息审核方法,本发明还公开了一种直播平台语音收集系统,其包括:收集模块,一次筛选模块,转化模块,存储模块,二次筛选模块,排序模块、制表模块和制图模块;所述收集模块用于收集用户在直播平台上操作产生的原始语音文件;所述一次筛选模块用于读取收集模块、筛除原始语音文件中的破损文件;所述转化模块用于读取一次筛选模块、将未破损的语音文件转化为文本文件;所述存储模块用于将转化模块生成的文本文件按对应用户ID进行存储;所述二次筛选模块用于对存储模块进行清洗、筛除含有乱码的文本文件;所述排序模块用于对未含乱码的文本文件进行关键词抓取、并依据关键词进行排序;所述制表模块用于基于排序模块的排序结果生成数据报表;所述制图模块用于基于所述数据报表生成数据谱图。
为实现上述直播平台信息审核方法,本发明还公开了一种计算机可读存储介质,所述计算机可读存储介质中存有计算机程序,所述计算机程序在被执行时实现上述直播平台数据。
通过采用上述技术方案:首先对语音数据进行收集及第一次筛选,筛除无效的破损文件。随后通过将语音数据转化为文本数据,针对文本数据实现对关键词的抓取,并根据关键词的抓取结果实现排序。同时,通过统计语音数据的次数和发生时间、生成相应的数据列表和数据谱图。由此,本发明能够收集用户语音的频次和时间、实现针对关键词排序,对用户服务实现数据积累,平台工作人员通过数据分析可以直观的掌握用户的服务取向和在线时间,从而实现对用户更精准的智能服务推送。
附图说明
上面结合附图与具体实施方式对本发明作进一步详细的说明:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于全息空间(深圳)智能科技有限公司,未经全息空间(深圳)智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010066065.1/2.html,转载请声明来源钻瓜专利网。