[发明专利]一种语音弹幕的显示方法、装置、设备及存储介质在审
申请号: | 202011104858.4 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112261456A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 余逸尘;郭云三 | 申请(专利权)人: | 浙江同花顺智能科技有限公司 |
主分类号: | H04N21/422 | 分类号: | H04N21/422;H04N21/431;H04N21/439;H04N21/485;H04N21/488;G10L15/26 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 310023 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 弹幕 显示 方法 装置 设备 存储 介质 | ||
本发明实施例公开了一种语音弹幕的显示方法,包括:获取用户输入的语音信息,将语音信息转换为原始文本信息;根据语音信息确定用户语音的音量,根据语音信息及原始文本信息确定用户语音的情感类别;根据用户语音的音量确定原始文本待显示的目标字体大小,根据用户语音的情感类别确定原始文本待显示的目标字体颜色;将原始文本以目标字体大小及显示颜色以弹幕形式显示在界面上。本发明实施例提供的语音弹幕的显示方法,在将语音转换成弹幕后,以语音音量对应的字体大小以及语音情感对应的颜色显示弹幕,考虑用户的音量和情感,可以在弹幕中包含更多的信息,增强了用户阅读文本的趣味性。
技术领域
本发明涉及语音转换领域,尤其涉及一种语音弹幕的显示方法、装置、设备及存储介质。
背景技术
现有的语音转换方法仅解决了如何生成的问题,并没有提供一种比较好的展示形式。例如在生成语音弹幕时,如果通过一段语音表示弹幕,则用户无法在观看视频或者文字的时候直接收听语音弹幕的内容;如果通过语音转文字的方式,则只能显示语音的内容,而丢失了语音中额外的信息,如情感和音量等。
发明内容
本发明实施例提供了一种语音弹幕的显示方法、装置、设备及存储介质,可以在弹幕中包含更多的信息,增强用户阅读弹幕的趣味性。
第一方面,本发明实施例提供了一种语音弹幕的显示方法,包括:
获取用户输入的语音信息,将所述语音信息转换为原始文本信息;
根据所述语音信息确定用户语音的音量,根据所述语音信息及所述原始文本信息确定所述用户语音的情感类别;
根据所述用户语音的音量确定所述原始文本待显示的目标字体大小,根据所述用户语音的情感类别确定所述原始文本待显示的目标字体颜色;
将所述原始文本以所述目标字体大小及所述目标字体颜色以弹幕形式显示在界面上。
进一步地,根据所述语音信息及所述原始文本信息确定所述用户语音的情感类别,包括:
将所述语音信息和所述原始文本信息输入设定神经网络,获得所述用户语音对应的多个情感类别以及各情感类别的置信度。
进一步地,根据所述语音信息确定用户语音的音量,包括:
确定所述用户语音的音频振幅;
根据所述音频振幅确定所述用户语音的音量。
进一步地,根据所述用户语音的音量确定所述原始文本待显示的目标字体大小,包括:
获取基准音量对应的基准字体大小;
确定所述语音的音量与所述基准音量的比例;
根据所述比例和所述基准字体大小确定所述文本内容对应的待显示的目标字体大小。
进一步地,根据所述用户语音的音量确定所述原始文本待显示的目标字体大小,还包括:
获取设定最大音量对应的第一字体大小以及设定最小音量对应的第二字体大小;
根据所述设定最大音量和所述设定最小音量对所述用户语音的音量进行归一化处理;
根据归一化后的音量确定待显示的目标字体大小。
进一步地,根据所述用户语音的情感类别确定所述原始文本待显示的目标字体颜色,包括:
获取各情感类别分别对应的颜色;
根据所述置信度对所述多个情感类别分别对应的颜色进行融合,获得所述原始文本待显示的目标字体颜色。
进一步地,获取各情感类别分别对应的颜色,包括:获取各情感类别分别对应的颜色的色域值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江同花顺智能科技有限公司,未经浙江同花顺智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011104858.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有缓冲功能的车载移动冷库
- 下一篇:一种基于唤醒机制电池监测系统