[发明专利]一种基于语音识别及转写技术的实时字幕上屏直播系统在审
申请号: | 202110297837.7 | 申请日: | 2021-03-19 |
公开(公告)号: | CN113068058A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 李广垒;陈祖涛 | 申请(专利权)人: | 安徽宝信信息科技有限公司 |
主分类号: | H04N21/2187 | 分类号: | H04N21/2187;G10L15/26;G10L21/0208;H04N21/4402;H04N21/439;H04N21/43;H04N21/488 |
代理公司: | 合肥律众知识产权代理有限公司 34147 | 代理人: | 赵娟 |
地址: | 230088 安徽省合肥市高新区习友路33*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语音 识别 转写 技术 实时 字幕 直播 系统 | ||
1.一种基于语音识别及转写技术的实时字幕上屏直播系统,其特征在于,包括语音采集模块、语音消噪模块、文字转化模块、文字语音库、文字验证模块、数据接收模块、数据处理模块、总控模块与字幕播放模块;
所述语音采集模块包括两个语音采集终端,所述语音采集终端用于采集直播时的实时语音信息;
所述实时语音信息被发到语音消噪模块,所述语音消噪模块对接收到的述实时语音信息进行消噪处理,消噪处理后获取到经过消噪的语音信息;
所述经过消噪的语音信息被发送到文字转化模块,所述文字转化模块将获取到的消噪的语音信息发送到文字语音库中进行语音转文字处理,获取到转化后的文字信息;
所述文字信息被发送到文字验证模块,所述文字验证模块用于对转化后的文字信息进行文字验证处理获取标准文字信息;
所述标准文字信息被发送到数据接收模块,所述数据接收模块将标准文字信息进行转化,将其处理播放文字内容;
所述总控模块控制字幕播放模块同步播放文字内容。
2.根据权利要求1所述的一种基于语音识别及转写技术的实时字幕上屏直播系统,其特征在于:所述语音采集模块进行语音采集模块的具体处理过程如下:
步骤一:两个语音采集终端同步采集语音信息,将其分别标记为M1和M2;
步骤二:将语音信息M1和语音信息M2同步加速播放,将语音信息M1和语音信息M2中声音小于预设值的提取出,将其标记为Ki,i=1……n;
步骤三:将所有的Ki进行合并处理,之后将语音信息M1和语音信息M2中的剩余部分进行合并处理,得到合并后的语音信息M和,语音信息M和即为需要进行消噪的语音信息。
3.根据权利要求1所述的一种基于语音识别及转写技术的实时字幕上屏直播系统,其特征在于:所述语音消噪模块进行消噪处理的具体过程如下:将需要进行语音消噪的语音信息导入到语音消噪模块,语音消噪模块中的深度残差收缩网络通过自适应阈值的软阈值化层,自动消除与当前任务无关的信息,进行强噪数据的准确识别,并消除掉强噪音,强噪音被消除后即得到被消除噪音的语音信息。
4.根据权利要求1所述的一种基于语音识别及转写技术的实时字幕上屏直播系统,其特征在于:所述文字转化模块进行文字转化的具体过程如下:
步骤一:导入经过降噪处理的语音信息,将其标记为P,将语音信息P导入到文字语音库中;
步骤二:语音信息P导入到文字语音库中进行匹配处理;
步骤三:当语音信息P的语音信息与到文字语音库中预存的语音文字相似度超过预设值,即表示该文字匹配成功,即将其提取出标记为识别文字;
步骤四:将所有的识别文字按照识别时间进行排列组合得到转化后的文字信息。
5.根据权利要求1所述的一种基于语音识别及转写技术的实时字幕上屏直播系统,其特征在于:所述文字验证模块的具体处理过程如下:提取出转化后的文字信息将其回传到文字语音库,进行文字转语音流程,当文字转语音流程转化出的语音信息与原输入语音的相似度超过预设值时,即验证文字通过,将被验证的文字标记为标准文字信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽宝信信息科技有限公司,未经安徽宝信信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110297837.7/1.html,转载请声明来源钻瓜专利网。