[发明专利]字幕生成方法及终端有效
申请号: | 201810274629.3 | 申请日: | 2018-03-29 |
公开(公告)号: | CN110324723B | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 马鹏 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04N21/488 | 分类号: | H04N21/488;H04N21/442;H04N21/439;G10L15/26 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字幕 生成 方法 终端 | ||
1.一种字幕生成方法,其特征在于,包括:
第一终端获取麦克风的标识信息,并通过摄像头采集处于所述麦克风第一距离内的人脸图像信息;
所述第一终端根据预先建立的人脸身份信息表,确定所述人脸图像信息对应的用户识别信息为所述麦克风对应的用户识别信息;
当所述第一终端接收到所述麦克风发送的第一语音数据时,所述第一终端获取所述第一语音数据对应的字幕信息,所述字幕信息包括所述第一语音数据对应的文本信息以及所述麦克风对应的用户识别信息;
所述第一终端通过第一屏幕显示所述第一语音数据对应的字幕信息;
当所述第一终端接收到多个麦克风在同一时间段发送的多个第一语音数据时,所述第一终端获取所述第一语音数据对应的字幕信息之前,还包括:
所述第一终端从所述多个第一语音数据中先筛选出语音音量排名前N个的第一语音数据,再从这N个语音数据中选择对应的职位信息排名前M个的第一语音数据,最后针对所述M个第一语音数据生成字幕信息。
2.如权利要求1所述的方法,其特征在于,所述第一终端获取所述第一语音数据对应的字幕信息包括:
所述第一终端对所述第一语音数据进行语音识别得到所述第一语音数据对应的文本信息。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
所述第一终端向第二终端发送所述第一语音数据对应的字幕信息,所述第一语音数据对应的字幕信息被所述第二终端通过第二屏幕显示,所述第二终端为与所述第一终端进行语音交互的终端。
4.如权利要求2所述的方法,其特征在于,所述方法还包括:
所述第一终端接收第二终端发送的所述第二终端采集的第二语音数据对应的字幕信息;
所述第一终端通过所述第一屏幕显示所述第二语音数据对应的字幕信息。
5.如权利要求4所述的方法,其特征在于,
所述第一终端还接收所述第二终端发送的所述第二语音数据的采集时刻;
所述第一终端通过所述第一屏幕显示所述第二语音数据对应的字幕信息包括:
所述第一终端按照所述第一语音数据的采集时刻以及所述第二语音数据的采集时刻的先后顺序,通过所述第一屏幕显示所述第一语音数据对应的字幕信息和所述第二语音数据对应的字幕信息。
6.如权利要求1所述的方法,其特征在于,所述第一终端获取所述第一语音数据对应的字幕信息包括:
所述第一终端向多点控制单元发送语音数据信息,所述语音数据信息包括所述第一语音数据以及所述麦克风对应的用户识别信息;
所述第一终端接收所述多点控制单元发送的所述第一语音数据对应的字幕信息,所述字幕信息为所述多点控制单元基于语音识别得到的所述第一语音数据对应的文本信息以及所述麦克风对应的用户识别信息生成的。
7.如权利要求6所述的方法,其特征在于,所述第一终端接收所述多点控制单元发送的所述第一语音数据对应的字幕信息包括:
所述第一终端接收所述多点控制单元发送的所述第一语音数据对应的字幕信息和第二终端采集的第二语音数据对应的字幕信息,所述第二终端为与所述第一终端进行语音交互的终端;
所述第一终端还通过所述第一屏幕显示所述第二语音数据对应的字幕信息。
8.如权利要求7所述的方法,其特征在于,所述语音数据信息还包括所述第一语音数据的采集时刻;所述第一语音数据的采集时刻被所述多点控制单元用于按照所述第一语音数据的采集时刻以及所述第二终端采集的第二语音数据的采集时刻的先后顺序,对所述第一语音数据对应的字幕信息和第二终端采集的第二语音数据对应的字幕信息进行排序。
9.如权利要求1-8任一项所述的方法,其特征在于,所述用户识别信息包括用户人脸信息或用户身份信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810274629.3/1.html,转载请声明来源钻瓜专利网。