[发明专利]语音到文本转换的方法及装置有效
申请号: | 201510126575.2 | 申请日: | 2015-03-20 |
公开(公告)号: | CN104751846B | 公开(公告)日: | 2019-03-01 |
发明(设计)人: | 王彦文 | 申请(专利权)人: | 努比亚技术有限公司 |
主分类号: | G10L15/30 | 分类号: | G10L15/30 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 518057 广东省深圳市南山区高新区北环大道9018*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 文本 转换 方法 装置 | ||
1.一种语音到文本转换的方法,其特征在于,该方法包括:
获取音频文件;
根据所述音频文件的时间轴顺序将所述音频文件中含有的语音转换为文本以生成第一文本信息;
将所述音频文件中的录音打点标记转换为文本标记;
根据所述文本标记对应的录音打点标记在音频文件的位置,将所述文本标记插入到所述第一文本信息中的对应位置,以生成第二文本信息,其中,所述第二文本信息既包括由语音转换成的文本,又包括由录音打点标记转换成的文本标记。
2.如权利要求1所述的语音到文本转换的方法,其特征在于,所述将所述音频文件中的录音打点标记转换为文本标记的步骤包括:
获取所述音频文件中的录音打点标记;
根据预设的录音打点标记与文本标记映射表,查找所述获取的录音打点标记对应的文本标记。
3.如权利要求2所述的语音到文本转换的方法,其特征在于,在将所述文本标记插入到所述第一文本信息中,以生成第二文本信息的步骤之后,该方法还包括:
将所述第二文本信息中的相同且相邻的两个文本标记之间的文字内容进行突出显示,以生成第三文本信息。
4.如权利要求3所述的语音到文本转换的方法,其特征在于,所述将所述第二文本信息中的相同且相邻的两个文本标记之间的文字内容进行突出显示,以生成第三文本信息的步骤包括:
顺序读取所述第二文本信息;
若当前读取到文本标记,则判断所述当前读取的文本标记是否与上一次读取的文本标记相同;
若所述当前读取的文本标记与上一次读取的文本标记相同,则将所述当前读取的文本标记与上一次读取的文本标记之间的文字内容进行突出显示,以生成第三文本信息。
5.如权利要求4所述的语音到文本转换的方法,其特征在于,所述则将所述当前读取的文本标记与上一次读取的文本标记之间的文字内容进行突出显示,以生成第三文本信息的步骤包括:
根据预设的文本标记与突出显示方式映射表,查找该当前读取的文本标记对应的突出显示方式;
将所述当前读取的文本标记与上一次读取的文本标记之间的文字内容按照所述查找的突出显示方式进行突出显示,以生成第三文本信息。
6.一种语音到文本转换的装置,其特征在于,包括:
获取模块,用于获取音频文件;
第一生成模块,用于根据所述音频文件的时间轴顺序将所述音频文件中含有的语音转换为文本以生成第一文本信息;
第一转换模块,用于将所述音频文件中的录音打点标记转换为文本标记;
第二生成模块,用于根据所述文本标记对应的录音打点标记在音频文件的位置,将所述文本标记插入到所述第一文本信息中的对应位置,以生成第二文本信息,其中,所述第二文本信息既包括由语音转换成的文本,又包括由录音打点标记转换成的文本标记。
7.如权利要求6所述的语音到文本转换的装置,其特征在于,所述第一转换模块包括:
第一获取单元,用于获取所述音频文件中的录音打点标记;
第一查找单元,用于根据预设的录音打点标记与文本标记映射表,查找所述获取的录音打点标记对应的文本标记。
8.如权利要求7所述的语音到文本转换的装置,其特征在于,该装置还包括:
第三生成模块,用于将所述第二文本信息中的相同且相邻的两个文本标记之间的文字内容进行突出显示,以生成第三文本信息。
9.如权利要求8所述的语音到文本转换的装置,其特征在于,所述第三生成模块包括:
读取单元,用于顺序读取所述第二文本信息;
判断单元,用于在所述读取单元当前读取到文本标记时,判断所述当前读取的文本标记是否与上一次读取的文本标记相同;
突出显示单元,用于在所述当前读取的文本标记与上一次读取的文本标记相同时,将所述当前读取的文本标记与上一次读取的文本标记之间的文字内容进行突出显示,以生成第三文本信息。
10.如权利要求9所述的语音到文本转换的装置,其特征在于,所述突出显示单元包括:
第二查找单元,用于在所述当前读取的文本标记与上一次读取的文本标记相同时,根据预设的文本标记与突出显示方式映射表,查找该当前读取的文本标记对应的突出显示方式;
突出显示子单元,用于将所述当前读取的文本标记与上一次读取的文本标记之间的文字内容按照所述第二查找单元查找的突出显示方式进行突出显示,以生成第三文本信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于努比亚技术有限公司,未经努比亚技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510126575.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:语音频码流的解码方法及装置
- 下一篇:一种语音服务切换方法和系统