[发明专利]语音到文本转换的方法及装置有效
申请号: | 201510126575.2 | 申请日: | 2015-03-20 |
公开(公告)号: | CN104751846B | 公开(公告)日: | 2019-03-01 |
发明(设计)人: | 王彦文 | 申请(专利权)人: | 努比亚技术有限公司 |
主分类号: | G10L15/30 | 分类号: | G10L15/30 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 518057 广东省深圳市南山区高新区北环大道9018*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 文本 转换 方法 装置 | ||
本发明公开了一种语音到文本转换的方法,该方法包括:获取音频文件;根据所述音频文件的时间轴顺序将所述音频文件中含有的语音转换为文本以生成第一文本信息;将所述音频文件中的录音打点标记转换为文本标记;将所述文本标记插入到所述第一文本信息中的对应位置,以生成第二文本信息。本发明还公开了一种语音到文本转换的装置。采用本发明的技术方案,对转换后的文本进行标记,方便人们对文本进行查看、编辑等操作。
技术领域
本发明涉及通信技术领域,尤其涉及一种语音到文本转换的方法及装置。
背景技术
随着信息时代的迅速发展,信息输入/输出功能的重要性在电子设备中已经被加强。人们可通过手机或录音笔(或其他具有录音功能的设备)进行录音,方便记录信息;在录音过程中,还可以使用打点功能,如在听讲座时,可以一边听一边录音,对重要的内容在录的时候事先标记上,最后生成录音文件,人们可在后续通过该录音文件继续回听以前的讲座内容时,可直接从标记开始处听,而不需要整个录音听一遍;如在开会议时,可以一边讨论一边录音,对重要的会议内容在录的时候事先标记上,最后生成录音文件,人们可在后续通过该录音文件继续回听以前的会议内容时,可直接从标记开始处听,而不需要整个录音听一遍。语音识别技术应用越来越广泛,现有技术中,已实现了将语音文件转换成文本文件进行显示,但是,现有技术在将具有标记的语音文件转成文本文件时,对打点标记不进行识别,而是直接将语音文件转换成文本文件,不方便人们对文本文件的读取、编辑,如人们想看之前在语音文件中打点标记处的内容(了解记录的重点),不能快速找到,需要从文本开始处慢慢找。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种语音到文本转换的方法及装置,旨在对转换后的文本进行标记,方便人们对文本进行查看、编辑等操作。
为实现上述目的,本发明提供一种语音到文本转换的方法,该方法包括:
获取音频文件;
根据所述音频文件的时间轴顺序将所述音频文件中含有的语音转换为文本以生成第一文本信息;
将所述音频文件中的录音打点标记转换为文本标记;
将所述文本标记插入到所述第一文本信息中的对应位置,以生成第二文本信息。
优选地,所述将所述音频文件中的录音打点标记转换为文本标记的步骤包括:
获取所述音频文件中的录音打点标记;
根据预设的录音打点标记与文本标记映射表,查找所述获取的录音打点标记对应的文本标记。
优选地,在将所述文本标记插入到所述第一文本信息中,以生成第二文本信息的步骤之后,该方法还包括:
将所述第二文本信息中的相同且相邻的两个文本标记之间的文字内容进行突出显示,以生成第三文本信息。
优选地,所述将所述第二文本信息中的相同且相邻的两个文本标记之间的文字内容进行突出显示,以生成第三文本信息的步骤包括:
顺序读取所述第二文本信息;
若当前读取到文本标记,则判断所述当前读取的文本标记是否与上一次读取的文本标记相同;
若所述当前读取的文本标记与上一次读取的文本标记相同,则将所述当前读取的文本标记与上一次读取的文本标记之间的文字内容进行突出显示,以生成第三文本信息。
优选地,所述则将所述当前读取的文本标记与上一次读取的文本标记之间的文字内容进行突出显示,以生成第三文本信息的步骤包括:
根据预设的文本标记与突出显示方式映射表,查找该当前读取的文本标记对应的突出显示方式;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于努比亚技术有限公司,未经努比亚技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510126575.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音频码流的解码方法及装置
- 下一篇:一种语音服务切换方法和系统