[发明专利]语音到文本转换的方法及装置有效

申请号：	201510126575.2	申请日：	2015-03-20
公开（公告）号：	CN104751846B	公开（公告）日：	2019-03-01
发明（设计）人：	王彦文	申请（专利权）人：	努比亚技术有限公司
主分类号：	G10L15/30	分类号：	G10L15/30
代理公司：	深圳市世纪恒程知识产权代理事务所 44287	代理人：	胡海国
地址：	518057 广东省深圳市南山区高新区北环大道9018***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音文本转换方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种语音到文本转换的方法，该方法包括：获取音频文件；根据所述音频文件的时间轴顺序将所述音频文件中含有的语音转换为文本以生成第一文本信息；将所述音频文件中的录音打点标记转换为文本标记；将所述文本标记插入到所述第一文本信息中的对应位置，以生成第二文本信息。本发明还公开了一种语音到文本转换的装置。采用本发明的技术方案，对转换后的文本进行标记，方便人们对文本进行查看、编辑等操作。

技术领域

本发明涉及通信技术领域，尤其涉及一种语音到文本转换的方法及装置。

背景技术

随着信息时代的迅速发展，信息输入/输出功能的重要性在电子设备中已经被加强。人们可通过手机或录音笔(或其他具有录音功能的设备)进行录音，方便记录信息；在录音过程中，还可以使用打点功能，如在听讲座时，可以一边听一边录音，对重要的内容在录的时候事先标记上，最后生成录音文件，人们可在后续通过该录音文件继续回听以前的讲座内容时，可直接从标记开始处听，而不需要整个录音听一遍；如在开会议时，可以一边讨论一边录音，对重要的会议内容在录的时候事先标记上，最后生成录音文件，人们可在后续通过该录音文件继续回听以前的会议内容时，可直接从标记开始处听，而不需要整个录音听一遍。语音识别技术应用越来越广泛，现有技术中，已实现了将语音文件转换成文本文件进行显示，但是，现有技术在将具有标记的语音文件转成文本文件时，对打点标记不进行识别，而是直接将语音文件转换成文本文件，不方便人们对文本文件的读取、编辑，如人们想看之前在语音文件中打点标记处的内容(了解记录的重点)，不能快速找到，需要从文本开始处慢慢找。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种语音到文本转换的方法及装置，旨在对转换后的文本进行标记，方便人们对文本进行查看、编辑等操作。

为实现上述目的，本发明提供一种语音到文本转换的方法，该方法包括：

获取音频文件；

根据所述音频文件的时间轴顺序将所述音频文件中含有的语音转换为文本以生成第一文本信息；

将所述音频文件中的录音打点标记转换为文本标记；

将所述文本标记插入到所述第一文本信息中的对应位置，以生成第二文本信息。

优选地，所述将所述音频文件中的录音打点标记转换为文本标记的步骤包括：

获取所述音频文件中的录音打点标记；

根据预设的录音打点标记与文本标记映射表，查找所述获取的录音打点标记对应的文本标记。

优选地，在将所述文本标记插入到所述第一文本信息中，以生成第二文本信息的步骤之后，该方法还包括：