[发明专利]一种将语音转换为文字的方法及装置在审
申请号: | 201410175549.4 | 申请日: | 2014-04-28 |
公开(公告)号: | CN103943109A | 公开(公告)日: | 2014-07-23 |
发明(设计)人: | 朴宁 | 申请(专利权)人: | 深圳如果技术有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26 |
代理公司: | 深圳华奇信诺专利代理事务所(普通合伙) 44328 | 代理人: | 曲卫涛 |
地址: | 518052 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 转换 文字 方法 装置 | ||
技术领域
本发明涉及语音识别技术领域,特别是涉及一种将语音转换为文字的方法及装置。
背景技术
在很多场合,例如:会议、培训、采访等等,需要对谈话的内容进行记录,通常情况下,谈话的内容是由记录人员或者采访记者进行手写记录。而人谈话的速度通常快于人手写速度,为了避免记录中漏掉部份内容,记录人员还采用录音记录谈话内容,生成录音文件。
在会议、培训或者采访结束后,记录人员或者专业翻译人员需要播放录音文件,收听录音,然后将听到的语音书写为文字。通过人工收听录音,并将录音转化为文字的方式,工作效率低,浪费时间。若录音文件过多,则不单耗费时间,还会耗费大量的劳动力,人力成本过高。
发明内容
本发明主要解决的技术问题是提供一种将语音转换为文字的方法及装置,能够快速地将语音转换为文字。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种将语音转换为文字的方法,包括接收输入的语音,并识别所述语音中各个元素;根据所述元素与文字映射关系,获取所述元素所映射的文字,并输出所述文字。
其中,所述元素为所述语音中的单音节语音;所述元素与文字映射关系包括标准语音与文字的映射关系;所述识别所述语音中各个元素的步骤包括:将所述语音划分为多个单音节语音,其中,所述一个单语节语音对应所述语音中的一个音节;所述根据所述元素与文字映射关系,获取所述元素所映射的文字,并输出所述文字的步骤包括:获取所述语音的声音参数,其中,所述声音参数包括语音的频率、振幅和相位;根据所述声音参数判断所述语音是标准语音还是地方语音;若所述语音为标准语音,则根据标准语音与文字的映射关系,获取所述单音节语音所映射的文字,生成所述语音所对应的所有文字。
其中,所述元素与文字映射关系还包括地方语音与文字的映射关系;所述方法还包括:若所述语音是为地方语音,则根据地方语音与文字的映射关系,获取所述单音节语音所映射的文字,生成所述语音所对应的所有文字。
其中,所述方法还包括:判断所述两个单音节语音之间间隔的时间是否超过预定时间;若所述两个单音节语音之间间隔的时间超过预定时间,则在所述两个单音节语音所对应的两个文字之间标记符号。
其中,若所述单音节语音所映射的文字的数量为多个,则分别将所述文字以及与所述文字相邻的文字组成词组;在词组库中查找是否存在所述词组;若存在所述词组,则将组成所述词组的所述文字作为所述单音节语音所对应的文字。
为了解决上述技术问题,本发明采用的另一个技术方案是:提供一种将语音转换为文字的装置,包括接入识别模块,用于接收输入的语音,并识别所述语音的各个元素;映射模块,用于根据所述元素与文字映射关系,获取所述元素所映射的文字,并输出所述文字。
其中,所述元素为所述语音中的单音节语音;所述元素与文字映射关系包括标准语音与文字的映射关系;所述接收识别模块,具体用于接收输入的所述语音,并将所述语音划分为多个单音节语音,其中,所述一个单语节语音对应所述语音中的一个音节;所述映射模块包括:获取单元,用于获取所述语音的声音参数,其中,所述声音参数包括语音的频率、振幅和相位;判断单元,用于根据所述声音参数判断所述语音是标准语音还是地方语音;第一映射单元,用于在所述判断单元判断到所述语音是标准语音时,根据标准语音与文字的映射关系,获取所述单音节语音所映射的文字,生成所述语音所对应的所有文字。
其中,所述元素与文字映射关系还包括地方语音与文字的映射关系;所述映射模块还包括:第二映射单元,用于在所述判断单元判断到所述语音是地方语音时,根据地方语音与文字的映射关系,获取所述单音节语音所映射的文字,生成所述语音所对应的所有文字。
其中,所述装置还包括:判断模块,用于判断所述两个单音节语音之间间隔的时间是否超过预定时间;符号标记模块,用于在所述判断模块判断到所述两个单音节语音之间间隔的时间超过预定时间时,在所述两个单音节语音所对应的两个文字之间标记符号。
其中,所述装置还包括组成模块,用于在所述单音节语音所映射的文字的数量为多个时,分别将所述单音节语音所映射的文字和与所述文字相邻的文字组成词组;查找模块,用于在词组库中查找是否存在所述词组;设置模块,用于在所述查找模块在词组库中找到所述词组,将组成所述词组的所述文字作为所述单音节语音所对应的文字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳如果技术有限公司,未经深圳如果技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410175549.4/2.html,转载请声明来源钻瓜专利网。