[发明专利]将会议语音识别为文本的方法、电子设备及存储介质有效
申请号: | 201810581922.4 | 申请日: | 2018-06-07 |
公开(公告)号: | CN108847241B | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 王健宗;于夕畔;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 杨毅玲 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 会议 语音 识别 文本 方法 电子设备 存储 介质 | ||
一种将会议语音识别为文本的方法,包括:通过语音识别技术将待识别的会议语音转化为文本,作为初始语音识别文本;将初始语音识别文本与预设文本数据库进行匹配,得到匹配后的语音识别文本;根据匹配后的语音识别文本生成具有可编辑状态的语音识别文本草稿;当侦测到语音识别文本草稿上接收到了编辑操作后,根据所述编辑操作后的语音识别文本生成具有不可编辑状态的语音识别文本,作为最终语音识别文本。本发明还提供一种将会议语音识别为文本的电子设备及存储介质。本发明通过对待识别的语音进行初步识别后,与预设文本库进行第一次匹配,再通过人工进行第二次确认,有效的保证文本输出内容的正确性,减少会议内容的校对工作量,提升了效率。
技术领域
本发明涉及语音识别技术领域,具体涉及一种将会议语音识别为文本的方法、电子设备及存储介质。
背景技术
自动语音识别技术(Automatic Speech Recognition,ASR)是机器翻译、机器人控制以及下一代人机交互界面等领域的核心技术,是让计算机能够“听写”出不同人所说出的连续语音,实现“声音”到“文本”的转换。
目前,伴随着语音识别技术的不断发展,基于语音识别的应用也越来越广泛,这样的技术已经渗透入家庭生活、办公领域、娱乐等方面。用户通过利用对着个人计算机、笔记本电脑、平板电脑、专用的学习终端、智能手机等终端上外接或内置的麦克风来输入语音,经由语音识别设备完成语音-文字的转换。
现有的语音识别设备有很多,例如,被广泛使用的世界知名的Nuance、Google的语音识别服务、中国国内容科大讯飞的语音识别服务等。但是在进行语音识别的最大问题是语音识别的准确率,即使是在现有的设备中拥有最高语音识别准确率的Nuance,也无法避免以下问题:语气词等无关词汇的频繁出现导致文本分析难度加大、部分专业关键词识别不准确、禁忌敏感词无法识别等,影响了会议文本的可读分析性。
发明内容
鉴于以上内容,有必要提出一种将会议语音识别为文本的方法、电子设备及存储介质,通过预设文本数据库匹配和人工确认的双重过程,有效的保证了文本输出内容的正确性,改善了传统语音转文本中文字表达不合理的地方,有效减少了会议内容的校对工作量,提升了效率。
本发明的第一方面提供一种将会议语音识别为文本的方法,所述方法包括:
通过语音识别技术将待识别的会议语音转化为文本,作为初始语音识别文本;
将所述初始语音识别文本与预设文本数据库进行匹配,得到匹配后的语音识别文本;
根据所述匹配后的语音识别文本生成具有可编辑状态的语音识别文本草稿;
当侦测到所述语音识别文本草稿上接收到了编辑操作时,根据所述编辑操作后的语音识别文本生成具有不可编辑状态的语音识别文本,作为最终语音识别文本。
优选地,所述将所述初始语音识别文本与预设文本数据库进行匹配包括:
将所述初始语音识别文本与预设第一文本数据库进行匹配,得到第一匹配结果;
将所述第一匹配结果与预设第二文本数据库进行匹配,得到第二匹配结果;
将所述第二匹配结果与预设第三文本数据库进行匹配;
其中,所述预设第一文本数据库中存储有多个语气词,所述预设第二文本数据库中存储有多个专业词及对应的拼音,所述预设第三文本数据库中存储有多个禁忌敏感词。
优选地,所述将所述初始语音识别文本与预设第一文本数据库进行匹配包括:
判断所述初始语音识别文本中是否存在与预设第一文本数据库中的词语相匹配的第一词语;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810581922.4/2.html,转载请声明来源钻瓜专利网。