[发明专利]一种通话转录系统和方法无效
申请号: | 201210515005.9 | 申请日: | 2012-12-04 |
公开(公告)号: | CN103856602A | 公开(公告)日: | 2014-06-11 |
发明(设计)人: | 钟实;袁首鹏 | 申请(专利权)人: | ITP创新科技有限公司 |
主分类号: | H04M1/656 | 分类号: | H04M1/656;G06F17/30 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 董巍;徐丁峰 |
地址: | 中国香港北角英皇道*** | 国省代码: | 中国香港;81 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通话 转录 系统 方法 | ||
技术领域
本发明涉及通信领域,尤其涉及一种通话转录系统和方法。
背景技术
在当今的时代,由于工作需要,企业内部的工作人员或企业与企业的双方代表之间常常需要进行沟通交流,例如召开电话会议等。虽然不在同一间办公室的人通过网络和电话等方式可以便利地进行交流。然而还存在一个会议记录的问题,比如经常会出现召开电话会议的双方开完电话会议而忘记了部分会议内容的情况,或者是企业的其他工作人员因为工作需要而希望查看某一时段的通话内容的情况。
因此,需要提供一种通话转录系统和方法以解决上述问题。
发明内容
在发明内容部分中引入了一系列简化形式的概念,这将在具体实施方式部分中进一步详细说明。本发明的发明内容部分并不意味着要试图限定出所要求保护的技术方案的关键特征和必要技术特征,更不意味着试图确定所要求保护的技术方案的保护范围。
为了解决上述问题,本发明公开了一种用于通话转录系统,包括接收装置、语音识别装置和加标签装置,其中,所述接收装置用于连接到交换机并将输入语音信号转换为音频文件;所述语音识别装置与所述接收装置相连,用于将所述音频文件转录为文本文件;以及所述加标签装置与所述语音识别装置相连,用于为所述文本文件加上对应的音频文件的时间戳,并根据所述时间戳将加上时间戳后的所有文本文件排序并且合并为通话记录文本文件。
在本发明一个优选实施例中,所述通话转录系统还包括:发送装置,其与所述加标签装置相连,用于将所述通话记录文本文件发送给用户。
在本发明一个优选实施例中,所述通话转录系统还包括:存储器,其连接在所述接收装置和所述语音识别装置之间,用于存储所述音频文件。
在本发明一个优选实施例中,所述通话记录文本文件的内容包括所述文本文件的内容、所述文本文件对应的时间戳和所述文本文件对应的音频文件在所述存储器中的地址。
在本发明一个优选实施例中,所述加标签装置还用于根据所述通话记录文本文件和所述通话记录文本文件中的所述文本文件对应的音频文件在所述存储器中的地址,在所述存储器中建立通话数据库,以使所述用户根据所述通话记录文本文件来访问所述通话数据库;其中,所述通话数据库中每个数据项包括:所述文本文件的内容、所述文本文件对应的时间戳和所述文本文件对应的音频文件在所述存储器中的所述地址。
在本发明一个优选实施例中,所述通话转录系统还包括:存储器,其连接在所述接收装置和所述语音识别装置之间,用于存储所述音频文件;并且所述加标签装置还用于根据所述通话记录文本文件和所述通话记录文本文件中的所述文本文件对应的音频文件在所述存储器中的地址,在所述存储器中建立通话数据库,所述通话数据库具有访问接口以供用户通过网络直接访问;其中,所述通话数据库中每个数据项包括:所述文本文件的内容、所述文本文件对应的时间戳和所述文本文件对应的音频文件在所述存储器中的所述地址。
在本发明一个优选实施例中,所述通话转录系统还包括:切分器,其连接在所述接收装置和所述语音识别装置之间,用于将所述音频文件切分为子音频文件以输出到所述语音识别装置。
在本发明一个优选实施例中,所述切分器进一步包括:检测单元,用于检测所述音频文件中的静音部分;以及分割单元,用于基于所检测的静音部分将所述音频文件切分为所述子音频文件。
在本发明一个优选实施例中,所述静音部分包括在0.6秒或0.6秒以上的时间段内分贝值小于或等于噪声阈值的部分。
在本发明一个优选实施例中,所述通话转录系统还包括:存储器,其连接在所述切分器和所述语音识别装置之间,用于存储所述子音频文件;并且所述语音识别装置所转录的子音频文件来自于所述存储器。
在本发明一个优选实施例中,所述通话转录系统还包括:自动增益控制器,其与所述接收装置相连,用于对所述输入语音信号进行增益控制。
在本发明一个优选实施例中,所述通话转录系统还包括滤波器,其与所述接收装置相连,用于对所述输入语音信号进行降噪处理。
根据本发明另一方面,还提供了一种通话转录方法,包括:将输入语音信号转换为音频文件;将所述音频文件转录为文本文件;为所述文本文件加上对应的音频文件的时间戳;以及根据所述时间戳将加上时间戳后的所有文本文件排序并且合并为通话记录文本文件。
在本发明一个优选实施例中,所述合并为通话记录文本文件之后还包括:将所述通话记录文本文件发送给用户。
在本发明一个优选实施例中,所述将输入语音信号转换为音频文件之后还包括将所述音频文件存储至存储器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于ITP创新科技有限公司,未经ITP创新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210515005.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于扩展器的降噪系统
- 下一篇:一种基于遗传算法的高精度标定方法