[发明专利]一种面向参会者同步语音转写文字的智能方法在审
申请号: | 201910263845.2 | 申请日: | 2019-04-03 |
公开(公告)号: | CN110010130A | 公开(公告)日: | 2019-07-12 |
发明(设计)人: | 汪丹 | 申请(专利权)人: | 安徽阔声科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/20;G10L17/00;G10L17/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 230088 安徽省合肥市合肥市高新区习友路33*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 控制中心 频谱图 预处理 频谱能量 同步语音 文字信息 语音信息 频谱 转写 录入 存储 语音信息转换 发言者身份 全过程记录 智能 会议记录 特征提取 姓名信息 信息库 比对 文档 话筒 语音 职位 分割 身份 会议 | ||
本发明公开了一种面向参会者同步语音转写文字的智能方法,包括以下步骤:参会者通过签到话筒向控制中心以语音的方式录入自己的职位、姓名信息,控制中心按输入的顺序对输入的语音信息进行存储,控制中心对录入的语音信息进行预处理;预处理后的语音信息转换成频谱图和文字信息,并将频谱图和文字信息存入该参会者的信息库;控制中心频谱图分割成若干组分帧频谱;控制中心对分帧频谱进行特征提取;存储参会者频谱能量值差分DelN;识别发言者身份;计算频谱能量值差分DelNf,并比对;形成形成会议记录文档。本发明能够实现会议全过程记录,别能够识别出参会发言者的身份。
技术领域
本发明属于智能语音技术领域,具体涉及一种面向参会者同步语音转写文字的智能方法。
背景技术
对于一些比较重要的会议,需要对会议全内容进行记录,采用人工记录的方式耗费人力,目前已有自动对会议内容进行记录的技术,通常是将与会者发出的语音信号直接转换成文本字符予以保存。
实现本发明过程中,发明人发现相关技术中至少存在如下问题:将与会者的语音信号直接转换成文本字符进行保存而形成的会议记录比较冗长,难以识别出每一位发言者说了什么内容。
发明内容
本发明的目的在于克服上述现有技术的不足,提供一种面向参会者同步语音转写文字的智能方法。
一种面向参会者同步语音转写文字的智能方法,其特征在于:包括以下步骤:
1)参会者通过签到话筒向控制中心以语音的方式录入自己的职位、姓名信息,控制中心按输入的顺序对输入的语音信息进行存储,控制中心对录入的语音信息进行预处理;
2)预处理后的语音信息转换成频谱图和文字信息,并将频谱图和文字信息存入该参会者的信息库;
3)控制中心将每个参会者的频谱图按固定的时间间隔进行分帧,将频谱图分割成若干组分帧频谱;
4)控制中心对分帧频谱进行特征提取,特征提取的项目包括:分帧频谱的质心Ci(i=1、2、…n)、频谱能量值Ni(i=1、2、…n)、频谱能量值差分DelNd;
5)将参会者频谱能量值差分DelN存入该参会者的信息库;
6)参会者发言时,通过坐席上的话筒向控制中心按输入发言语音,发言语音信息经控制中心进行预处理,预处理后的发言语音信息转换成发言频谱图和发言文字信息,发言文字信息存储入会议记录文档;
7)控制中心按步骤3)、4)计算频谱能量值差分DelNf;
8)控制中心将DelNf与存储在参会者信息库中的DelNd进行比对,DelNf与参会者信息库中的DelNd之间的阈值小于设定值时,确定该发言者身份,并在会议记录文档的前部增加发言者姓名;
9)完成会议后,形成会议记录文档,并打印、签字。
优选地,所述步骤4)中频谱能量值Ni= ,DelNd=Ni-N(i-1)。
优选地,所述预处理步骤为去噪音、信号放大。
优选地,所述固定的时间间隔为10-20ms。
与现有技术相比,本发明的有益效果:
本发明在使用时,本发明通过音色识别的方式来确认每一位参会者的身份,从而能够将会议内容对应到每一位参会者身上,避免会议记录难以分辨说话者的缺陷;通过预处理技术,来对信号进行去燥和放大,确保信号的准确性;通过智能自动方式来识别参会者的音色,具有准确性好的优点;参会者在进行录入身份时,只需要进行一次,在后期的使用中,即不需要进行录入。
具体实施方式
一种面向参会者同步语音转写文字的智能方法,其特征在于:包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽阔声科技有限公司,未经安徽阔声科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910263845.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于六足机器人的语音交互系统
- 下一篇:一种语音信息处理的方法和装置