[发明专利]会议记录装置及利用该装置对会议进行记录的方法有效

专利信息
申请号: 201110340457.3 申请日: 2011-11-01
公开(公告)号: CN102436812A 公开(公告)日: 2012-05-02
发明(设计)人: 林哲民 申请(专利权)人: 展讯通信(上海)有限公司
主分类号: G10L15/26 分类号: G10L15/26;G10L15/02;G10L15/06;G10L15/08
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 骆苏华
地址: 201203 上海市浦东新区张*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 会议记录 装置 利用 会议 进行 记录 方法
【说明书】:

【技术领域】

发明涉及一种会议记录装置及利用该装置对会议进行记录的方法,属于会议记录及语音自动识别领域。

【背景技术】

目前常用的会议记录辅助装置是录音笔或者录像,如需对会议进行文字转换,则需要记录人员重新收听或者收看录像并将会议进行事后整理记录,此种方式效率较低并且造成记录人员劳心劳力。随着集成电路技术的发展,目前的手机和笔记本电脑的处理能力越来越强,人工智能技术逐渐被应用在各个领域,目前已经有语音输入法可以直接将音频转换成文字,但该设备需要事先进行语音文字转换训练,并且仅是针对某个人,无法应用于具有多人的会议系统。

【发明内容】

本发明的目的在于提供一种会议记录装置及利用该装置对会议进行记录的方法,使其能够对多人参与的会议内容自动进行记录。

本发明装置包括语音采集模块、语音分类模块、语音文字转换模块、会议文字记录模块。语音采集模块采集语音数据,并将其送给语音分类模块;语音分类模块提取特征参数并依据该特征参数对输入的音频数据进行分类,即根据语音特性判断该段语音的主体;语音文字转换模块将一段语音转换成文字,会议文字记录模块将转换后的文字按照预定的格式存储下来,形成会议记录。

进一步地,所述音频数据是通过语音采集模块实时采集得到的;或者来自于事先录制的音频文件。

进一步地,所述会议文字记录存储模块采用预先规定的存储格式形成会议记录,其中该存储格式包括该段语音所属人物的标示、该段文字对应语音的起始时间及对应的文字信息。

进一步地,该装置还可以设置一个分类参数调整模块,在进行语音分类的时候,可以在控制窗口上显示每个音频段的分类结果,允许用户修改分类结果,并且根据用户修改结果重新训练分类参数,以提高后继的分类准确率。

进一步地,该装置还可以设置一个语音文字转换参数调整模块,在语音文字转换的时候,可以在控制窗口上显示每次语音文字转换的结果,允许用户修改转换后的文字,并且根据用户修改结果重新训练语音文字转换参数,以提高后继的分类准确率。

进一步地,该装置还支持分类参数和语音文字转换参数的存储;支持从已有的参数文件中配置装置目前所使用的分类参数和语音文字转换参数。

进一步地,该装置还可以设置一个会议声音和文字回放模块,以支持会议声音和文字的同步回放;在回放时,还可以配置过滤器,只回放指定人物的声音和文字。

进一步地,该装置还可以设置一个会议检索及定位播放模块,以支持通过特定的文字对会议进行检索,定位到相关的播放点。

利用本发明的装置对会议进行记录的方法包括如下步骤:

步骤一,利用语音采集模块采集音频数据;

步骤二,语音分类模块提取采集的音频数据的取特征参数并依据该特征参数对输入的音频数据进行分类;

步骤三,语音文字转换处理模块根据离线提取的语音主体的语音自动转换参数对输入的音频数据进行文字转换;

步骤四,会议文字记录存储模块接收语音文字转换处理模块输出的转换后的数据并进行存储形成会议记录。

进一步地,所述语音分类模块提取特征参数并对音频进行分类的具体步骤如下:

步骤一:接收一段音频数据;

步骤二:对采集来的音频数据进行处理,提取特征参数;

步骤三:根据提取的特征参数,对该段音频数据进行分类;

步骤四:判断是否存在长时间停顿,如是,则执行步骤八;

步骤五:判断目前存储在缓存的音频数据是否为同一个人的声音,如否,则执行步骤八;

步骤六:将当前的音频数据加入到缓存中;

步骤七:判断缓存的音频数据是否大于一指定的阈值,如是,则执行步骤八;

步骤八:将存储在缓存中的音频数据送给语音文字转换处理模块处理,清空缓存,进入步骤一。

进一步地,该音频数据是通过语音采集模块采集实时音频得到。

进一步地,该音频数据是通过语音采集模块采集事先录制的音频文件得到。

进一步地,所述会议文字记录存储模块采用预先规定存储格式对会议进行记录,其中该存储格式包括该段话所属人物的标示、该段文字对应语音的起始时间及对应的文字信息;

进一步地,语音文字转换处理模块离线提取语音主体的语音自动转换参数是通过先输入一段对应的文字已知的语音,之后通过迭代运算得到的。

进一步地,语音分类模块进行语音分类的步骤中还包括接收用户分类结果所做的修改,并且根据用户修改的结果重新训练分类参数的步骤。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于展讯通信(上海)有限公司,未经展讯通信(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110340457.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top