[发明专利]一种会议记录生成方法和装置在审
申请号: | 201910038460.6 | 申请日: | 2019-01-16 |
公开(公告)号: | CN109767757A | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 吴欢;田甜 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/08;G10L17/00;G06F16/60 |
代理公司: | 北京汇思诚业知识产权代理有限公司 11444 | 代理人: | 冯晓平 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音片段 会议记录 方法和装置 会议语音 人工智能技术 一一对应关系 内容生成 聚类 发言 费力 分割 | ||
1.一种会议记录生成方法,其特征在于,所述方法包括:
获取会议语音;
将所述会议语音进行分割,得到N个语音片段,N为大于等于2的自然数;
将所述N个语音片段进行聚类,得到M个类别的语音片段,M为大于等于2的自然数,M≤N,所述M个类别的语音片段分别与M个发言人具有一一对应关系;
确定所述M个类别的语音片段中每个类别的语音片段对应的发言人;
根据所述M个类别的语音片段确定所述M个发言人中每个发言人的发言内容;
根据所述M个发言人中每个发言人的发言内容生成会议记录。
2.根据权利要求1所述的方法,其特征在于,所述确定所述M个类别的语音片段中每个类别的语音片段对应的发言人,包括:
从所述M个类别的语音片段中每个类别的语音片段中各选择至少一个语音片段转换成文本片段,得到L个文本片段,L为自然数,L≥M;
向用户展示所述L个文本片段和发言人列表,所述发言人列表包括所述M个发言人中每个发言人的信息;
接收匹配指令,所述匹配指令为所述用户发出的用于指示将所述L个文本片段中每个文本片段与发言人进行匹配的指令;
根据所述匹配指令确定所述M个类别的语音片段中每个类别的语音片段对应的发言人。
3.根据权利要求1所述的方法,其特征在于,所述确定所述M个类别的语音片段中每个类别的语音片段对应的发言人,包括:
从所述M个类别的语音片段中每个类别的语音片段中各选择至少一个语音片段,得到Z个语音片段,Z为自然数,Z≥M;
向用户播放选择出的所述Z个语音片段并展示发言人列表,所述发言人列表包括所述M个发言人中每个发言人的信息;
接收匹配指令,所述匹配指令为所述用户发出的用于指示将所述Z个语音片段中每个语音片段与发言人进行匹配的指令;
根据所述匹配指令确定所述M个类别的语音片段中每个类别的语音片段对应的发言人。
4.根据权利要求1所述的方法,其特征在于,所述将所述N个语音片段进行聚类,包括:
S1:从所述N个语音片段中随机选择M个语音片段,将选择的M个语音片段作为M个类别的聚类中心;
S2:对于剩余的N-M个语音片段中的第i个语音片段,计算所述第i个语音片段与M个聚类中心中每个聚类中心之间的距离,并将所述第i个语音片段归类到与所述第i个语音片段距离最近的聚类中心对应的类别中,i依次取1至N-M之间的自然数;
S3:当所述M个语音片段归类完成之后,根据所述M个类别中每个类别包括的语音片段重新计算所述M个类别的聚类中心,并更新所述M个类别的聚类中心,
循环执行S2和S3,直到所述M个类别中每个类别的相邻两次聚类中心的距离在预设距离之内。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述将所述会议语音进行分割,得到N个语音片段,包括:
确定所述会议语音中的静音片段;
去除所述会议语音中的静音片段;
根据所述静音片段对去除所述静音片段后的会议语音进行分割,得到W个长语音片段,W为大于等于2的自然数,W<N;
提取所述W个长语音片段中每一个长语音片段的声学特征;
对所述W个长语音片段中每一个长语音片段的声学特征进行相对熵分析;
根据相对熵分析的结果对所述W个长语音片段进行切分,得到所述N个语音片段。
6.一种会议记录生成装置,其特征在于,所述装置包括:
获取单元,用于获取会议语音;
分割单元,用于将所述会议语音进行分割,得到N个语音片段,N为大于等于2的自然数;
聚类单元,用于将所述N个语音片段进行聚类,得到M个类别的语音片段,M为大于等于2的自然数,M≤N,所述M个类别的语音片段分别与M个发言人具有一一对应关系;
第一确定单元,用于确定所述M个类别的语音片段中每个类别的语音片段对应的发言人;
第二确定单元,用于根据所述M个类别的语音片段确定所述M个发言人中每个发言人的发言内容;
生成单元,用于根据所述M个发言人中每个发言人的发言内容生成会议记录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910038460.6/1.html,转载请声明来源钻瓜专利网。