[发明专利]会议搜索以及搜索结果的回放有效

申请号：	201680008612.2	申请日：	2016-02-03
公开（公告）号：	CN107210045B	公开（公告）日：	2020-11-17
发明（设计）人：	R·J·卡特莱特;黄申	申请（专利权）人：	杜比实验室特许公司
主分类号：	G10L25/48	分类号：	G10L25/48;G10L15/26
代理公司：	中国贸促会专利商标事务所有限公司 11038	代理人：	宿小猛
地址：	美国加***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	会议搜索以及结果回放
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于处理音频数据的方法，所述方法包括：

接收对应于涉及多个会议参与者的至少一个会议的记录的音频数据，所述音频数据包括以下中的至少一个：(a)被分别记录的来自多个端点的会议参与者语音数据，或(b)来自对应于多个会议参与者的单个端点的、并且包括所述多个会议参与者中的每个会议参与者的空间信息的会议参与者语音数据；

基于一个或多个搜索参数确定音频数据的搜索的搜索结果，所述搜索结果对应于音频数据中的会议参与者语音的至少两个实例，会议参与者语音的所述至少两个实例包括由第一会议参与者发出的至少第一语音实例和由第二会议参与者发出的至少第二语音实例，其中确定搜索结果包括搜索具有包括指向上下文信息的指针的数据结构的关键词检索索引；

将会议参与者语音的实例渲染到虚拟声学空间的至少两个不同的虚拟会议参与者位置，使得第一语音实例被渲染到第一虚拟会议参与者位置，并且第二语音实例被渲染到第二虚拟会议参与者位置；以及

调度会议参与者语音的实例的至少一部分进行同时回放，以产生回放音频数据。

2.根据权利要求1所述的方法，其中，确定搜索结果包括接收搜索结果或者执行搜索。

3.根据权利要求1所述的方法，其中，确定搜索结果包括执行音频数据的关于多个特征的并发搜索。

4.根据权利要求3所述的方法，其中，所述多个特征包括从一组特征中选择的两个或更多个特征，该组特征包括词语、会议段、时间、会议参与者情绪、端点位置；和端点类型。

5.根据权利要求1所述的方法，其中，确定搜索结果包括执行对应于多个会议的记录的音频数据的搜索。

6.根据权利要求1所述的方法，其中，该调度包括至少部分地基于搜索相关性度量来调度会议参与者语音的实例进行回放。

7.根据权利要求1所述的方法，进一步包括修改会议参与者语音的至少一个实例的开始时间或结束时间。

8.根据权利要求7所述的方法，其中，修改包括扩展对应于会议参与者语音的实例的时间间隔。

9.根据权利要求8所述的方法，其中，修改涉及合并对应于单个会议端点的、扩展后在时间上重叠的会议参与者语音的两个或更多个实例。

10.根据权利要求1所述的方法，其中，该调度包括以下调度中的至少一个：调度先前在时间上不重叠的会议参与者语音的实例以在时间上重叠地回放，或者调度先前在时间上重叠的会议参与者语音的实例以在时间上进一步重叠地回放。

11.根据权利要求1所述的方法，其中，调度根据感知激发规则的集合被执行。

12.根据权利要求11所述的方法，其中，感知激发规则的集合包括从规则列表选择的至少一个规则，所述规则列表包括：指示单个会议参与者的两个讲话突发不应该在时间上重叠的规则；指示如果两个讲话突发对应于单个端点，则这两个讲话突发在时间上不应该重叠的规则；如下规则，其中给定两个连续的输入讲话突发A和B，A已经在B之前发生，对应于B的输出讲话突发的回放能够在对应于A的输出讲话突发的回放完成之前开始，但是不会在对应于A的输出讲话突发的回放开始之前开始；以及如下规则，该规则允许对应于B的输出讲话突发的回放不早于在对应于A的输出讲话突发的回放完成之前的时间T开始，T可以大于零。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司，未经杜比实验室特许公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201680008612.2/1.html，转载请声明来源钻瓜专利网。

上一篇：一种机动车驾驶培训及考试用档位检测系统
下一篇：一种混合动力汽车的散热装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]会议搜索以及搜索结果的回放有效

专利文献下载