[发明专利]用于对话可懂度评估的方法和装置在审
申请号: | 201980103515.5 | 申请日: | 2019-12-23 |
公开(公告)号: | CN115053289A | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | D·C·普罗文西奥;M·沃尔什;B·斯莱克;E·斯特因 | 申请(专利权)人: | DTS公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/69;G10L15/10 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 鲍进 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 对话 可懂度 评估 方法 装置 | ||
1.一种方法,包括:
获得包括与非对话声音混音的对话的混音音轨;
将混音音轨转换成比较文本;
获得对话的参考文本作为对话的可懂度的参考;
基于比较文本与参考文本的比较,确定混音音轨的对话对听者的可懂度的测量;以及
报告对话的可懂度的测量。
2.如权利要求1所述的方法,其中转换包括使用自动语音识别(ASR)将混音音轨转换成比较文本。
3.如权利要求1所述的方法,其中确定对话的可懂度的测量包括:
基于比较计算混音音轨的时间切片的对话的可懂度的个体测量;以及
基于对话的可懂度的个体测量计算对话的可懂度的测量。
4.如权利要求3所述的方法,其中报告包括:
显示对话的可懂度的测量和对话的可懂度的个体测量。
5.如权利要求3所述的方法,其中:
计算对话的可懂度的个体测量包括确定与混音音轨的时间切片对应的比较文本的片段与参考文本的片段中的对应片段之间的差异。
6.如权利要求5所述的方法,其中报告包括:
显示对话的可懂度的测量、对话的可懂度的个体测量、比较文本的片段以及参考文本的片段中的对应片段。
7.如权利要求3所述的方法,还包括:
生成为数字再现设备配置的并且至少包括对话的可懂度的个体测量的元数据。
8.如权利要求1所述的方法,其中:
参考文本包括跨越相应时间间隔的字幕文本的块;以及
确定可懂度的测量包括确定(i)与混音音轨的时间切片对应的比较文本的片段与(ii)将共同对话传达给比较文本的片段的字幕文本的块中的对应块之间的个体差异。
9.如权利要求8所述的方法,还包括:
使用文本匹配算法将比较文本的片段与字幕文本的块中的对应块进行匹配,所述文本匹配算法使比较文本的每个片段与字幕文本的块中的匹配块之间的文本相似度最大化,
其中确定个体差异包括基于匹配的结果确定个体差异。
10.如权利要求1所述的方法,其中获得参考文本包括:
将仅对话音轨转换成参考文本。
11.如权利要求1所述的方法,其中获得参考文本包括接收对话的基于文本的字幕作为参考文本。
12.如权利要求1所述的方法,其中获得混音音轨包括:
接收包括与非对话声音混音的对话的原始混音音轨;以及
用仿真声音效果对原始混音音轨进行声学修正以产生混音音轨,所述仿真声音效果仿真室内声学、声音再现系统回放声学和背景噪声中的一种或多种。
13.如权利要求1所述的方法,其中转换包括:
使用机器学习对话提取器,从混音音轨中提取对话以产生占主导地位的对话音轨;以及
将占主导地位的对话音轨转换成比较文本。
14.如权利要求1所述的方法,其中确定对话的可懂度的测量包括计算比较文本与参考文本之间的差异,以及基于该差异计算对话的可懂度的测量。
15.如权利要求14所述的方法,其中计算差异包括将差异计算为代表字母或单词的差异的文本距离,或者计算为代表声音中的差异的语音文本距离。
16.如权利要求14所述的方法,其中计算差异包括:
使用第一比较算法计算比较文本与参考文本之间的第一差异;
使用不同于第一比较算法的第二比较算法计算比较文本与参考文本之间的第二差异;以及
将差异计算为第一差异和第二差异的加权组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于DTS公司,未经DTS公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980103515.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:丝网印刷装置及丝网印刷方法
- 下一篇:紧凑型天线阻抗调谐器