[发明专利]用于语音处理的方法和设备在审
申请号: | 202110096040.0 | 申请日: | 2021-01-25 |
公开(公告)号: | CN113643698A | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 姜泰均 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/04;G10L15/12;G10L25/30;G10L25/45;G10L19/00 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 张川绪;刘灿强 |
地址: | 韩国京畿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 语音 处理 方法 设备 | ||
1.一种用于语音处理的方法,所述方法包括:
从语音信号确定目标段;
通过对目标段进行解码来确定与目标段对应的目标字符序列;
基于编辑距离来确认目标字符序列与先前字符序列之间的第一重叠部分;以及
基于第一重叠部分对目标字符序列和先前字符序列进行合并,
其中,编辑距离表示目标字符序列与先前字符序列之间的差异程度,所述差异程度通过量化将单个字符序列转换为另一字符序列所需的最小操作成本来获得。
2.根据权利要求1所述的方法,其中,基于编辑距离的成本来来确认目标字符序列与先前字符序列之间的第一重叠部分,
其中,基于对目标字符序列和先前字符序列执行的操作的类型、目标字符序列与先前字符序列是否位于第一重叠部分中和目标字符序列与先前字符序列在第一重叠部分中是否匹配中的任何一个或者任何两个或更多个的任何组合来确定编辑距离的成本。
3.根据权利要求1所述的方法,其中,基于第一重叠部分对目标字符序列和先前字符序列进行合并的步骤包括:
确认第一重叠部分中的词边界,
将确认的词边界指定为转换候选,
从指定的转换候选选择位于最靠近第一重叠部分的中心的一个转换候选作为转换点,
通过将先前字符序列中的转换点之前的所有词连接到目标字符序列中的转换点之后的所有词,来对先前字符序列和目标字符序列进行合并。
4.根据权利要求2所述的方法,其中,编辑距离的成本被不同地应用于目标字符序列与先前字符序列之间的第一重叠部分和非重叠部分。
5.根据权利要求2所述的方法,其中,在目标字符序列与先前字符序列之间的非重叠部分中发生的编辑距离的插入成本小于在第一重叠部分中发生的编辑距离的插入成本。
6.根据权利要求2所述的方法,其中,编辑距离的匹配成本小于在目标字符序列与先前字符序列之间的非重叠部分中发生的编辑距离的插入成本。
7.根据权利要求2所述的方法,其中,在第一重叠部分中发生的编辑距离的插入成本、删除成本和替换成本是正数。
8.根据权利要求2所述的方法,其中,编辑距离的匹配成本是负数,并且
在目标字符序列与先前字符序列之间的非重叠部分中发生的编辑距离的插入成本为零。
9.根据权利要求1所述的方法,其中,从语音信号确定目标段的步骤包括:基于段长度和段之间的重叠长度从语音信号确定目标段。
10.根据权利要求9所述的方法,其中,基于执行所述方法的设备的可用资源来确定段之间的重叠长度。
11.根据权利要求1所述的方法,其中,确认的步骤包括:根据用户在段之间的重叠长度期间说出的最大字符长度,来确认目标字符序列与从先前字符序列提取的部分序列之间的第二重叠部分。
12.根据权利要求1至11中的任意一项所述的方法,其中,基于对与语音信号中的目标段部分重叠的先前段进行解码的结果来确定先前字符序列。
13.根据权利要求12所述的方法,其中,确认的步骤包括:确认目标字符序列与先前字符序列中的对先前段进行解码获得的字符序列之间的第三重叠部分。
14.根据权利要求12所述的方法,其中,目标段中的第一重叠部分小于目标段的一半。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110096040.0/1.html,转载请声明来源钻瓜专利网。