[发明专利]用于检测和校正对查询的识别中的差错的系统和方法在审
申请号: | 202010915560.5 | 申请日: | 2020-09-03 |
公开(公告)号: | CN112445931A | 公开(公告)日: | 2021-03-05 |
发明(设计)人: | 白羚;邢博纳 | 申请(专利权)人: | 声音猎手公司 |
主分类号: | G06F16/632 | 分类号: | G06F16/632;G06F16/635;G06F40/226;G10L15/22 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 杨佳婧 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检测 校正 查询 识别 中的 差错 系统 方法 | ||
1.一种用于检测对查询的不准确响应的方法,该方法包括:
接收来自用户的第一查询,所述第一查询具有结束时间和第一转录;
提供对所述第一查询的响应;
在接收所述第一查询后的短时间段内接收来自用户的第二查询,所述第二查询具有第二转录;
比较所述第二转录与所述第一转录以确定所述第一转录和所述第二转录之间的相似性;并且
基于对所述第一转录和所述第二转录之间的相似性的确定,当所述第一查询与所述第二查询相似时,确定所述响应是不准确的。
2.如权利要求1所述的方法,其中所述第二查询中断提供所述响应。
3.如权利要求1或2所述的方法,其中比较包括通过计算编辑距离来相对于所述第二转录分析所述第一转录。
4.如权利要求1至3的任何一项所述的方法,其中所述第二查询是在所述第一查询的结束时间后的三十秒内接收到的。
5.如权利要求1或2所述的方法,其中比较包括:
将所述第一转录变换成表示所述第一查询的含义的第一嵌入向量;
将所述第二转录变换成表示所述第二查询的含义的第二嵌入向量;并且
将查询相似性计算为所述第一嵌入向量和所述第二嵌入向量之间的距离。
6.一种识别任何查询的误转录的方法,该方法包括:
在第一时间接收第一查询,所述第一查询具有结束时间;
为在所述第一时间接收的所述第一查询得出第一转录;
提供对所述第一查询的响应;
在第二时间接收第二查询;
为在所述第二时间接收的所述第二查询得出第二转录,所述第二转录不同于所述第一转录;
当所述第一时间和所述第二时间之间的时间流逝小于三十秒时,将所述第一转录与所述第二转录相比较以确定所述第一转录和所述第二转录之间的相似水平是否超过阈值;并且
当所述第一转录和所述第二转录之间的相似水平超过所述阈值时,确定存在误转录。
7.如权利要求6所述的方法,其中确定存在误转录取决于确定在所述第二时间接收的所述第二查询中断所述响应。
8.如权利要求6所述的方法,其中确定存在误转录取决于基于语义嵌入向量之间的距离确定在所述第一时间接收的所述第一查询的所述第一转录包括与在所述第二时间接收的所述第二查询的所述第二转录的充分语义相似性。
9.如权利要求6所述的方法,其中确定存在误转录取决于确定在所述第二时间接收的所述第二查询包括指出所述第一转录错误的关键短语。
10.如权利要求6所述的方法,其中确定存在误转录取决于确定所述第二转录是从文本查询得出的。
11.如权利要求6至10的任何一项所述的方法,其中比较包括:
将所述第一转录变换成表示所述第一转录的第一嵌入向量;
将所述第二转录变换成表示所述第二转录的第二嵌入向量;并且
基于所述第一嵌入向量和所述第二嵌入向量之间的距离计算查询相似性。
12.一种标记查询数据的方法,包括:
对于第一时间处的第一查询确定第一转录;
对于第二时间处的第二查询确定第二转录,所述第二转录不与所述第一转录相同;
基于编辑距离计算所述第一转录和所述第二转录之间的查询相似性;并且
响应于所计算的查询相似性超过阈值而标记所述第一转录。
13.如权利要求12所述的方法,还包括生成响应,其中所述标记取决于确定所述第二时间处的所述第二查询在所述响应期间插入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于声音猎手公司,未经声音猎手公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010915560.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电动机驱动装置
- 下一篇:聚苯醚系树脂组合物和车辆用灯具延长件