[发明专利]用于基于视觉的监视系统的语音接口在审
申请号: | 201810168053.2 | 申请日: | 2018-02-28 |
公开(公告)号: | CN108509502A | 公开(公告)日: | 2018-09-07 |
发明(设计)人: | A·W·泰克曼;K·斯珀林;H·达尔坎普;A·U·多尔;A·格里菲思;M·哈斯萨恩普尔 | 申请(专利权)人: | 灯塔人工智能公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L15/26;H04N7/18 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;王艳春 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 监视系统 视觉 视频帧 标识符 数据库查询 自然语言 分类装置 用户提供 语音接口 输入相 检测 数据库 关联 | ||
1.一种用于与基于视觉的监视系统进行基于自然语言的交互的方法,包括:
由所述基于视觉的监视系统从用户获得请求输入,其中,所述请求输入针对由所述基于视觉的监视系统的分类装置检测到的物体;
获得与所述请求输入相关联的标识符;
基于所述标识符来从多个场所识别出所述基于视觉的监视系统的场所;
基于所述请求输入和所识别的场所来生成数据库查询;
从监视系统数据库获得与所述数据库查询有关的视频帧,其中,所述视频帧包括检测到的物体;和
向所述用户提供所述视频帧。
2.根据权利要求1所述的方法,其中,所述请求输入包括从用户获得的文字。
3.根据权利要求2所述的方法,其中,从所述用户获得所述文字包括获得口头用户请求,并将所述口头用户请求转换为文字。
4.根据权利要求1所述的方法,其中,所述请求输入是使用由所述用户访问的远程计算设备而获得的。
5.根据权利要求1所述的方法,其中,所述标识符包括从由硬件标识、鉴别密钥和证书组成的组中选择的一种。
6.根据权利要求1所述的方法,其中,生成所述数据库查询包括:
在所述请求输入中识别多个不同的筛选意图;
验证所述多个筛选意图;和
从所验证的多个筛选意图构造所述数据库查询。
7.根据权利要求6所述的方法,其中,验证所述多个筛选意图包括:
确定所述多个筛选意图中的至少一个筛选意图是未知的;和
基于所述确定:
使用所述监视系统数据库的场所特定数据来解析未知的所述筛选意图。
8.根据权利要求6所述的方法,其中,验证所述多个筛选意图包括:
确定所述多个筛选意图中的至少一个筛选意图是未知的;和
基于所述确定:
向所述用户提交澄清请求;
获得用户响应;和
基于所获得的用户响应来解析未知的所述筛选意图。
9.根据权利要求8所述的方法,其中,所述用户响应是由所述用户说出的口头澄清。
10.根据权利要求8所述的方法,其中,所述用户响应是由所述用户在视频帧中做出的选择。
11.根据权利要求1所述的方法,其中,从所述监视系统数据库获得与所述查询有关的视频帧包括:
在所述监视系统数据库的元数据档案的场所特定数据中识别与所述查询有关的标记,
其中,所述标记标注从由所述物体和涉及所述物体的动作组成的组中选择的至少一种的出现,
其中,所述标记标识与所述查询有关的视频帧;和
从所述监视系统的视频档案中检索与所述查询有关的所述视频帧。
12.根据权利要求11所述的方法,
其中,与所述查询有关的所述视频帧是存储在所述视频档案中的存档视频流的视频帧,并且
其中,所述视频帧的标记标注由所述基于视觉的监视系统检测到的内容。
13.根据权利要求1所述的方法,还包括:
在接收到所述请求输入之后接收修改输入;
响应于接收到所述修改输入而修改所述数据库查询以获得修改的数据库查询;
从所述监视系统数据库获得与所述修改的数据库查询有关的附加视频帧;和
向用户提供所述附加视频帧。
14.根据权利要求1所述的方法,还包括:在向所述用户提供所述视频帧之前:
通过添加光环以突出显示检测到的物体来增强所述视频帧。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于灯塔人工智能公司,未经灯塔人工智能公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810168053.2/1.html,转载请声明来源钻瓜专利网。