[发明专利]用于多模式会话交互中的口头语言理解的眼睛注视有效
申请号: | 201580050763.X | 申请日: | 2015-09-25 |
公开(公告)号: | CN107077201B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | A·普罗科菲瓦;F·A·塞利基尔马兹;D·Z·哈卡尼-图尔;L·赫科;M·斯拉尼 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F3/01 | 分类号: | G06F3/01 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 描述了改进对与计算机化会话系统相关联的视觉上下文中的视觉元素的引用的理解和/或解析的准确性。本文描述的技术利用注视输入与姿势和/或语音输入来改进计算机化会话系统中的口头语言理解。通过改进系统能够关于视觉上下文中的视觉元素来解析引用(或解释用户的意图)的准确性,利用注视输入和语音输入改善了会话系统中的口头语言理解。在至少一个示例中,本文中的技术描述了跟踪注视以生成注视输入,标识语音输入以及从该用户输入提取注视特征和词汇特征。至少部分地基于该注视特征和该词汇特征,可以解析被指向视觉上下文中的视觉元素的用户话语。 | ||
搜索关键词: | 用于 模式 会话 交互 中的 口头 语言 理解 眼睛 注视 | ||
【主权项】:
一种计算机实现的方法,所述方法用于理解和解析对会话计算系统的视觉上下文中的视觉元素的引用,所述方法包括:标识所述视觉上下文中可用于用户交互的所述视觉元素;从耦合到所述会话计算系统的一个或多个输入设备接收与所述视觉上下文中的所述视觉元素中的一个或多个视觉元素相关联的用户输入,所述用户输入包括:从引用所述一个或多个视觉元素中的特定视觉元素的语音输入得到的话语;以及与所述一个或多个视觉元素中的至少一些视觉元素相关联的注视输入,所述一个或多个视觉元素中的所述至少一些视觉元素包括所述特定视觉元素;至少部分地基于所述视觉元素和所述用户输入来提取词汇特征和注视特征;以及至少部分地基于所述词汇特征和注视特征来确定所述特定视觉元素。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201580050763.X/,转载请声明来源钻瓜专利网。
- 上一篇:挂持夹具
- 下一篇:一种静脉留置针多功能包装盒