[发明专利]虚拟助理的语音比较在审

专利信息
申请号: 202010757413.X 申请日: 2020-07-31
公开(公告)号: CN112346696A 公开(公告)日: 2021-02-09
发明(设计)人: G.G.乔道;A.D.A.维莱拉;F.G.巴博萨;C.E.达西尔瓦;T.C.帕罗内蒂;S.M.达西尔瓦;L.S.C.达西尔瓦 申请(专利权)人: 国际商业机器公司
主分类号: G06F3/16 分类号: G06F3/16;G06F16/33;G06F16/335;G10L15/22;G06F16/16
代理公司: 北京市柳沈律师事务所 11105 代理人: 邸万奎
地址: 美国纽*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 虚拟 助理 语音 比较
【说明书】:

在一种通过使用语音比较找到存储在本地数据库中的响应来优化智能虚拟助理的方法中,处理器在计算设备上接收音频输入。处理器将音频输入转录成文本。处理器使用语音算法将文本与计算设备的本地数据库中的用户查询和命令的集合进行比较。处理器确定用户查询和命令的集合中的用户查询或命令是否满足预定义相似性阈值。响应于确定用户查询或命令满足预定义相似性阈值,处理器识别对应于用户查询或命令的、存储在本地数据库中的意图集合中的意图。处理器识别对应于意图的、本地数据库中的响应集合中的响应。处理器可听地输出该响应。

技术领域

发明总体上涉及智能虚拟助理领域,更具体地,涉及通过使用语音比较查找存储在本地数据库中的响应来优化智能虚拟助理。

背景技术

智能虚拟助理,本文称为虚拟助理(virtual assistant,VA),是能够基于口头命令和口头查询为用户执行任务或服务的软件程序。这些服务可以包括播放歌曲、电视节目或电影;提供关于天气的信息;设置警报;制定待办事项列表等。VA和其用户之间的交互通过声音用户界面(voice-user interface,VUI)发生,该声音用户界面可以在个人计算设备、移动设备、智能扬声器等中实施。VA也可以被称为智能个人助理、智慧助理、智能虚拟代理、智慧虚拟代理和虚拟代理。VA利用自然语言处理(Natural language processing,NLP)引擎和自动言语识别服务将输入与可执行任务或服务相匹配。

通常,自然语言处理引擎和自动言语识别服务不发生在VA的本地应用内。相反,VA的本地应用将用户输入路由到服务器或云服务,该服务器或云服务通过自然语言处理引擎和/或自动言语识别服务运行声音命令,以处理用户输入并生成适当的响应。一旦VA接收到响应,VA就将该响应转换成音频并将其输出给用户。

自然语言处理(NLP)引擎在人类语言被讲述时帮助计算机理解和解释该人类语言。NLP引擎使用两种主要技术:语法和语义分析。语法是单词排列成短语、从句、句子或段落的方式。常见的语法技术包括解析、单词分割、断句、语素分割和词干提取。NLP引擎使用语法来评估单词、短语、从句、句子或段落的含义。语义分析用于将单词、短语、从句、句子或段落与它们的语言无关的含义联系起来。语义分析首先通过分析单词、短语、从句、句子或段落在其周围文本中的上下文、然后通过分析文本的结构来识别其正确的含义来执行。由NLP引擎使用的常用语义分析技术包括词义消歧、命名体识别和自然语言生成。

言语识别,也称为自动言语识别(automatic speech recognition,ASR),是指通过计算机系统对讲述的语言进行分析并将其翻译成文本(例如,言语到文本转换(speech-to-text conversion,STT))。模数转换器(analog-to-digital converter,ADC)用于将用户声音的模拟波形翻译成计算机能够理解的数据。为了将波形翻译成数据,ADC以频繁的间隔对波形进行精确测量。由ADC产生的信号然后被分成与已知音素匹配的小段。音素是一种感觉上不同的声音单位,它将一个词与另一个词区分开来。一旦匹配,就在周围音素的上下文中检查已知音素,并将其与已知单词、短语和句子的库进行比较。基于检查和比较的结果,用户所讲述的单词被翻译,并且以文本或计算机命令的形式产生响应。

发明内容

本发明实施例的各方面公开了一种用于通过使用语音比较查找存储在本地数据库中的响应来优化智能虚拟助理的方法、计算机程序产品和计算机系统。处理器在计算设备上接收音频输入。处理器将音频输入转录成文本。处理器使用语音算法将该文本与计算设备的本地数据库中的用户查询和命令的集合进行比较。处理器确定用户查询和命令的集合中的用户查询或命令是否满足与该文本的预定义相似性阈值。响应于确定用户查询或命令满足预定义相似性阈值,处理器识别对应于用户查询或命令的、存储在本地数据库中的意图集合的意图。处理器识别对应于该意图的、本地数据库中的响应集合中的响应。处理器以听觉方式输出该响应。

附图说明

图1是示出根据本发明实施例的虚拟助理环境的功能框图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010757413.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top