[发明专利]实时语音到文本的交互增强和集成在审
申请号: | 202080084891.7 | 申请日: | 2020-11-05 |
公开(公告)号: | CN114787916A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | D·M·阮;R·M·赛德;A·M·贝肯;W·D·刘易斯;M·托尔森;C·拉尔森 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G06F40/169;G06F40/242;G06F40/58;G06F3/048;G06Q10/10;G06F21/31 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 李辉 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实时 语音 文本 交互 增强 集成 | ||
在本公开的非限制性示例中,呈现了用于在生产力应用中集成语音到文本转录的系统、方法和设备。由第一设备发送对于访问由第二设备正在接收的音频信号的实时语音到文本转录的请求。实时语音到文本转录可以被呈现在第一设备上的生产力应用的转录窗格中。将转录翻译成不同语言的请求可以被接收。转录可以被实时翻译并且被呈现在转录窗格中。对所呈现的转录中的单词的选择可以被接收。对于从转录窗格拖动单词并且将单词放置到生产力应用中的转录窗格外部的窗口中的请求可以被接收。单词可以被呈现在生产力应用中的转录窗格外部的窗口中。
背景技术
用户通常很难在听演讲(例如,讲座)的同时还记下与该讲座相关的笔记。这可能是由于各种原因造成的。例如,用户可能不熟悉演讲主题、具有听觉学习问题、具有听力问题和/或语言问题(例如,演讲不是以用户的第一语言)。字幕是提高用户理解内容能力的优秀机制。然而,即使字幕在现场演示期间可用,在执行一个或多个附加任务(例如,做笔记)时,也很难跟随或与之交互。
针对该一般技术环境想到本文公开的本技术的各方面。此外,尽管讨论了一般环境,但是应当理解,本文描述的示例不应限制于背景技术中标识的一般环境。
发明内容
提供本发明内容是为了以简化形式介绍一组概念,这些概念将在下面的具体实施方式部分中进一步描述。本发明内容不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用作协助确定所要求保护的主题的范围。示例的附加方面、特征和/或优点将部分地在下面的描述中陈述,并且部分地将从本公开的描述中显而易见或可以通过本公开的实施来了解。
本公开的非限制性示例描述了用于在生产力应用中集成语音到文本转录的系统、方法和设备。加入码生成请求可以从与说话用户相关联的计算设备被接收。该请求可以被实时语音到文本服务接收。实时语音到文本服务可以生成加入码并将其发送到与说话用户相关联的计算设备。包括语音的音频信号可以由与说话用户相关联的计算设备接收。音频信号可以被发送到实时语音到文本服务,在该服务中它可以被转录。
与加入用户相关联的计算设备可以在转录被生成(例如,转录实例)时请求访问该转录。该请求可以包括由实时语音到文本服务生成的加入码。在被认证后,转录可以实时或几乎实时地被呈现在与加入用户相关联的生产力应用中的转录窗格中。各种动作可以与转录、生产力应用、其他应用和/或其组合相关联地被执行。在一些示例中,转录窗格中的内容可以被突出显示和/或注释。来自转录窗格的内容可以从转录窗格移动(例如,经由拖动或放置)到生产力应用的另一窗口(例如,笔记本窗口、做笔记窗口)。针对单词和短语的定义可以在转录窗格中被呈现。与转录窗格中的单词和短语相关联的Web搜索可以被自动执行。在一些示例中,转录窗格的暂停功能可以被利用以暂停针对转录实例的传入字幕。在暂停期间被保持的字幕然后可以在恢复转录实例后被呈现。在附加示例中,转录窗格可以包括用于将转录从第一语言翻译成一种或多种附加语言的可选择选项。实时语音到文本服务和/或翻译服务可以处理这样的请求,在正在接收转录和/或音频信号的同时对其进行翻译,并将翻译发送到加入用户的计算设备,在该计算设备处,该翻译可以被呈现在转录窗格中。
附图说明
参考以下附图描述非限制性且非穷举的示例:
图1是示出了用于在生产力应用中集成语音到文本转录的示例分布式计算环境的示意图。
图2示出了可以被利用在生产力应用中的集成语音到文本转录中的三个基于云的服务的示例性元素。
图3示出了与被集成在生产力应用中的转录窗格中的文本的交互。
图4示出了将转录窗格中的文本转移到生产力应用中的分离的窗口。
图5示出了生产力应用的转录窗格中的文本的注释。
图6示出了用于改变实时语音到文本转录被呈现在转录窗格中的语言的可选择元素。
图7A示出了用于呈现被包括在生产力应用的转录窗格中的单词和/或短语的定义的可选择元素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080084891.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:扩展对某些请求的一致性保护的高速缓存窥探模式
- 下一篇:调色剂