[发明专利]布置和/或清除语音到文本的内容而无需用户提供明确指令在审
申请号: | 202180068837.8 | 申请日: | 2021-12-10 |
公开(公告)号: | CN116348844A | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 维克托·克尔布内;克里希南·萨普科塔;贝沙德·贝扎迪;朱莉娅·普罗斯库尔尼亚;雅各布·圣纳扎罗·纳塔;贾斯汀·路;马加利·布瓦佐-罗什;马里乌斯·绍伊加里克;尼科洛·德赫科莱;扎希德·萨布尔;卢夫·科塔里 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06F3/16 | 分类号: | G06F3/16 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李佳;周亚荣 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 布置 清除 语音 文本 内容 无需 用户 提供 明确 指令 | ||
本文所描述的实现方式涉及一种应用和/或自动化助理,其可以识别在语音到文本操作期间为布置文本而要执行的布置操作——而无需用户必需明确识别布置操作。在一些实例中,口述文档(例如,电子邮件、文本消息等)的用户可以向应用提供口头话语,以便并入文本内容。然而,在一些实例中,文档中的文本内容需要某些对应的布置。从口头话语中得出的文本内容可以由应用基于与该口头话语相关联的意图、发声特征和/或场境特征和/或与文档相关联的应用类型来布置,而无需用户明确识别对应的布置。以此方式,应用可以从仅指定文本内容的口头话语中推断内容布置操作。
背景技术
人类可以使用交互式软件应用来参与人机对话对话,该交互式软件应用在本文中称作“自动化助理”(也称作“聊天机器人”、“交互式个人助理”、“智能个人助理”、“个人话音助理”、“对话智能体”等)。自动化助理通常依赖于组件流水线来解释和响应于用户输入。例如,语音处理引擎可以用于处理捕捉用户的口头话语的音频数据,并生成文本上下文,诸如口头话语的转录(即,词项和/或其他词元的序列)。此外,可以使用自然语言理解(NLU)引擎来处理文本内容,并生成NLU输出,诸如用户在提供口头话语时的意图以及任选地与该意图相关联的参数的槽值。
在一些情况下,用户可使用自动化助理和/或自动化助理可访问的软件应用(也简称为“应用”),使用语音处理引擎来执行某些语音到文本的操作。例如,用户可以使用自动化助理和/或应用来代表用户口述文本内容,并且该文本内容可以被并入到文档中(例如,文字处理文档、电子邮件、文本消息等)。然而,在文本内容被并入到文档中之后,用户通常必须用布置操作来手动操纵文本内容,以便用期望的布置(即,间距、标点、大写、缩进等)对文本内容进行格式化。例如,用户可以提供附加的口头话语来执行这些布置操作中的一些,诸如提供“comma(逗号)”的口头命令以将逗号添加到文档中,“new line(新行)”以开始文档的新行,“indent(缩进)”以将缩进添加到文档中等,和/或经由分立的键盘或计算机鼠标接口提供类似的布置操作命令。
此外,在这些情况中的一些情况下,用户可以提供“clear(清除)”或“delete(删除)”的口头命令,以便消除已经并入在文档中的文本内容的一部分。然而,可能不会立即清楚用户希望从文档中消除哪些文本内容。因此,每当用户提供这些口头命令中的一者时,应用可以消除某一标准长度的文本。例如,每当用户提供这些口头命令中的一者时,应用可以仅删除单个字母或词,而不管与文档或包括口头命令的口头话语相关联的任何上下文。因此,当选择要删除的特定文本内容时,用户可以再次依赖于其他分立的接口,诸如键盘或计算机鼠标,而不是音频接口。结果,基于用户必须提供这些特定的口头命令来实现期望的布置、基于对文本内容的后续手动操纵和/或基于用户在这些分立的接口之间切换,用于在口述要被并入到文档中的文本内容时执行这些语音到文本操作的设备的计算资源可能被浪费和/或与自动化助理和/或应用的交互可能被延长。
发明内容
本文阐述的实现方式涉及一种可以响应于从用户接收到口头话语而执行语音到文本操作的自动化助理和/或应用,所述操作涉及以用户可能未明确详述的方式组织对应于口头话语的文本内容。以此方式,用户可以使用自动化助理和/或应用来进行语音到文本的操作,而不必明确地识别应该被执行来渲染文本内容的期望布置的每个操作。例如,用户可以向自动化助理提供口头话语,以使自动化助理执行语音到文本的操作来促进起草电子邮件邀请。当用户正在访问电子邮件应用时并且在用户已经初始化了自动化助理以用于检测将被转换成将被并入到电子邮件应用的字段中的文本内容的语音之后,可以提供口头话语。例如,当用户已经初始化音频接口以用于与自动化助理通信时,用户可以提供口头话语,诸如“Hi Adam…Friendly follow up to send me those meeting notes.Take care,Ronald(嗨,亚当…友好地跟进,把那些会议记录发给我。保重,罗纳德)”。尽管用户没有明确地识别任何格式化、标点符号、大写和/或用于如口头话语中所示布置文本内容的其他指引,但是自动化助理可以生成内容布置数据,该内容布置数据表征要包括在电子邮件应用的字段中的文本内容的布置,并且用于指引电子邮件应用根据该布置来布置文本内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180068837.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:光学各向异性聚合物薄膜及其制造方法
- 下一篇:分层用户设备定位