[发明专利]以对文本文档的音频回放进行补充的视觉内容为特点的文本到语音界面在审
申请号: | 201880095583.7 | 申请日: | 2018-10-12 |
公开(公告)号: | CN112424853A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | B.戴维斯;O.拉德;G.博尼费斯;R.德拉托雷费尔南德斯;J.怀特;J.阿达梅克;S.托库迈;M.夸斯索夫;Y.马蒂亚斯;Y.周;R.阿米拉 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G09B5/06 | 分类号: | G09B5/06;G10L13/00;G06F3/0481;G06F3/0484;G06F16/60;G06F16/70;G06F16/40 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 金玉洁 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 文档 音频 回放 进行 补充 视觉 内容 特点 语音 界面 | ||
1.一种计算机实现的方法,该方法包括:
通过一个或更多个计算设备获取描述文档中包括的文本内容的数据;
通过所述一个或更多个计算设备提供用于显示给用户的图形用户界面,其中图形用户界面呈现文档中包括的文本内容的至少一部分,以及其中图形用户界面包括图形音频快捷方式特征,该图形音频快捷方式特征使用户能够请求文本内容的至少一部分的音频回放;
通过所述一个或更多个计算设备接收选择图形音频快捷方式特征的用户输入;
通过所述一个或更多个计算设备生成包括文本内容的语音的音频信号;
通过所述一个或更多个计算设备分析文本内容和音频信号之一或两者,以识别文本内容所引用的一个或更多个语义实体;
通过所述一个或更多个计算设备获取与所述一个或更多个语义实体相关联的一个或更多个视觉内容项;
通过所述一个或更多个计算设备引起向用户回放音频信号;以及
通过所述一个或更多个计算设备提供所述一个或更多个视觉内容项以与向用户回放音频信号同时地在图形用户界面中显示给用户。
2.根据权利要求1所述的计算机实现的方法,其中通过所述一个或更多个计算设备提供所述一个或更多个视觉内容项以与向用户回放音频信号同时地显示给用户包括:在发生音频信号的引用语义实体的相应部分的回放的相应时间段期间,通过所述一个或更多个计算设备提供显示多个视觉内容项中的相应的一个,这样的相应的视觉内容项与所述语义实体相关联。
3.根据任何前述权利要求所述的计算机实现的方法,其中通过所述一个或更多个计算设备获取描述文档中包括的文本内容的数据包括:通过所述一个或更多个计算设备获取描述文档中包括的文本内容的子集的数据,该子集已由用户选择,其中仅相对于文本内容的已由用户选择的子集执行所述生成、分析和获取。
4.根据任何前述权利要求所述的计算机实现的方法,其中通过所述一个或更多个计算设备获取与所述一个或更多个语义实体相关联的所述一个或更多个视觉内容项包括:通过所述一个或更多个计算设备从文档获取一个或更多个视觉内容项。
5.根据任何前述权利要求所述的计算机实现的方法,其中通过所述一个或更多个计算设备获取与所述一个或更多个语义实体相关联的所述一个或更多个视觉内容项包括:通过所述一个或更多个计算设备从不同于文档的外部数据源获取一个或更多个视觉内容项。
6.根据任何前述权利要求所述的计算机实现的方法,其中通过所述一个或更多个计算设备获取与所述一个或更多个语义实体相关联的所述一个或更多个视觉内容项包括:通过所述一个或更多个计算设备访问知识图谱,以获取知识图谱内的与所述一个或更多个语义实体相关联的视觉内容项。
7.根据任何前述权利要求所述的计算机实现的方法,其中所述一个或更多个视觉内容项包括以下中的一个或更多个:静止图像、动画或视频。
8.根据任何前述权利要求所述的计算机实现的方法,进一步包括:
通过所述一个或更多个计算设备在图形用户界面中提供文本显示区域,以与向用户回放音频信号同时地显示给用户,其中文本显示区域显示文本的至少一部分,文本的所述至少一部分对应于音频信号的当前正在针对其发生回放的当前部分。
9.根据权利要求8所述的计算机实现的方法,其中通过所述一个或更多个计算设备提供所述一个或更多个视觉内容项以与向用户回放音频信号同时地显示给用户包括:通过所述一个或更多个计算设备提供所述一个或更多个视觉内容项以在文本显示区域内或邻接文本显示区域显示给用户。
10.根据权利要求9所述的计算机实现的方法,其中通过所述一个或更多个计算设备提供所述一个或更多个视觉内容项以在文本显示区域内或邻接文本显示区域显示给用户包括:通过所述一个或更多个计算设备提供所述一个或更多个视觉内容项作为文本显示区域的背景,以及其中文本的在文本显示区域内显示的所述部分叠加在所述一个或更多个视觉内容项上。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880095583.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于天线阵列远程无线电控制的近场天线
- 下一篇:飞行体