[发明专利]电视机应用的语音适配方法和装置及语音控制方法有效
申请号: | 202010107557.0 | 申请日: | 2020-02-21 |
公开(公告)号: | CN111263236B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 杨果 | 申请(专利权)人: | 广州欢网科技有限责任公司 |
主分类号: | H04N21/472 | 分类号: | H04N21/472;H04N21/435;G10L15/22;G10L15/06;G10L15/02 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 刘冬梅 |
地址: | 510000 广东省广州市番禺*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电视机 应用 语音 配方 装置 控制 方法 | ||
本发明公开了一种电视机应用的语音适配方法和装置及语音控制方法,通过获取应用的页面信息得到应用每个页面上功能块的位置坐标和控制对应功能块的语音控制词汇,将语音控制词汇与对应的功能块的位置坐标绑定实现语音适配。无需开发人员针对每一款应用都进行语音适配。完善一个用户数据后可以方便用户语音打开应用各个页面以及播放电视节目,实现了用户一句话电视界面跳转到用户想控制的页面。同时也可以协助第三方应用厂家和语音厂家解决用户问题。无需开发人员与应用厂商对语音控制词语进行对接,减少开发人员的工作量,实现自动化控制的目的。能够自动化语音匹配,省去了开发人员频繁对接与更新语音控制词汇的工作。
技术领域
本发明涉及智能电视语音控制领域,特别地,涉及一种电视机应用的语音适配方法和装置及语音控制方法。
背景技术
随着智能电视机的普及,具备语音控制功能的电视机越发收到人们的欢迎。但是现有电视机内应用比较多,需要对每个应用都进行语音适配,语音适配就是将应用进行语音控制。
传统对单个应用进行语音控制的方法是:单一的语音厂家与应用厂家进行一对一的词汇收集与对接,需要开发人员来对接这个东西,达到语音识别控制的目的,由应用厂家向开发语音控制功能的开发人员提供应用的语音控制词语,实现语音适配。
实际应用中,对一个应用进行语音适配时需要开发人员与应用厂家进行很多控制词语的对接,而且在电视机上存在多个语音应用,开发人员需要针对每一个应用都进行词语对接,工作量大,十分繁琐。
发明内容
为了克服现有技术的不足,本发明提供一种无需开发人员针对每个应用都进行词语对接,简单方便的电视机应用的语音适配方法和装置及语音控制方法。
本发明解决其技术问题所采用的技术方案是:
第一方面,
一种电视机应用的语音适配方法,包括以下步骤:
获取所述应用的页面信息;
根据所述页面信息获取每个页面上功能块的位置坐标和控制所述功能块的语音控制词汇,所述功能块为用户使用所述应用时的点击区域;
将所述语音控制词汇与对应的功能块的位置坐标绑定以实现语音适配。
进一步地,所述获取所述应用的页面信息包括:
录制用户使用遥控器控制所述应用时的视频;
识别所述视频中所述应用包含的页面和每个页面上功能块的功能以及功能块上的文字。
进一步地,所述识别所述视频中所述应用包含的页面和每个页面上功能块的功能以及功能块上的文字包括:
将所述视频拆分为单帧的图片;
将所述图片输入机器学习训练模型中进行识别,以获取所述应用包含的页面和每个页面上功能块的功能以及功能块上的文字,所述机器学习训练模型为基于被批注的图像数据样本训练出的机器学习模型。
进一步地,根据所述页面信息获取每个页面上功能块的位置坐标包括:
根据所述视频获取每个页面的打开顺序;
根据所述打开顺序为所述应用的页面分级并编号,记录每个页面的编号;
在所述电视机的显示屏上建立坐标系;记录每个页面上功能块的坐标数据;
将每个页面的编号和所述页面上功能块的坐标数据结合作为每个页面上功能块的位置坐标。
进一步地,根据所述页面信息获取控制所述功能块的语音控制词汇包括:
提取所述功能块上的文字;
将所述文字转化为语音词汇;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州欢网科技有限责任公司,未经广州欢网科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010107557.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基坑减压井的封闭施工方法
- 下一篇:一种陶瓷砖镜面抛光设备的进料装置