[发明专利]语音交互相关系统、方法、装置及设备在审
申请号: | 202010628897.8 | 申请日: | 2020-07-02 |
公开(公告)号: | CN113889117A | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 曹涌;聂再清;周晓欢;王鹏伟;谢静辉 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L15/30 | 分类号: | G10L15/30;G10L15/08;G10L25/51 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 钱秀茹 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 交互 相关 系统 方法 装置 设备 | ||
1.一种多媒体节目点播系统,其特征在于,包括:
智能音箱,用于采集多媒体节目点播语音数据,将所述语音数据发送至服务端;根据服务端的多媒体节目播放处理结果,播放多媒体节目;
服务端,用于构建多媒体节目知识库;通过语音实体识别模型和所述知识库,确定所述语音数据中的多媒体节目信息;根据所述多媒体节目信息,执行多媒体节目播放处理。
2.一种点餐系统,其特征在于,包括:
点餐设备,用于采集点餐语音数据,将所述语音数据发送至服务端;
服务端,用于构建餐品知识库;通过语音实体识别模型和所述知识库,确定所述语音数据中的餐品信息;根据所述餐品信息,执行备餐处理。
3.一种通讯连接建立系统,其特征在于,包括:
用户设备,用于采集通讯指令语音数据,将所述语音数据发送至服务端;
服务端,用于构建通讯用户知识库;通过语音实体识别模型和所述知识库,确定所述语音数据中的通讯用户信息;根据所述通讯用户信息,执行通讯连接建立处理。
4.一种语音交互系统,其特征在于,包括:
终端设备,用于采集语音数据,将所述语音数据发送至服务端;
服务端,用于构建实体知识库;通过语音实体识别模型和所述实体知识库,确定所述语音数据中的实体信息;根据所述实体信息,执行语音交互处理。
5.一种语音交互方法,其特征在于,包括:
构建实体知识库;
通过语音实体识别模型和所述实体知识库,确定目标语音数据中的实体信息;
根据所述实体信息,执行语音交互处理。
6.根据权利要求5所述的方法,其特征在于,
所述通过语音实体识别模型和所述实体知识库,确定目标语音数据中的实体信息,包括:
通过所述语音实体识别模型包括的音频编码模型,确定所述语音数据的音频特征数据;
通过所述语音实体识别模型包括的实体解码模型和所述实体知识库,根据所述音频特征数据,确定所述实体信息。
7.根据权利要求6所述的方法,其特征在于,
所述通过所述语音实体识别模型包括的实体解码模型和所述实体知识库,根据所述音频特征数据,确定所述实体信息,包括:
通过所述实体解码模型包括的实体候选发音确定模块,根据所述音频特征数据,确定所述实体信息的至少一个候选发音;
通过所述实体解码模型包括的实体发音确定模块,根据所述实体知识库,从所述至少一个候选发音中,确定所述实体信息的发音;
根据所述实体信息的发音,确定所述实体信息。
8.根据权利要求7所述的方法,其特征在于,
所述根据所述实体知识库,从所述至少一个候选发音中,确定所述实体信息的发音,包括:
确定所述实体知识库中的实体的发音与所述候选发音的相似度;
根据所述相似度,确定所述实体信息的发音。
9.根据权利要求7所述的方法,其特征在于,
所述实体知识库包括:多媒体节目点播领域的节目实体知识库;
所述节目实体知识库包括:同音不同字的节目相关实体,用户实体,节目相关实体与用户实体间的实体关系;
所述构建实体知识库,包括:
根据用户历史播放信息,确定所述用户实体,并构建所述实体关系;
所述根据所述实体信息的发音,确定所述实体信息,包括:
根据所述实体信息的发音,确定候选实体;
根据用户信息和所述实体关系,从所述候选实体中确定所述实体信息。
10.根据权利要求7所述的方法,其特征在于,还包括:
从训练数据中学习得到所述语音实体识别模型;
其中,所述训练数据包括:音频数据和实体标注信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010628897.8/1.html,转载请声明来源钻瓜专利网。