[发明专利]一种语义识别方法、装置及设备在审
申请号: | 202010232031.5 | 申请日: | 2020-03-27 |
公开(公告)号: | CN111428512A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 王夏鸣 | 申请(专利权)人: | 大众问问(北京)信息科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/279;G06F40/216;G10L15/22 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100098 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语义 识别 方法 装置 设备 | ||
1.一种语义识别方法,其特征在于,包括:
客户端根据用户输入的目标语音指令,获取所述用户的目标身份标识以及与所述目标语音指令匹配的目标场景信息;
所述客户端在与所述目标身份标识匹配的至少一个场景语义识别模型中,确定与所述目标场景信息匹配的目标场景语义识别模型;
所述客户端根据所述目标场景语义识别模型,对所述目标语音指令进行识别处理。
2.根据权利要求1所述的方法,其特征在于,在客户端根据用户输入的目标语音指令,获取所述用户的目标身份标识以及与所述目标语音指令匹配的目标场景信息之前,还包括:
所述客户端实时收集至少一个用户输入的历史语音指令、用户的身份标识,以及与历史语音指令匹配的历史场景信息作为训练数据;
将所述训练数据实时上传至服务器,以使所述服务器根据所述训练数据生成与各所述身份标识分别对应的至少一个场景语义识别模型;
接收所述服务器下发的与各所述身份标识分别对应的至少一个场景语义识别模型。
3.根据权利要求2所述的方法,其特征在于,在所述客户端根据所述目标场景语义识别模型,对所述目标语音指令进行识别处理之后,还包括:
所述客户端将所述用户的目标语音指令、所述目标身份标识以及所述目标场景信息上传至所述服务器,以使所述服务器对与所述目标身份标识匹配的至少一个场景语义识别模型进行更新。
4.根据权利要求1-3任一项所述的方法,其特征在于,还包括:
所述客户端在检测到目标用户的首次登陆客户端时,引导所述目标用户进行声纹注册,并将所述目标用户的声纹信息与所述目标用户的身份标识对应存储;
其中,所述声纹信息用于对输入语音指令的用户进行身份标识的识别。
5.一种语义识别方法,其特征在于,包括:
服务器实时获取目标客户端发送的训练数据,并根据所述训练数据中包括的身份标识对各所述训练数据进行分组;
所述服务器在确定与目标身份标识对应的目标分组满足模型生成条件时,根据目标分组中各训练数据中包括的历史场景信息和历史语音指令,计算至少一个场景维度下的语义特征;
所述服务器根据各场景维度下的语义特征,确定至少一个场景语义识别模型,并将与所述目标身份标识对应的场景语义识别模型下发至目标客户端。
6.根据权利要求5所述的方法,其特征在于,所述服务器在确定与目标身份标识对应的目标分组满足模型生成条件时,根据目标分组中各训练数据中包括的历史场景信息和历史语音指令,计算至少一个场景维度下的语义特征,包括:
当所述服务器确定所述目标分组中的训练数据达到设定阈值时,将所述历史场景信息中的时间信息划分为设定数量的时间段,并统计各时间段中的历史语音指令对应的语义类别及各语义类别的出现次数,获取时间维度上的第一语义特征集合;
将所述历史场景信息中的位置信息划分为设定数量的区域,统计各区域中的历史语音指令对应的语义类别及各语义类别的出现次数,获取空间维度上的第二语义特征集合;
将所述各时间段与所述各区域进行两两组合,获取在设定时间段和设定区域中的历史语音指令对应的语义类别及各语义类别的出现次数,获取第三语义特征集合;
其中,所述第一语义特征集合、第二语义特征集合和第三语义特征集合均由至少一个语义特征构成,所述语义特征由设定数量的语义类别构成。
7.根据权利要求6所述的方法,其特征在于,所述服务器根据各场景维度下的语义特征,确定至少一个场景语义识别模型,并将与所述目标身份标识对应的场景语义识别模型下发至目标客户端,包括:
将所述第一语义特征集合中的第一语义特征与所述第二语义特征集合中第二语义特征进行两两比对,确定二者包含的语义类别是否全部相同;
若是,则将与第一语义特征对应的语义识别模型作为场景语义识别模型下发至目标客户端;
若否,根据设定规则,确定场景语义识别模型,并下发至目标客户端;
其中,所述场景语义模型的应用场景为第一语义特征对应时间段和第二语义特征对应的区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大众问问(北京)信息科技有限公司,未经大众问问(北京)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010232031.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:日志信息采集方法及装置
- 下一篇:全密封防护服