[发明专利]多音字消歧方法、装置、设备及存储介质在审
申请号: | 202211394521.0 | 申请日: | 2022-11-08 |
公开(公告)号: | CN116266266A | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 高羽;熊一瑾;叶建成 | 申请(专利权)人: | 美的集团(上海)有限公司;美的集团股份有限公司 |
主分类号: | G06F40/232 | 分类号: | G06F40/232;G06F40/126;G06F18/241;G06F18/214 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 袁雪 |
地址: | 201799 上海市青*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多音字 方法 装置 设备 存储 介质 | ||
1.一种多音字消歧方法,其特征在于,所述多音字消歧方法包括:
对待识别文本序列进行转换,得到嵌入向量;
利用预设编码器对所述嵌入向量进行编码,得到编码向量;
根据所述编码向量生成多音字编码向量;
利用分类器对所述多音字编码向量进行分类,得到多音字分类结果,所述分类器为预先基于字符权重和字音权重加权后的损失函数训练得到的。
2.如权利要求1所述的多音字消歧方法,其特征在于,所述方法还包括:
根据样本多音字编码向量对应的字符计算字符权重,并根据所述样本多音字编码向量对应的字音计算字音权重;
根据所述字符权重和所述字音权重对初始损失函数进行加权,得到目标损失函数;
根据所述样本多音字编码向量使用所述目标损失函数进行训练,得到所述分类器。
3.如权利要求2所述的多音字消歧方法,其特征在于,所述根据样本多音字编码向量对应的字符计算字符权重,包括:
获取总发音数,根据样本多音字编码向量对应的字符确定字符类别样本数的倒数在相应维度上的第一占比,根据所述总发音数与所述第一占比计算字符权重;
或,
获取总字符数,根据样本多音字编码向量对应的字符确定字符类别样本数的倒数在相应维度上的第一占比,根据所述总字符数与所述第一占比计算字符权重;
或,
获取总发音数,根据样本多音字编码向量对应的字符确定字符类别频率的倒数在相应维度上的第二占比,根据所述总发音数与所述第二占比计算字符权重;
或,
获取总字符数,根据样本多音字编码向量对应的字符确定字符类别频率的倒数在相应维度上的第二占比,根据所述总字符数与所述第二占比计算字符权重。
4.如权利要求2所述的多音字消歧方法,其特征在于,所述根据所述样本多音字编码向量对应的字音计算字音权重,包括:
根据所述样本多音字编码向量对应的字符确定字符类别总发音数,根据所述样本多音字编码向量对应的字音确定字音类别样本数的倒数在相应维度上的第三占比,根据所述字符类别总发音数与所述第三占比计算字音权重;
或,
根据所述样本多音字编码向量对应的字符确定字符类别总发音数,根据所述样本多音字编码向量对应的字音确定字音类别频率的倒数在相应维度上的第四占比,根据所述字符类别总发音数与所述第四占比计算字音权重。
5.如权利要求1-4中任一项所述的多音字消歧方法,其特征在于,所述根据所述编码向量生成多音字编码向量,包括:
从所述编码向量中按照多音文字和/或多音文字上下文提取对应的多音字编码向量。
6.如权利要求1-4中任一项所述的多音字消歧方法,其特征在于,所述根据所述编码向量生成多音字编码向量,包括:
利用多音字嵌入层生成多音文字对应的初始嵌入向量;
从所述嵌入向量中按照多音文字提取对应的目标嵌入向量;
从所述编码向量中按照多音文字提取对应的目标编码向量;
对所述初始嵌入向量、所述目标嵌入向量以及所述目标编码向量进行拼接,得到多音字编码向量。
7.如权利要求1所述的多音字消歧方法,其特征在于,所述方法还包括:
固定预设编码器中预训练模型生成的模型参数;
对样本文本序列进行转换,得到样本嵌入向量;
利用所述预设编码器对所述样本嵌入向量进行编码,得到样本编码向量;
根据所述样本编码向量生成样本多音字编码向量;
将所述样本多音字编码向量输入至初始分类器;
使用基于字符权重和字音权重加权后的损失函数,继续训练未固定的模型参数,输出训练好的分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于美的集团(上海)有限公司;美的集团股份有限公司,未经美的集团(上海)有限公司;美的集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211394521.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:具有写辅助的存储器电路和方法
- 下一篇:使用Δ-∑调制器的电压调节装置和方法