[发明专利]一种多音字读音预测方法、装置及计算机可读存储介质在审

申请号：	202010727658.8	申请日：	2020-07-27
公开（公告）号：	CN111599340A	公开（公告）日：	2020-08-28
发明（设计）人：	司马华鹏;王培雨	申请（专利权）人：	南京硅基智能科技有限公司
主分类号：	G10L13/02	分类号：	G10L13/02;G10L13/08;G06N3/04;G06N3/08
代理公司：	江苏舜点律师事务所 32319	代理人：	孙丹
地址：	210012 江苏省南京市***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种多音字读音预测方法装置计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种多音字读音预测方法，其特征在于，包括以下步骤：

将输入文本导入训练的多音字预测模型中，获取多音字在输入文本中的读音；

将输入文本进行单音字读音标注，获取单音字读音；

将单音字读音和多音字读音按照文本顺序进行组合，输出整个文本读音；其中，

多音字预测模型的训练包括以下步骤：

输入包含多音字的训练文本，标注对应的正确读音，输出训练文本对应的数据文本；将数据文本输入到预训练语言模型，获取数据的向量表示；将向量输入深度学习模型进行批量迭代训练，获得多音字预测模型；

标注对应的正确读音包括将训练文本中的多音字按照正确读音标注，单音字用符号标注；

深度学习模型包括有循环与输入向量进行卷积操作，获得多音字所在位置上下文分别进行卷积操作得到的两个向量，将这两个向量进行拼接后输入GRU网络中进行重置和更新，将GRU网络输出向量进行随机失活，输出多维向量，将输出的多维向量转换为一维向量，通过函数将一维向量各个元素映射到各个读音对应的概率，输出概率最大的读音。

2.根据权利要求1的一种多音字读音预测方法，其特征在于：所述预训练模型为Word2vec或bert模型。

3.根据权利要求2的一种多音字读音预测方法，其特征在于：多音字预测模型的训练包括在每次迭代时采用随机梯度下降算法训练模型，采用交叉熵损失函数评价模型拟合的程度。

4.一种多音字读音预测装置，其特征在于，包括：

多音字预测模块，用于将输入文本导入训练的多音字预测模型中，获取多音字在输入文本中的读音；

单音字读音标注模块，用于将输入文本进行单音字读音标注，获取单音字读音；

读音组合模块，用于将单音字读音和多音字读音按照文本顺序进行组合，输出整个文本读音；

多音字预测模块包括：

输入层，用于输入包含多音字的训练文本，标注对应的正确读音，输出训练文本对应的数据文本；

预训练层，用于将数据文本输入到预训练语言模型，获取数据的向量表示；

卷积层，用于循环与预训练层输出向量进行卷积操作，获得多音字所在位置上下文分别进行卷积操作得到的两个向量；

拼接层，用于将卷积层输出的两个向量进行拼接；

GRU网络层，用于有选择地对拼接层输出的向量进行重置和更新；