[发明专利]一种基于音素联想及深度学习的语义理解方法及装置在审

专利信息
申请号: 202010919954.8 申请日: 2020-09-03
公开(公告)号: CN112183106A 公开(公告)日: 2021-01-05
发明(设计)人: 赖文波;林康;谭则涛;方伟 申请(专利权)人: 广发证券股份有限公司
主分类号: G06F40/30 分类号: G06F40/30;G06F40/289;G06F16/35;G06N3/04;G06N3/08;G10L15/02;G10L15/26;G10L15/18
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 陈旭红;吴落
地址: 510663 广东省广州市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 音素 联想 深度 学习 语义 理解 方法 装置
【权利要求书】:

1.一种基于音素联想及深度学习的语义理解方法,其特征在于,包括:

通过ASR模型将获取的语音转化为文本;

对文本进行分词后依次输入至word2vec模型和bi-lstm模型,并输出文本的语素理解向量;

获取文本音素联想的特征三元组,包括:对分词后的单词音素进行识别和分离,并添加音素联想关键词,得到关键词音素特征;对文本进行句子音素的识别与分离得到原音素特征;及获取句子音素识别与分离后的正则音素特征;将关键词音素特征、原音素特征和正则音素特征进行组合;

将特征三元组输入至text-cnn卷积神经网络进行音素联想理解,并卷积提取局部组合特征,输出音素联想向量;

对语素理解向量和音素联想向量进行加权,并将加权后的结果与正则音素特征组合得到联合向量,将联合向量输入分类器进行语音的语义理解和分类。

2.根据权利要求1所述的基于音素联想及深度学习的语义理解方法,其特征在于,所述对分词后的单词音素进行识别和分离,包括:

通过pinyin工具包将文本转化成拼音;

当所述拼音属于整音节时,设置声母为NA,韵母为整音节;

当所述拼音不属于整音节且以双声母开头开头时,设置声母为双声母,剩余音素为韵母;

当所述拼音不为整音节且不以双声母开头时,设置声母为单声母,剩余音素为韵母;

识别声母和韵母,用符号分隔所述声母和韵母,得到音素识别与分离结果。

3.根据权利要求2所述的基于音素联想及深度学习的语义理解方法,其特征在于,所述对分词后的单词音素进行识别和分离后,还包括:

导入关键词库,将所述音素识别与分离结果与所述关键词逐字对比;

判断每个字是否有同声母或韵母,且同时具有多个结果;若是,在最贴近的结果对应的词组后面添加关键词联想标识;若否,对所述分离结果不作处理。

4.根据权利要求1所述的基于音素联想及深度学习的语义理解方法,其特征在于,所述及获取句子音素识别与分离后的正则音素特征,包括:

获取句子音素识别与分离后的结果及原正则库,所述原正则库为系统默认的正则库;

将原正则库转化为音素部分匹配正则库,并对音素正则库中多条正则进行编号;

根据音素正则库对所述结果进行音素正则匹配,并根据命中的正则编号所对应的语义生成独热特征,以作为正则音素特征。

5.根据权利要求4所述的基于音素联想及深度学习的语义理解方法,其特征在于,所述将原正则库转化为音素部分匹配正则库,包括:

判断原正则中每个字符的属性和结构,并对应进行音素正则处理,并将处理结果整合后得到音素正则库,所述正则处理包括:

当字符为词组中文字符时,将词组中符合声母或韵母部分匹配的正则添加到音素正则新字符串中;当字符为单个中文字符时,将字符的音素分离结果添加到音素正则新字符串中;当字符不是中文时,将字符直接添加到音素正则新字符串中。

6.根据权利要求1所述的基于音素联想及深度学习的语义理解方法,其特征在于,所述对文本进行分词后依次输入至word2vec模型和bi-lstm模型,并输出文本的语素理解向量,包括:

将文本输入至word2vec模型得到文本对应的字向量,并进行字向量embedding;

将所述embedding后的字向量输入至bi-lstm模型进行语义理解;将理解后的结果输入至自注意力模型,得到文本的句向量,以作为文本的语素理解向量。

7.根据权利要求1所述的基于音素联想及深度学习的语义理解方法,其特征在于,所述将获取的语音转化为文本,还包括采用神经网络算法和CTC算法进行语音转换;所述对文本进行分词包括通过python中jieba分词模块进行文本分词;所述对语素理解向量和音素联想向量进行加权采用attention技术。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广发证券股份有限公司,未经广发证券股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010919954.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top