[发明专利]人工智能通信系统及通信方法在审
申请号: | 202010145739.7 | 申请日: | 2020-03-05 |
公开(公告)号: | CN111199747A | 公开(公告)日: | 2020-05-26 |
发明(设计)人: | 连芷萱;杨嘉琪;张瑜佳;马志;席跃东;席跃君;李敏;宋蔚旗 | 申请(专利权)人: | 北京花兰德科技咨询服务有限公司 |
主分类号: | G10L19/16 | 分类号: | G10L19/16;G10L19/008;G10L15/26;H04L1/00 |
代理公司: | 北京春江专利商标代理事务所(普通合伙) 11835 | 代理人: | 曹洁 |
地址: | 102200 北京市昌平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人工智能 通信 系统 方法 | ||
1.一种人工智能通信系统,其包括发信设备和接收设备,所述发信设备至少包括信源编码器,其特征在于,信源编码器至少包括语音识别模块和编码模块,所述语音识别模块将待发送的语音数据或音频波形生成文本单元串,编码模块用于对文本单元串和中的每个文本单元进行编码生成待发送的字符串;接收设备包括AI模块和存储模块,存储模块至少包括语料库和多种语声模型, AI模块根据接收信息的用户的选择或对接收信息的用户所使用语言的识别从存储模块中选择接收信息的用户选择的语声模型或选择所识别的接收信息的用户使用的所语言的语声模型,从语料库中查找对应接收的字符串的语声单元生成语声单元串,并根据所选择的语声模型将语声单元串生成正常语序的语音和/或文本。
2.根据权利要求1所述的人工智能通信系统,其特征在于, 信源编码器包括变换模块,语音识别模块至少包括卷积神经网络, 变换模块将待发送的语音数据或音频波形生成时间-频率-强度3D谱图;卷积神经网络包括多个卷积层,其根据3D谱图中的时间-频率2D谱图,将待发送的语音数据或音频波形分成多个词形成文本单元串。
3.根据权利要求1-2任一所述的人工智能通信系统,其特征在于, 编码模块用于对文本单元串中的每个文本单元进行编码生成待发送的字符串具体包括:先将文本单元串中的每个文本单元编码成非二进制的码串,而后将每个非二进制的码转换成二进制字符串。
4.根据权利要求1-3任一所述的人工智能通信系统,其特征在于,从语料库中查找对应接收的字符串的语声单元生成语声单元串具体包括:先将二进制字符串转换为多组非二进制的码,而后根据每组非二进制码从语料库中查找。
5.根据权利要求1-4所述的人工智能通信系统,其特征在于,所述非二进制码为2的N次方码,所述N大于或者等于2。
6.根据权利要求2-5任一所述的人工智能通信系统,其特征在于,语音识别模块被配置为根据语音数据或音频波形的至少一个采样段训练卷积神经网络每个通道的权重。
7.根据权利要求1-6任一所述的人工智能通信系统,其特征在于,所述语声单元包括对应语声单元的字或词及其语音数据和/或音响特征值,音响特征值至少包括音调值和响度值;所述文本单元包括字和词。
8.根据权利要求7任一所述的人工智能通信系统,其特征在于,语声模型包括下列模型的一种或几种:声学模型、语言模型。
9.一种人工智能通信方法,其特征在于,发送端的信源编码器至少包括语音识别模块和编码模块,利用所述语音识别模块将待发送的语音数据或音频波形生在文本单元串,利用编码模块对文本单元串中的每个文本单元进行编码生成待发送的二进制字符串;接收端根据接收信息的用户的选择或对接收信息的用户语音的识别从存储模块中选择接收信息的用户选择的语声模型或选择所识别的接收信息的用户所使用的语音的语声模型,从语料库中查找对应接收的二进制字符串语声单元生成语声单元串,并根据所选择的语声模型将语声单元串生成正常语序的语音和/或文本。
10.根据权利要求9所述的人工智能通信方法,编码模块用于对文本单元串中的每个文本单元进行编码生成待发送的二进制字符串具体包括:先将文本单元串中的每个词编码成非二进制的码串,而后将每个非二进制的码转换成二进制字符串;从语料库中查找对应接收的二进制字符串的语声单元生成语声单元串具体包括:先将二进制字符串转换为多组非二进制的码,而后根据每组非二进制码从语料库中查找。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京花兰德科技咨询服务有限公司,未经北京花兰德科技咨询服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010145739.7/1.html,转载请声明来源钻瓜专利网。