[发明专利]用户情绪识别的方法和系统有效
申请号: | 202110677222.7 | 申请日: | 2021-06-18 |
公开(公告)号: | CN113506586B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 高鹏;郝少春;袁兰;吴飞;周伟华;高峰;潘晶 | 申请(专利权)人: | 杭州摸象大数据科技有限公司 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/24;G10L15/26;G10L25/30 |
代理公司: | 杭州创智卓英知识产权代理事务所(普通合伙) 33324 | 代理人: | 张超 |
地址: | 310000 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 情绪 识别 方法 系统 | ||
本申请涉及一种用户情绪识别的方法和系统,该用户情绪识别的方法包括:获取语音数据,并根据语音数据,提取语音特征;对语音数据进行转化处理,得到文本数据,并根据文本数据,提取文本特征;输入语音特征和文本特征至用户情绪识别模型中,输出用户的情绪标签,其中,在用户情绪识别模型中:使用卷积神经网络表征语音特征,得到第一特征,使用长短时记忆网络表征第一特征,得到第二特征,使用卷积神经网络表征文本特征,得到第三特征,使用长短时记忆网络表征第三特征,得到第四特征,将第二特征和第四特征进行全连接,确定用户的情绪标签,通过本申请,解决了相关技术中用户情绪识别的准确度不高的问题,有利于提高用户情绪识别的准确度。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种用户情绪识别的方法和系统。
背景技术
随着人工智能技术的发展,智能语音机器人在产业上已经逐渐成熟,越来越多的企业开始关注并使用。
智能语音机器人与用户在交互过程中会产生语音数据,通过对这些语音数据进行情绪识别,可以获得用户在沟通过程中的情绪信息;在相关技术中,用户情绪是根据获取到的语音数据,单独从语音数据的角度进行识别,或者,根据语音数据转化成的文本数据,单独从文本数据的角度进行识别,用户情绪识别的准确度不高。
针对相关技术中用户情绪识别的准确度不高的问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种用户情绪识别的方法和系统,有利于提高用户情绪识别的准确度。
第一方面,本申请实施例提供了一种用户情绪识别的方法,所述方法包括:
获取语音数据,并根据所述语音数据,提取语音特征,其中,所述语音特征包括梅尔倒谱系数特征;
对所述语音数据进行转化处理,得到文本数据,并根据所述文本数据,提取文本特征,其中,所述文本特征包括字词特征和位置特征;
输入所述语音特征和所述文本特征至用户情绪识别模型中,输出所述用户的情绪标签,其中,在所述用户情绪识别模型中:
使用卷积神经网络表征所述语音特征,得到第一特征,使用长短时记忆网络表征所述第一特征,得到第二特征,
使用卷积神经网络表征所述文本特征,得到第三特征,使用长短时记忆网络表征所述第三特征,得到第四特征,
将所述第二特征和所述第四特征进行全连接,确定所述用户的情绪标签。
在其中一些实施例中,所述语音特征还包括音高特征、语调特征和语速特征,所述语音特征的提取过程包括:
根据所述语音数据的波形,确定所述波形的峰值、频率和周期;
根据所述峰值、所述频率和所述周期,一一对应确定所述语音数据的所述音高特征、所述语调特征和所述语速特征;
用Embedding表示所述音高特征、所述语调特征和所述语速特征。
在其中一些实施例中,所述文本特征还包括发音特征,所述文本特征的提取过程包括:
确定所述文本数据中的每个字在所述文本数据中的发音,得到所述发音特征,其中,所述发音包括拼音、音调、声母或韵母;
用Embedding表示所述发音特征。
在其中一些实施例中,所述提取所述文本特征之前,所述方法包括:对所述文本数据纠错,其中,所述纠错的过程包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州摸象大数据科技有限公司,未经杭州摸象大数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110677222.7/2.html,转载请声明来源钻瓜专利网。