[发明专利]一种基于语义分析的情绪识别方法和设备在审
申请号: | 202010443389.2 | 申请日: | 2020-05-22 |
公开(公告)号: | CN111627462A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 龙艳花;苏春雨;黄盼 | 申请(专利权)人: | 云知声(上海)智能科技有限公司;上海师范大学 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G06F40/30;G06F40/216;G10L15/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 分析 情绪 识别 方法 设备 | ||
本发明提出了一种基于语义分析的情绪识别方法和设备,该方法包括:获取待测语音,并提取所述待测语音中的声学特征;当基于所述声学特征判定所述待测语音为疑似异常语音时,将所述疑似异常语音转换为文本;基于预设的深度学习监督二分类异构神经网络模型对所述文本进行分析,以识别出所述疑似异常语音数据中的异常情绪语音数据与非异常情绪语音数据。本方案通过综合音质和内容分析来识别情绪,声学特征和词频分析的结合,使得情绪的识别率相较于目前的技术得到了很大程度的提高。
技术领域
本发明涉及语义识别领域,特别涉及一种基于语义分析的情绪识别方法和设备。
背景技术
众所周知,说话的奇妙之处在于,有时候重要的不是看说了什么,而是要看是怎么说的,不同的说法(例如以不同的语气来说)会使得说话所代表的内容完全不同,拥有四声和平仄的中文尤为如此。对此,听到过客户尖酸刻薄的挖苦之话的客服接线员想必感触最深。
目前市场上存在有对该领域的应用,具体的应用是通过分析人的声音音调来进行分析的,这种技术更偏向注重的是“声学特征”;此外,还存在有英国的初创企业EITechnologies正在研发的一种语音识别技术,该技术可通过音质分析来识别情绪,这种方式同样是偏向注重“声学特征”来进行识别;这种方式对情绪的识别率很低,且经常失效。可见,目前的自动语音系统无法识别这种语气方面的细微差别,这导致各个公司不得不维系大量的人工客服人员来准确获知用户的说话的含义。
由此,目前需要一种情绪的识别率更高的方案。
发明内容
针对现有技术中的缺陷,本发明提出了一种基于语义分析的情绪识别方法和设备,通过综合音质和内容分析来识别情绪,声学特征和词频分析的结合,使得情绪的识别率相较于目前的技术得到了很大程度的提高。
具体的,本发明提出了以下具体的实施例:
本发明实施例提出了一种基于语义分析的情绪识别方法,包括:
获取待测语音,并提取所述待测语音中的声学特征;
当基于所述声学特征判定所述待测语音为疑似异常语音时,将所述疑似异常语音转换为文本;
基于预设的深度学习监督二分类异构神经网络模型对所述文本进行分析,以识别出所述疑似异常语音数据中的异常情绪语音数据与非异常情绪语音数据。
在一个具体的实施例中,所述声学特征包括:短时能量值。
在一个具体的实施例中,所述短时能量值是基于上述公式确定:
其中,为语音在时刻所产生的短时能量的均值;X[m]为数字语音序列,W[m]为汉明窗序列。
在一个具体的实施例中,基于所述声学特征判定所述待测语音为疑似异常语音,包括:将所述待测语音中短时能量值经过句子级别的规整之后,与预设的阈值进行比较;
若经过规整后的所述短时能量值大于所述阈值,则判定所述待测语音数据为疑似异常语音数据。
在一个具体的实施例中,若经过规整后的所述短时能量值不大于所述阈值,则判定所述待测语音数据为非异常情绪语音数据。
在一个具体的实施例中,所述基于预设的深度学习监督二分类异构神经网络模型对所述文本进行分析,以识别出所述疑似异常语音数据中的异常情绪语音数据与非异常情绪语音数据,包括:
将所述文本与预设情绪文本数据库中的文本进行比对,以生成文本序列特征;
将所述文本序列特征与所述文本对应的待测语音进行结合,以生成复杂特征序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声(上海)智能科技有限公司;上海师范大学,未经云知声(上海)智能科技有限公司;上海师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010443389.2/2.html,转载请声明来源钻瓜专利网。